Logo Utrecht University

Digital Humanities Lab

News and interviews

DH Lab ontwikkelt universele online applicatie voor tekst en data mining

© iStockphoto.com/faithiecannoiseSteeds meer vakgebieden maken gebruik van tekst- en datamining technieken. Het Digital Humanities Lab bouwt aan een nieuwe online TDM-applicatie die gemakkelijker in gebruik is dan andere applicaties en meer flexibel.

 

Tekst en data mining
Tekst en data mining (TDM) maakt het eenvoudiger om grote hoeveelheden online beschikbare data te onderzoeken en onderlinge verbanden vast te stellen. Met TDM is het bijvoorbeeld mogelijk systematisch onderzoek te doen naar bijvoorbeeld de inhoud van grote hoeveelheden kranten.

Online oplossingen zoals Voyant bieden vaak beperkte functionaliteit. Offline applicaties zoals SPSS modeler van IBM, hebben vaak een steile leercurve.

Het Digital Humanities Lab bouwt nu aan een online tekst  en datamining applicatie, die online beschikbaarheid en gebruiksgemak combineert met flexibiliteit. De applicatie biedt voor onderzoekers de mogelijkheid om hun eigen corpus- en/of dataset snel te kunnen aanhaken. Er zijn al geslaagde experimenten uitgevoerd met grote reeksen jaarverslagen van financiële instellingen en een paar honderd jaargangen van de Engelse krant the Times.

Copyright
De applicatie biedt, omdat deze de mogelijkheid geeft om online maar afgeschermd gebruikt te worden, een oplossing voor copyright claims van bijvoorbeeld uitgevers. Toegang tot de bestanden van the Times bijvoorbeeld, zal mogelijk zijn voor onderzoekers van binnen de universiteit.