Logo Utrecht University

Digital Humanities Lab

News and interviews

DHLab bouwt I-analyzer online text and datamining tool.

Tekst en data mining (TDM) maakt het eenvoudiger om grote hoeveelheden online beschikbare data te onderzoeken en onderlinge verbanden vast te stellen. Met TDM is het bijvoorbeeld mogelijk systematisch onderzoek te doen naar bijvoorbeeld de inhoud van grote hoeveelheden kranten.

Online oplossingen zoals Voyant bieden vaak beperkte functionaliteit. Offline applicaties zoals SPSS modeler van IBM, hebben vaak een steile leercurve.

Het Digital Humanities Lab bouwt nu aan een online tekst  en datamining applicatie, die online beschikbaarheid en gebruiksgemak combineert met flexibiliteit. De applicatie biedt voor onderzoekers de mogelijkheid om hun eigen corpus- en/of dataset snel te kunnen aanhaken. Er zijn al geslaagde experimenten uitgevoerd met grote reeksen jaarverslagen van financiële instellingen en een paar honderd jaargangen van de Engelse krant the Times en het meest recent met een collectie epigrafieën.

Copyright
De applicatie biedt, omdat deze de mogelijkheid geeft om online maar afgeschermd gebruikt te worden, een oplossing voor copyright claims van bijvoorbeeld uitgevers. Toegang tot de bestanden van the Times bijvoorbeeld, zal mogelijk zijn voor alle onderzoekers van binnen de universiteit.