Logo Utrecht University

Digital Humanities Lab

Portfolio

I-analyzer staat online! Corpus toevoegen? Neem contact op met het DHLab.

Tekst en data mining (TDM) maakt het eenvoudiger om grote hoeveelheden online beschikbare data te onderzoeken en onderlinge verbanden vast te stellen. Met TDM is het bijvoorbeeld mogelijk systematisch onderzoek te doen naar bijvoorbeeld de inhoud van grote hoeveelheden kranten.

Online oplossingen zoals Voyant bieden vaak beperkte functionaliteit, in Voyant kan men bijvoorbeeld online geen groot corpus inladen. Offline applicaties zoals SPSS modeler van IBM, hebben vaak een steile leercurve.

Het Digital Humanities Lab heeft nu een online tekst  en datamining applicatie gelanceerd, die online beschikbaarheid en gebruiksgemak combineert met flexibiliteit. De applicatie biedt voor onderzoekers de mogelijkheid om hun eigen corpus- en/of dataset snel te kunnen aanhaken. Er zijn al geslaagde experimenten uitgevoerd met grote reeksen jaarverslagen van financiële instellingen en een paar honderd jaargangen van de Engelse krant the Times en  met een collectie Hebreeuwse epigrafieën. Momenteel worden de KB krantenset, de Troonredes en een grote set Spectatoriale tijdschriften aan I-analyzer toegevoegd.

Copyright
De applicatie biedt, omdat deze de mogelijkheid geeft om online maar afgeschermd gebruikt te worden, een oplossing voor copyright claims van bijvoorbeeld uitgevers. Toegang tot de bestanden van The Times bijvoorbeeld, zal mogelijk zijn voor alle onderzoekers van binnen de universiteit.
Opdrachtgever: I-Lab

Eigen corpus toevoegen aan online textmining tool? Neem contact op met het DHLab