Logo Utrecht University

Digital Humanities Lab

Blog

Text mining deel 2.

Zoals gezegd zien velen in text mining vooral een geavanceerde zoekmachine. Ga graven in bergen tekst en unieke vondsten zullen uw deel worden? Het zou kunnen natuurlijk. Maar dat kan al met Google books. Of met de zoekmachine van de Historische Kranten online van de Koninklijke Bibliotheek.

Eén van de resultaten van de opdracht: "Koningin Juliana in de pers"

Maar voor onderzoek zijn toch de andere text mining functies: automatisch vergelijken, automatisch samenvatten, automatisch categoriseren van teksten en text mining als onderdeel van een complete datamining stroom, interessanter.  Met het automatisch vergelijken zijn velen ook al vertrouwd. Plagiërende studenten hebben tot hun schade kennis gemaakt met pakketten als Ephorus, die hetgeen ze inleveren vergelijken met bestaande teksten.  Misschien maakte Jos Joosten er gebruik van om Elsbeth Etty te betrappen op het plagiëren van zowel Wikipedia als Susanne Jansen en Nel van Dijk

 

You must be logged in to post a comment.