vrijdag 26 augustus 2011

Meerssen in het UK Webarchive

Met een N-gram-viewer kun je de frequentie van woorden en zinsnedes in een corpus onderzoeken en visualiseren. Ik schreef begin dit jaar al over de N-gram-viewer van Google.
Sinds een paar dagen kun je in het UK Webarchive van de British Library ook zoeken via een N-gram-viewer. In de grafiek hierboven zie je hoe vaak "Meerssen" voorkomt in het Engelse webarchief. Vaker dan ik dacht, eigenlijk.
Het mooie is ook (en dat ontbrak volgens mij bij de GoogleBooks-versie) dat je kunt klikken op de waardes en dan meteen een overzicht krijgt van de relevante pagina's. Dit zijn de pagina's uit oktober 2010 waar Meerssen in voorkomt. (En door het UK Webarchive weet ik nu dus dat Meerssen een "zustergemeente" is van Sherborne.)
Verder werd Meerssen genoemd in een rapport van de Conservatieven over afvalverzameling. (Omdat wij hier verplicht zijn om gemeentelijke roze vuilniszakken te gebruiken in plaats van de standaard grijze zakken...)
En nog een ego-mededeling, ik word ook genoemd!

Hoe dan ook, dit zijn mooie dingen voor taal- en cultuuronderzoekers.
Het wordt toch tijd dat de KB zijn collectie websites gewoon open kan gooien, zodat dit soort dingen ook met het Nederlandse web mogelijk worden.

Gerelateerd
Cultuurgeschiedenis en taalontwikkeling
Websites archiveren of websites verzamelen?

Geen opmerkingen:

Een reactie posten