Woordfrequenties
In de VS hebben nu zowel de Democraten als de Republikeinen hun conventie achter de rug. De New York Times onderzocht de toespraken die op beide conventies gehouden werden, en telde een aantal politiek relevante woorden en termen. Het resultaat zie je op de figuur hieronder, grotere versie hier beschikbaar. Het lijkt me interessant om dat in de toekomst ook eens te doen met toespraken van Vlaamse partijvoorzitters op partijcongressen. Kent iemand software waarmee dat eenvoudig te realiseren is?
Reacties
Steven
zaterdag, 4 september, 2004 - 14:40Als je de teksten digitaal hebt kan dat niet moeilijk zijn. Zeker niet op een Unix/Linux systeem dat boordevol programmatjes zit om tekst te verwerken. Na m'n tweede zit wil ik wel eens een scriptje schrijven dat de websites van de Vlaamse partijen afloopt en zoekt wat de meest voorkomende woorden zijn. Met lynx sed grep en wc moet dat zeker lukken.
Steven
zaterdag, 4 september, 2004 - 19:23Maar als je toch in websites zoekt is het natuurlijk veel makkelijker om Google te gebruiken...
haedesch
zondag, 5 september, 2004 - 21:28het programmeren zal een fluitje van een cent zijn, de input verzamelen daarentegen :-s
bvo
maandag, 6 september, 2004 - 17:14Indien de input een probleem is, kun je het bijvoorbeeld eens proberen met de beleidsverklaringen van de huidige en vorige Vlaamse regering. Ook de verschillende partijprogramma's vormen een optie. Al deze gegevens zouden vrij verkrijgbaar moeten zijn op het web.
haedesch
dinsdag, 7 september, 2004 - 00:09Nog niet aan gedacht... eigenlijk zou dat wel eens een leuk projectje kunnen zijn :-)