Woordfrequenties

In de VS hebben nu zowel de Democraten als de Republikeinen hun conventie achter de rug. De New York Times onderzocht de toespraken die op beide conventies gehouden werden, en telde een aantal politiek relevante woorden en termen. Het resultaat zie je op de figuur hieronder, grotere versie hier beschikbaar. Het lijkt me interessant om dat in de toekomst ook eens te doen met toespraken van Vlaamse partijvoorzitters op partijcongressen. Kent iemand software waarmee dat eenvoudig te realiseren is?



Reacties

#1417

Steven

 

Als je de teksten digitaal hebt kan dat niet moeilijk zijn. Zeker niet op een Unix/Linux systeem dat boordevol programmatjes zit om tekst te verwerken. Na m'n tweede zit wil ik wel eens een scriptje schrijven dat de websites van de Vlaamse partijen afloopt en zoekt wat de meest voorkomende woorden zijn. Met lynx sed grep en wc moet dat zeker lukken.

#1423

Steven

 

Maar als je toch in websites zoekt is het natuurlijk veel makkelijker om Google te gebruiken...

#1440

haedesch

 

het programmeren zal een fluitje van een cent zijn, de input verzamelen daarentegen :-s

#1448

bvo

 

Indien de input een probleem is, kun je het bijvoorbeeld eens proberen met de beleidsverklaringen van de huidige en vorige Vlaamse regering. Ook de verschillende partijprogramma's vormen een optie. Al deze gegevens zouden vrij verkrijgbaar moeten zijn op het web.

#1453

haedesch

 

Nog niet aan gedacht... eigenlijk zou dat wel eens een leuk projectje kunnen zijn :-)