L'idée de ce blog "
Les mots de l'actualité" provient de l'article
les mots qui ont fait l'actualité en 2008 (qui a d'ailleurs été déplacé dans ce nouveau blog/forum).
Il s'agit cette fois de publier un article
chaque mois, donnant le résumé des
mots les plus cités dans l'actualité (suivant le même processus qui permet de construire les "
nuages de tags", affichés sur les pages "actualités" de chaque catégorie et sur la page d'accueil), dans
chaque catégorie, plus un résumé
toutes catégories confondues.
En plus des premiers mots à chaque fois (5, 6 ou 7 pour chaque catégorie, 10 pour le "toutes catégories"), un nuage de tags complet (sous forme d'image) sera fourni à chaque fois.
Une
courte analyse sera également proposée en début de message (mais la plupart du temps les images parlent d'elles-mêmes...).
Notes :
- Le forum est accessible par la page Blog ou directement à cette adresse : Les mots de l'actualité.
- Les premiers mots sont affichés textuellement en respectant le code couleur de chaque catégorie (rouge pour A la Une, orange pour France, etc...), mais la palette couleur des nuages (dans l'image) est la même à chaque fois (sauf "toutes catégories" voir ci-dessous).
- En revanche, pour le nuage "toutes catégories", chaque mot garde effectivement dans l'image la couleur de la catégorie dont il est issu. La catégorie "A la Une" fournissant plus de références, la couleur rouge sera donc forcément prépondérante (et à l'inverse, peu de chance de voir des mots de "Science-Divers" dans ces nuages toutes catégories).
- Pour les nuages de chaque catégorie, aucun filtrage n'est réalisé, tous les mots sont inclus (ce point pourrait changer sur les mois à venir). Pour le nuage toutes catégories, les 80 à 100 premiers mots sont inclus.
- Un bug informatique a empêché l'enregistrement des statistiques d'avril 2009, aucun article n'a donc pu être publié pour ce mois.
[Update 11/03/09] :
- La liste des meilleurs mots (dans chaque catégorie) est désormais RE-NORMALISEE avant traitement. Ceci consiste à regrouper sous un seul terme plusieurs mots de même racine : par exemple "morts" avec "mort", "européenne" avec "européen", ou plus subtilement "manifestant" avec "manifestation". Ce traitement est déjà réalisé au jour le jour pour la construction des tags, mais comme le terme retenu peut être différent d'un jour sur l'autre selon le contexte, à la fin du mois les deux termes peuvent se retrouver avec des scores distincts, qu'il s'agit donc de regrouper de nouveau. Ce traitement est intégré à partir des mots du mois de février 2009.
- Pour le "toutes catégories", la re-normalisation décrite ci-dessus n'est faite que catégorie par catégorie pour le nuage. On conserve donc dans l'image, par exemple un "Sarkozy" rouge (A la Une) distinct du "Sarkozy" orange (France). Par contre, au niveau du texte (la liste des 10 meilleurs mots), le calcul est fait inter-catégories (re-normalisation globale).
[Update 09/03/09]
Une nouvelle page,
Tendances, est désormais disponible.
Elle permet de compléter les pages des mots les plus utilisés chaque mois par
l'évolution de ces mêmes mots
au cours du temps (mois après mois). En effet, quelques mots se retrouvent
chaque mois (ou presque) dans les meilleurs, mais avec des totaux (fréquence) différents. Il peut donc être utile de voir (sur un
graphique) l'évolution de ces fréquences.