Comment pourrir les historiques

Publié par Hamelin de Guettelet le vendredi 27 Septembre 2013

© Patrick Vasco Gromy
Le projet correction syntaxique fait vraiment tout et n'importe quoi. Le but de ce projet est présenté ainsi :
  • éliminer les erreurs de syntaxe Wiki (comme une balise manquante, mal ouverte ou mal fermée) ;
  • vérifier la hiérarchie des titres et la structure des articles, ainsi que leur catégorisation ;
  • veiller à la présence de la section « Notes et référence » pour les articles comportant des appels de notes ;
  • corriger, supprimer ou déplacer le code qui ne suit pas les conventions (comme la position des références par rapport à la ponctuation, la position des liens interlangue) ;
  • faciliter l’édition des articles en remplaçant par exemple des entités HTML par leur équivalent en caractère Unicode (par exemple, transformer « —  » en « — ») ;
  • vérifier l’accessibilité des articles (par exemple que les images aient une légende).
Tout cela me parait bel et bien. Mais jamais des contributeurs de Wikipédia ne savent se limiter à l'utile et au nécessaire.

Ils sont comme le « Monsieur Plus » de la pub, il faut qu'ils en fassent plus, toujours plus, toujours beaucoup plus. Si encore cette volonté de faire s'appliquait à corriger des erreurs syntaxiques pour que les articles soient correctement écrits dans un bon français, oui, mille fois oui. Mais faire des dizaines de milliers de modifications dans les articles encyclopédiques pour écrire soi-disant correctement le code wiki en mettant ici ou là une majuscule alors que la minuscule est tout aussi efficace, c'est vraiment se foutre du monde.

Si cela était sans conséquence après tout pourquoi pas, mais tout cela n'est pas neutre. Ouvrez n'importe quel historique d'article et vous verrez une foultitude de modifs ridicules qui pourrit les historiques avec pour conséquence la difficulté de retrouver au milieu de ces diffs - modification - le vandalisme sournois qui modifie également les quelques bits d'une date, d'un chiffre ou d'un nom.

Et tout cela pourquoi ? Pour que quelques contributeurs fassent joujou avec un bot. Voilà le dernier exemple en date de leur folie contributive : introduire la fonction DEFAULTSORT dans 65 000 pages qui en sont dépourvues. Voilà une bonne chose, me direz-vous, si l'on souhaite avoir les articles correctement classés dans les catégories. Hormis le fait que cette fonction est totalement inutile pour les articles dont le titre ne comporte aucune lettre diacritiquées ou d'un autre alphabet que de l'alphabet latin, ou qu'il s'agit de noms composés dont l'ordre de classement alphabétique n'est pas naturel, voila 65 000 historiques de plus de pourris pour rien.

Pour rien ! Vous étonnez-vous. Et bien, si vous me posiez la question, je vous répondrais : pour rien parce que la fonction DEFAULTSORT est tout simplement inutile.

Depuis la version 1.17.0 de MediaWiki (nous en sommes à la version 1.21.2), notre logiciel sait très bien classer des items dans l'ordre alphabétique que l'on souhaite, si on lui demande gentiment, en fait si on le demande gentiment aux devs - développeur - pour qu'ils nous implémentent la fonction ad hoc. MediaWiki peut classer n'importe quel titre d'article, écrit avec n'importe quelle lettre, dans un ordre bien défini. La preuve, la Wikipédia de langue hongroise pratique déjà ainsi, et pour les diacritiques, ils sont aussi bien servi que nous.

Un sondage exprès sur le Bistro recueille en une journée 37 avis favorables sans aucune opposition (j'aurais bien aimer voir une opposition pour apprécier l'argumentation !).

Voila donc encore du travail en perspective pour les bots - logiciel d'automatisation - retirer les DEFAULTSORT qu'ils viennent d'ajouter et quelques centaines de milliers d'autres ; une bonne occasion de pourrir encore un peu plus les historiques des articles. Surtout que les choses ne seront pas aussi simples que cela, il y aura toujours des cas spécifiques où DEFAULTSORT restera utile : tous les titres comportant des noms composés dont il faudra bien préciser l'ordre de classement et toutes les lettres d'alphabet allophones utilisées dans des titres d'articles pas très français.

Ainsi va mal Wikipédia quand elle devrait s'améliorer.

1 commentaire:

  1. C'est vrai que ça commence à être pénible, s'il faut que les enfants s'amusent, qu'ils aillent jouer dans le bac à sable ! Il n'y a aucun gain pour WP, c'est juste pour l'éditcount

    RépondreSupprimer