PàS (3) Keep or delete - Conserver ou supprimer

Publié par Hamelin de Guettelet le vendredi 5 juillet 2013

Voici le troisième opus de ma réflexion sur la pertinence encyclopédique des articles sur Wikipédia après Universalisme ou encyclopédisme et Inclusionnisme et suppressionnisme.

Je voudrais présenter ici une communication particulièrement intéressante sur les AfD - article for delation (page à supprimer - PàS - à la mode de la Wikipédia anglophone) - de Dario Taraborelli et Giovanni Luca Ciampaglia avec l'aide de Moritz Stefaner pour la mise en graphique (cf. Notabilia) [1].

Notabilia - les 200 plus longues AfD - page à supprimer - de la Wikipédia anglophone
© D. Taraborelli, G.-L. Ciampaglia et M. Stefaner - CC BY-NC-SA pour toutes les illustrations de cet article
Pour fixer tout de suite les idées, Dario Taraborelli (DarTar sur la Wikipédia anglophone), docteur en sciences cognitives, est actuellement analyste principal de recherche au département ingénierie et développement de produits de la Wikimedia Foundation et membre du Comité de recherche de la dite Fondation. Giovanni Luca Ciampaglia, docteur en informatique, avant de rejoindre le CNetS - Center for Complex Networks and Systems Research de Indiana University at Bloomington - était analyste de recherche contractuel de la Wikimedia Foundation. Quant à Moritz Stefaner, il se présente comme un « opérateur de la vérité et de beauté » au carrefour de la visualisation des données, de l'esthétique de l'information et de la conception d'interface utilisateur.

Cette communication datant de 2010, rendait compte de « l'analyse de la structure d'une forme particulière de prise de décision collective de Wikipédia » précisément les discussions de suppression d'articles de la Wikipédia anglophone. Wikipédia met en œuvre un système de gouvernance du contenu rédactionnel impliquant les contributeurs dans les tâches de contrôle [2] [3] [4] [5]. Taraborelli et al. étudient la masse de données (948 309 avis de 57 219 contributeurs dans 198 083 PàS) produite par les discussions en suppression entre novembre 2002 et juillet 2010. Ce sujet avait déjà été abordé dans une étude plus générale de B. Stvilia et al. en 2008 [6] qui montrait que les contributeurs qui participaient à ces discussions étaient pratiquement toujours les mêmes et qu'ils étaient qu'un nombre restreint de contributeurs par opposition à une grande majorité qui votait peu ou pas. Une étude plus précise et centrée de Lam et Riedl [7], portant sur la période 2005/2007 des AfD, avait montré quatre choses : les suppressions sont plus nombreuses en début de vie des articles, sont moins nombreuses proportionnellement à la popularité des articles et que des évènements d'actualité extérieurs à Wikipédia créaient des pics de suppression comme des interventions de la Wikimedia Foundation ; sauf pour les interventions de la Foundation, ces phénomènes sont aussi observables sur la Wikipédia francophone.

Il faut par contre noter une différence fondamentale entre les AfD anglophones et les PàS francophones ; les AfD sont basées uniquement sur une notoriété suffisante vérifiable dans des sources de qualité et a contrario les PàS sont normalement soumises à la seule vérifiabilité. En fait, les PàS francophones sont illégitimement contraintes par des critères d'admissibilité qui ne devraient être qu'indicatifs (critères d'ailleurs fautivement liés en interwiki par Wikidata à une page anglophone qui n'a rien à voir avec des critères d'admissibilité). Lam et Riedl montre que l'appréciation de la notion de notabilité était à l'origine de la constitution de deux groupes organisés d'inclusionists et deletionists et se justifiait par la discussion AfD par AfD de cette notion de notabilité.  À la différence de la Wikipédia anglophone, je note (cf. Inclusionnisme et suppressionnisme) pour la Wikipédia francophone que les suppressionnistes se sont employés depuis plusieurs années à vider les PàS de toute discussion sur la vérifiabilité au profit du respect strict de critères normalement indicatifs et totalement subjectifs.

L'étude de Taraborelli et al. cherche à mettre en évidence une dynamique des discussions de suppression au-delà de l'évaluation de la notabilité et en particulier s'il était possible de noter des biais et principalement si les votes postérieurs sont influencés par les votes antérieurs et s'il existe des comportements hétérogènes qui dénoteraient l'influence de groupes constitués. Cette étude est aussi particulièrement intéressante par la mise en graph des discussions de suppression qui est fortement indicative de clôtures peu consensuelles.

 Parmi les informations générales données par Taraborelli et al. il faut noter deux choses :
  • les clôtures en suppression représentent 68,37 % des AfD et les conservations 25,43 % (cf. Mon message du 4 juin 2013) ;
  • les avis donnés sont compris entre l'unité et la trentaine, la grande majorité des AfD ne dépassent pas 6 avis avec une majorité autours de 3 et 4 avis.
Si cette étude confirme ce que beaucoup de contributeurs ressentent de façon intuitive, les chercheurs ont mis en évidence :
  • plus la discussion se prolonge plus les avis donnés mettent en évidence ce que les auteurs appellent une « cascade d'information » qui se produit lorsque des contributeurs se forment un avis sur la base des informations obtenues par l'observation des avis des contributeurs les précédant [8] ce qui est caractéristique d'un « comportement moutonnier » qui apportent en fait peu d'informations supplémentaires ;
  • peu importe la longueur des discussions, l'apparition de mécanismes extrinsèques met en évidence l’hétérogénéité statistique des discussions et une forte homogénéité au niveau de sous-groupes de comportements des contributeurs validant l’existence de groupes de contributeurs montrant que ceux-ci ne prennent pas uniquement en compte la notoriété de l'article. Ce comportement dénote l'introduction d'un biais dû à l'action de groupes suppressionnistes et inclussionnistes qui cherchent à influencer les décisions de clôture.

Mise en graph du consensus

Ce qui m'a fortement intéressé dans ce travail, c'est la restitution graphique des discussions de PàS mise au point par Moritz Stefaner. Cette mise en graph est particulièrement parlante, elle permet de visualiser facilement les consensus ou les dissensus dans les discussions en suppression, cela pourrait ouvrir des possibilités pour la construction d'un programme d'aide à la décision qui apporterait une pacification des clôtures de discussions des PàS. Comment se construisent et peuvent être interprétés ces graphiques ?

Les avis motivés, quand motivation il y a, sont collationnés sous forme d'un historique marqués D - delete (effacer) - quand il s'agit d'un avis supprimer, et marqués K - keep (garder) - quand il s'agit d'un avis conserver, fusionner ou rediriger. Pour la construction du graphique un avis D est représenté par un segment rouge orienté vers la droite et un avis K par un segment vert orienté vers la gauche. La longueur du segment et l'orientation de celui-ci varient de façon logarithmique afin qu'une succession de même segment D ou K donne une spirale logarithmique. La logique prise en compte veut que les avis suivants inclus des comportements « moutonniers » ou « réactionnaires » de prise en compte des premiers avis et le fait que plus la discussion dure plus les mêmes arguments revenant, chaque argument garde sa valeur intrinsèque mais la réitération du même argument ne lui donne pas plus de valeur sinon qu'il se trouve ainsi corroboré.

Si la ligne ainsi tracée est dextrogyre c'est que les avis D - en suppression - ont plus de poids que les avis K - en conservation - et qu'il y a donc un consensus pour la suppression, a contrario un tracé levogyre confirme un consensus en conservation, plus le tracé se rapproche de la spirale, plus le consensus est unanime (figure 1). Plus un tracé s'éloigne de ce cas de figure (figure 2), moins les avis sont consensuels, plus c'est un dissensus, soit par renversement des avis (figure 3), soit par alternance d'avis contraire (figure 4).
Figure 1 - consensus unanime
Figure 2 - consensus
Figure 3 - dissensus par
changement de consensus
Figure 4 - dissensus

La figure 5 est la mise en graph des 100 plus longues discussions de la base de données à s'être conclues en suppression, la figure 6 le graph des 100 plus longues discussions à s'être terminées en conservation. Nous constatons sur la figure 5 - suppression - malgré des tracés à tendance levogyre, indiquant un poids plus fort des avis en conservation, des discussions sont pourtant conclues en suppression. Dans la figure 6 - conservation - là aussi, malgré des tracés dextrogyres, des discussions ont été conclues en conservation.

Figure 5 - 100 plus longues AfD en suppression
Figure 6 - 100 plus longues AfD en conservation

Je donnerai dans un prochain message mon analyse de cette mise en graph de la notion de consensus et de dissensus.

Ainsi va Wikipédia.


[1] D. Taraborelli, G.L. Ciampaglia (2010) « Beyond Notability », in Collective Deliberation on Content Inclusion in Wikipedia, Fourth IEEE International Conference on Self-Adaptive and Self-Organizing Systems Workshops (SASOW'10).
[2] A. Kittur, E. Chi, B. A. Pendleton, B. Suh, and T. Mytkowicz (2007) « Power of the few vs. wisdom of the crowd: Wikipedia and the rise of the bourgeoisie » in ALT.CHI 2007.
[3] A. Forte, V. Larco, and A. Bruckman (2009) « Decentralization in wikipedia governance » in Journal of Management Information Systems, vol. 26, no. 1, pp. 49–72, July 2009.
[4] J. Leskovec, D. Huttenlocher, and J. Kleinberg (2010) « Governance in social media: A case study of the wikipedia promotion process » in Proceedings of the International Conference on Weblogs and Social Media (ICWSM'10).
[5] I. Beschastnikh, T. Kriplean, and D. W. McDonald (2008) « Wikipedian selfgovernance in action: Motivating the policy lens » in Proceedings of the second ICWSM conference (ICSM'08).
[6] B. Stvilia, M. B. Twidale, L. C. Smith, and L. Gasser (2008) « Information quality work organization in Wikipedia » in Journal of the American Society for Information Science and Technology, vol. 59, no. 6, pp. 983–1001.
[7] S. K. Lam and J. Riedl (2009) « Is Wikipedia growing a longer tail? » in Proceedings of the ACM 2009 international conference on Supporting group work (GROUP'09) New York, pp. 105–114.
[8] S. Bikhchandani, D. Hirshleifer, and I. Welch (1992) « A theory of fads, fashion, custom, and cultural change as informational cascades » in The Journal of Political Economy, vol. 100, no. 5, pp. 992–026.