Wikidata ou le pire projet jamais créé par Wikimedia

Avant-dernier né des projets de Wikimedia Foundation, Wikidata est aux données sur Wikipédia ce que Wikimedia Commons est aux images pour les projets de la Wikimedia Foundation. L’objectif initial du projet est louable, mais l’opacité et la complexité du wiki font qu’il est en réalité une fausse-bonne idée qui se révèle être le pire de tous les projets jamais lancés par la Foundation.

Représentation de la centralisation des données sur Wikidata

Représentation de la centralisation des données sur Wikidata (HenkvD, CC-BY-SA 3.0, Wikimedia Commons)

Un lancement contestable

Wikidata a été développé par l’association Wikimedia Deutschland au début de l’année 2012. Il est ouvert à la contribution fin octobre 2012 et est alors mis entre les mains de la Wikimedia Foundation qui se charge à la fois du déploiement et de la maintenance du site. Bien que l’arrivée de ce projet ait été annoncée régulièrement durant toute l’année 2012, l’énorme problème qui se pose est que la communauté wikimedienne n’a pas été consultée pour le lancement ou non de ce site. Les différentes versions de Wikipédia se sont alors retrouvées avec un nouveau projet qui allait changer leur manière de contribuer, sans pour autant avoir leur mot à dire. La conséquence est que l’on se retrouve avec un projet qui rentre assez péniblement dans les pratiques wikipédiennes et qui est une véritable usine à gaz que la plupart des contributeurs, même expérimentés, n’arrivent pas à maîtriser. La conséquence est que ces contributeurs renoncent alors tout simplement à relier leurs nouveaux articles avec des liens interwikis, étant donné que la nouvelle doctrine est « Wikidata ou rien ». Cependant, je ne parle là que des liens interwikis, donc la modification sur Wikidata n’est pas intuitive, mais n’est pas encore trop compliquée lorsque le système a été compris ; ce qui est beaucoup plus inquiétant est ce qui se passera quand les phases 2 et 3 seront achevées (centralisation des données des infobox et des listes) où les données sont plus complexes.

Une définition contradictoire

Le principe de base de Wikidata qui est de centraliser en un seul wiki les données de base des articles de Wikipédia comme les liens interwikis, les populations dans les infobox… semble de prime abord être une bonne chose. Cependant, il est assez problématique de voir un tel projet ne pas avoir de définition claire pour sa propre communauté (bien que ce problème existe également chez la plupart des contributeurs de Wikipédia). Si on lit sur la page d’accueil de Wikidata « Base de connaissance libre », on lit dans la définition et dans l’introduction du site qu’il s’agit d’une base de données. Or, ce sont deux types de bases qui sont très différents ; dans sa définition même, Wikidata se rapproche plus d’une base de données.

Par ailleurs, un énorme problème va très très vite se poser au niveau de la gestion des données des infobox. En effet, Wikidata est un projet international sans version linguistique spécifique (comme Commons) ; les données devront être reliées à des sources fiables et vérifiables sur Wikipédia, mais comment ces données pourront être gérées si les différentes sources utilisées par les différents utilisateurs sont différentes ? Par exemple, la population de la France, on peut supposer que les américains utiliseront les données du World Factbook de la CIA qui donne une estimation de 65,95 millions d’habitants en juillet 2013, mais les contributeurs français pourront leur opposer les données de l’INSEE qui affichent 64,61 millions d’habitants, mais datent de 2010. Quelle source devra être utilisée pour quelle donnée ? Un véritable casse-tête dans un projet où des sources fiables et officielles peuvent être variées et donner des versions différentes. Si l’objectif de Wikidata est d’uniformiser les données sur toutes les Wikipédia, il est difficile de concevoir comment cet objectif pourrait être atteint à partir de sources variables, mais tout aussi légitimes les unes que les autres.

Un frein à la contribution sur Wikipédia

D’après les créateurs de Wikidata, la centralisation de ces données permettrait d’améliorer la qualité des contributions sur Wikipédia, car les contributeurs ne perdront plus leur temps à effectuer la maintenance des données des infobox. C’est une vision des choses qui se défend, mais à laquelle s’oppose la complexité du code et du fonctionnement du projet. Il est même très probable que Wikidata ait l’effet inverse et bride la participation à Wikipédia dans certains domaines où la manipulation de données prend une part non-négligeable dans les contributions. D’expérience, les nouveaux contributeurs ne savent pas souvent que les images de Wikipédia sont situées sur Commons et demandent régulièrement comment placer les images sur Wikipédia. Le même problème va arriver avec Wikidata, car le contributeur devra préalablement savoir que les données se trouvent sur un autre wiki, sinon il sera très vite dérouté de voir des données dans l’article qui n’apparaissent pas dans son code. Par ailleurs, les nouveaux contributeurs ne tentent pas toujours de partir dans des projets très ambitieux et la mise à jour de données est généralement un point de départ intéressant pour voir de manière simple comment modifier un article. Si jamais le nouveau sait qu’il doit aller sur Wikidata pour effectuer cette mise à jour, il risque fort de ne rien faire du tout, au vu de la grande complexité du fonctionnement du site et abandonnera son projet, ce qui pourrait même engendrer une perte de motivation de participer à Wikipédia, si la prise en main à la contribution lui paraît beaucoup trop complexe.

Par ailleurs, si jamais Wikidata venait à être vandalisée, ce seront toutes les versions linguistiques de Wikipédia qui seront affectées. Wikidata ne peut être comparée à Commons, car il est impossible de vandaliser une image directement ; le vandalisme de l’illustration ne pourra se faire que sur Wikipédia avec le changement de l’image dans le code de la page, donc une seule version linguistique sera affectée. Sur Wikidata, le vandale va détériorer 285 fois Wikipédia pour le prix d’un seul clic !

En résumé, Wikidata est :

  • Un projet non-légitime, car imposé sans consultation communautaire
  • Un projet flou et opaque dans sa définition même, ce qui permet d’émettre un énorme doute quand à son efficacité
  • Un projet dont la gestion du contenu sera très hasardeuse, donc d’une fiabilité très relative
  • Un projet qui risque plus de décourager et de faire fuir les nouveaux contributeurs sur Wikipédia que de les encourager et les aider à participer
  • Un projet extrêmement plus vulnérable au vandalisme que Wikipédia

De mon point de vue, Wikidata aurait une utilité et une efficacité réelle si son application restait confinée aux liens interwikis, car la gestion centralisée de ce type de liens est un progrès incontestable. Mais je peux avertir la communauté d’une chose, si j’utiliserai Wikidata pour les liens interwikis, qu’elle ne compte pas sur moi pour faire de même avec les autres données.

Licence Creative Commons
Cette œuvre de Juraastro est mise à disposition selon les termes de la licence Creative Commons Attribution – Pas de Modification 3.0 non transposé.