La Wikimedia Foundation s'associe à des entreprises d'IA pour l'accès aux données de Wikipédia

16 janvier 2026

Rapporté par l'IA

La Wikimedia Foundation a annoncé de nouveaux accords de licence avec de grandes entreprises d'IA, dont Microsoft, Meta et Amazon, pour fournir un accès payant au contenu de Wikipédia. Ces partenariats visent à compenser la hausse des coûts d'infrastructure due au scraping par l'IA. Ces accords marquent un passage de l'utilisation non autorisée des données à un accès API commercial via Wikimedia Enterprise.

Le 15 janvier 2026, la Wikimedia Foundation a révélé des partenariats avec des développeurs d'IA tels que Microsoft, Meta, Amazon, Perplexity et Mistral AI, dans le cadre des célébrations du 25e anniversaire de Wikipédia. Ces entreprises, précédemment connues pour avoir scraped le vaste réservoir de 65 millions d'articles de Wikipédia sans permission, ont désormais rejoint la filiale commerciale de l'organisation à but non lucratif, Wikimedia Enterprise. Le programme propose des API à haut débit pour un accès plus rapide et de plus grand volume à Wikipédia et à des projets connexes comme Wikivoyage, Wikibooks et Wikiquote, aidant à maintenir les opérations de l'organisation face à des coûts en forte hausse. Cette initiative répond à une pression financière croissante sur la fondation, qui repose principalement sur de petites donations publiques. L'année dernière, Wikimedia a tiré la sonnette d'alarme sur une menace existentielle due à la baisse du trafic du site web causée par les grands modèles de langage (LLM) et les chatbots IA qui résument le contenu sans rediriger les utilisateurs vers la source. En avril 2025, la bande passante pour le téléchargement de contenus multimédias a augmenté de 50 % depuis janvier 2024, les bots représentant 65 % des requêtes d'infrastructure les plus coûteuses malgré seulement 35 % des vues de pages totales. En octobre 2025, le trafic humain avait diminué d'environ 8 % sur un an après que des mesures améliorées de détection de bots aient révélé que de nombreux « visiteurs » étaient des scrapeuses automatisés. Cette baisse de trafic perturbe la boucle de rétroaction traditionnelle de Wikipédia, où les lecteurs deviennent éditeurs ou donateurs, améliorant la qualité du contenu. Pendant ce temps, les entreprises d'IA utilisent les données curatées par des humains pour alimenter des outils comme Microsoft Copilot et ChatGPT d'OpenAI. Lane Becker, président de Wikimedia Enterprise, a souligné l'importance du soutien financier : « Wikipédia est un composant critique du travail de ces entreprises technologiques qui doivent trouver comment le soutenir financièrement... tous nos partenaires Big Tech voient vraiment le besoin de s'engager à soutenir le travail de Wikipédia. » Le fondateur de Wikipédia, Jimmy Wales, soutient l'entraînement des IA sur ces données mais insiste sur la compensation : « Je suis très heureux personnellement que les modèles d'IA s'entraînent sur les données de Wikipédia car elles sont curatées par des humains... Vous devriez probablement contribuer et payer votre part équitable des coûts que vous nous imposez. » Les nouveaux accords s'ajoutent à des précédents, comme celui de Google en 2022, bien que les termes financiers restent confidentiels. La fondation a fait face à une résistance interne à ses propres expériences d'IA, suspendant un pilote pour résumés générés par IA en juin après une réaction négative des éditeurs.

La Wikimedia Foundation s'associe à des entreprises d'IA pour l'accès aux données de Wikipédia

Articles connexes

Linux Foundation announces AI security initiative with tech partners

Publishers sue Meta and Zuckerberg over AI copyright infringement

OpenAI amends Microsoft partnership to end exclusivity

AI trainers use chatbots to complete model tasks

Google invests $75 million in A24 for AI filmmaking tools

German court holds Google liable for false AI Overviews answers

Google adds reddit advice and more sources to ai search

Google, Microsoft and OpenAI back Linux Foundation's Appia AI initiative

AI generated code overwhelms open source developers

Meta secures massive AWS deal for AI infrastructure

Meta tracks US employees' computer interactions for AI training amid staff backlash and layoffs

Meta pauses work with Mercor after major data breach

Ce site utilise des cookies