La Wikimedia Foundation s'associe à des entreprises d'IA pour l'accès aux données de Wikipédia

La Wikimedia Foundation a annoncé de nouveaux accords de licence avec de grandes entreprises d'IA, dont Microsoft, Meta et Amazon, pour fournir un accès payant au contenu de Wikipédia. Ces partenariats visent à compenser la hausse des coûts d'infrastructure due au scraping par l'IA. Ces accords marquent un passage de l'utilisation non autorisée des données à un accès API commercial via Wikimedia Enterprise.

Le 15 janvier 2026, la Wikimedia Foundation a révélé des partenariats avec des développeurs d'IA tels que Microsoft, Meta, Amazon, Perplexity et Mistral AI, dans le cadre des célébrations du 25e anniversaire de Wikipédia. Ces entreprises, précédemment connues pour avoir scraped le vaste réservoir de 65 millions d'articles de Wikipédia sans permission, ont désormais rejoint la filiale commerciale de l'organisation à but non lucratif, Wikimedia Enterprise. Le programme propose des API à haut débit pour un accès plus rapide et de plus grand volume à Wikipédia et à des projets connexes comme Wikivoyage, Wikibooks et Wikiquote, aidant à maintenir les opérations de l'organisation face à des coûts en forte hausse. Cette initiative répond à une pression financière croissante sur la fondation, qui repose principalement sur de petites donations publiques. L'année dernière, Wikimedia a tiré la sonnette d'alarme sur une menace existentielle due à la baisse du trafic du site web causée par les grands modèles de langage (LLM) et les chatbots IA qui résument le contenu sans rediriger les utilisateurs vers la source. En avril 2025, la bande passante pour le téléchargement de contenus multimédias a augmenté de 50 % depuis janvier 2024, les bots représentant 65 % des requêtes d'infrastructure les plus coûteuses malgré seulement 35 % des vues de pages totales. En octobre 2025, le trafic humain avait diminué d'environ 8 % sur un an après que des mesures améliorées de détection de bots aient révélé que de nombreux « visiteurs » étaient des scrapeuses automatisés. Cette baisse de trafic perturbe la boucle de rétroaction traditionnelle de Wikipédia, où les lecteurs deviennent éditeurs ou donateurs, améliorant la qualité du contenu. Pendant ce temps, les entreprises d'IA utilisent les données curatées par des humains pour alimenter des outils comme Microsoft Copilot et ChatGPT d'OpenAI. Lane Becker, président de Wikimedia Enterprise, a souligné l'importance du soutien financier : « Wikipédia est un composant critique du travail de ces entreprises technologiques qui doivent trouver comment le soutenir financièrement... tous nos partenaires Big Tech voient vraiment le besoin de s'engager à soutenir le travail de Wikipédia. » Le fondateur de Wikipédia, Jimmy Wales, soutient l'entraînement des IA sur ces données mais insiste sur la compensation : « Je suis très heureux personnellement que les modèles d'IA s'entraînent sur les données de Wikipédia car elles sont curatées par des humains... Vous devriez probablement contribuer et payer votre part équitable des coûts que vous nous imposez. » Les nouveaux accords s'ajoutent à des précédents, comme celui de Google en 2022, bien que les termes financiers restent confidentiels. La fondation a fait face à une résistance interne à ses propres expériences d'IA, suspendant un pilote pour résumés générés par IA en juin après une réaction négative des éditeurs.

Articles connexes

Tech leaders announcing Linux Foundation's AI-powered cybersecurity initiative for open source software with major partners.
Image générée par IA

Linux Foundation announces AI security initiative with tech partners

Rapporté par l'IA Image générée par IA

The Linux Foundation has launched a new initiative using Anthropic's Claude Mythos preview for defensive cybersecurity in open source software. Partners include AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Microsoft, NVIDIA, and Palo Alto Networks. The effort aims to secure critical software amid the rise of AI for open source maintainers.

Five major book publishers and author Scott Turow filed a class action lawsuit against Meta and CEO Mark Zuckerberg in a US District Court in New York. They accuse the company of illegally using millions of copyrighted works to train its Llama AI models. Meta defends the practice as fair use.

Rapporté par l'IA

OpenAI and Microsoft have amended their long-standing partnership, ending Microsoft's exclusive cloud rights for OpenAI's AI models. The changes allow OpenAI to offer its products across any cloud provider while keeping Azure as the primary partner. The joint announcement emphasizes flexibility and broader AI access.

Google is updating its AI Overviews and AI Mode features in Search to include more first-person perspectives from forums like Reddit and other online discussions. The changes also add recommendations for related in-depth articles and improved ways to view sources. These updates aim to help users explore topics more deeply while linking back to original content.

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser