La Wikimedia Foundation s'associe à des entreprises d'IA pour l'accès aux données de Wikipédia

La Wikimedia Foundation a annoncé de nouveaux accords de licence avec de grandes entreprises d'IA, dont Microsoft, Meta et Amazon, pour fournir un accès payant au contenu de Wikipédia. Ces partenariats visent à compenser la hausse des coûts d'infrastructure due au scraping par l'IA. Ces accords marquent un passage de l'utilisation non autorisée des données à un accès API commercial via Wikimedia Enterprise.

Le 15 janvier 2026, la Wikimedia Foundation a révélé des partenariats avec des développeurs d'IA tels que Microsoft, Meta, Amazon, Perplexity et Mistral AI, dans le cadre des célébrations du 25e anniversaire de Wikipédia. Ces entreprises, précédemment connues pour avoir scraped le vaste réservoir de 65 millions d'articles de Wikipédia sans permission, ont désormais rejoint la filiale commerciale de l'organisation à but non lucratif, Wikimedia Enterprise. Le programme propose des API à haut débit pour un accès plus rapide et de plus grand volume à Wikipédia et à des projets connexes comme Wikivoyage, Wikibooks et Wikiquote, aidant à maintenir les opérations de l'organisation face à des coûts en forte hausse. Cette initiative répond à une pression financière croissante sur la fondation, qui repose principalement sur de petites donations publiques. L'année dernière, Wikimedia a tiré la sonnette d'alarme sur une menace existentielle due à la baisse du trafic du site web causée par les grands modèles de langage (LLM) et les chatbots IA qui résument le contenu sans rediriger les utilisateurs vers la source. En avril 2025, la bande passante pour le téléchargement de contenus multimédias a augmenté de 50 % depuis janvier 2024, les bots représentant 65 % des requêtes d'infrastructure les plus coûteuses malgré seulement 35 % des vues de pages totales. En octobre 2025, le trafic humain avait diminué d'environ 8 % sur un an après que des mesures améliorées de détection de bots aient révélé que de nombreux « visiteurs » étaient des scrapeuses automatisés. Cette baisse de trafic perturbe la boucle de rétroaction traditionnelle de Wikipédia, où les lecteurs deviennent éditeurs ou donateurs, améliorant la qualité du contenu. Pendant ce temps, les entreprises d'IA utilisent les données curatées par des humains pour alimenter des outils comme Microsoft Copilot et ChatGPT d'OpenAI. Lane Becker, président de Wikimedia Enterprise, a souligné l'importance du soutien financier : « Wikipédia est un composant critique du travail de ces entreprises technologiques qui doivent trouver comment le soutenir financièrement... tous nos partenaires Big Tech voient vraiment le besoin de s'engager à soutenir le travail de Wikipédia. » Le fondateur de Wikipédia, Jimmy Wales, soutient l'entraînement des IA sur ces données mais insiste sur la compensation : « Je suis très heureux personnellement que les modèles d'IA s'entraînent sur les données de Wikipédia car elles sont curatées par des humains... Vous devriez probablement contribuer et payer votre part équitable des coûts que vous nous imposez. » Les nouveaux accords s'ajoutent à des précédents, comme celui de Google en 2022, bien que les termes financiers restent confidentiels. La fondation a fait face à une résistance interne à ses propres expériences d'IA, suspendant un pilote pour résumés générés par IA en juin après une réaction négative des éditeurs.

Articles connexes

Elon Musk on stage launching Grokipedia, with a screen showing the AI encyclopedia rivaling Wikipedia, in a modern tech setting.
Image générée par IA

Grokipedia de Musk se lance comme rival construit par l’IA à Wikipedia

Rapporté par l'IA Image générée par IA Vérifié par des faits

Elon Musk a lancé Grokipedia, une encyclopédie en ligne générée par l’IA liée à son chatbot xAI Grok, la positionnant comme un défi à Wikipedia. Musk a déclaré sur X que son objectif est de créer « une collection open source et exhaustive de tout le savoir », après avoir critiqué à plusieurs reprises ce qu’il appelle le biais gauchiste de Wikipedia.

Meta has agreed to a three-year AI licensing deal with News Corp, paying up to $50 million annually for content from The Wall Street Journal and other brands. The arrangement allows Meta to use the material in its AI chatbot responses and for training models. News Corp confirmed the deal, highlighting its strategy of partnering with AI firms or pursuing legal action against unauthorized use.

Rapporté par l'IA

L'encyclopédie Britannica et sa filiale Merriam-Webster ont intenté un procès à OpenAI, alléguant une violation du droit d'auteur pour avoir utilisé leur contenu afin d'entraîner des modèles d'IA comme ChatGPT sans autorisation, ainsi qu'une violation de la marque déposée, l'IA attribuant faussement des hallucinations à Britannica. Les plaignants affirment que ChatGPT reproduit mot pour mot ou presque mot pour mot des portions, des résumés ou des abrégés de leurs œuvres, cannibalisant ainsi le trafic vers leurs sites.

Japan's economy ministry will provide financial support to domestic companies for processing vast amounts of data for machine learning. The focus is on manufacturing sector data to enhance the performance of domestically developed AI, strengthening product competitiveness and productivity. The ministry plans to invest ¥1 trillion over five years starting from fiscal 2026.

Rapporté par l'IA

Une étude de l’université Cornell révèle que des outils d’IA comme ChatGPT ont augmenté la production d’articles des chercheurs jusqu’à 50 %, bénéficiant particulièrement aux non-anglophones. Cependant, cette vague de manuscrits polis complique les évaluations par les pairs et les décisions de financement, car beaucoup manquent de valeur scientifique substantielle. Les résultats soulignent un changement dans les dynamiques de la recherche mondiale et appellent à des politiques actualisées sur l’utilisation de l’IA en académie.

Les organisations d'information sud-africaines font face à l'utilisation abusive de leur contenu par des comptes sur les réseaux sociaux se faisant passer pour des sites d'actualité légitimes. Les journalistes soulignent l'érosion des normes éthiques et appellent à des réglementations plus strictes sur les plateformes numériques. L'essor du contenu généré par l'IA ajoute des défis supplémentaires à l'industrie.

Rapporté par l'IA

Le Writers Guild of America prévoit d'exiger une compensation pour les scripts utilisés pour entraîner des modèles d'IA lors des prochaines négociations contractuelles avec les studios. Les négociations avec l'Alliance of Motion Picture and Television Producers doivent débuter la semaine prochaine, sur fond de préoccupations concernant les déficits du fonds de santé et d'autres problèmes issus de la grève de 2023. Les dirigeants du syndicat insistent sur la nécessité de paiements équitables, notant que les protections contre l'IA obtenues précédemment ont tenu bon.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser