Illustration depicting linguists studying why human language resists compression like computer code, contrasting brain processing with digital efficiency.

Étude explore pourquoi le langage humain n’est pas compressé comme le code informatique

20 février 2026

Rapporté par l'IA

Image générée par IA

Vérifié par des faits

Un nouveau modèle des linguistes Richard Futrell et Michael Hahn suggère que de nombreuses caractéristiques emblématiques du langage humain — telles que les mots familiers, l’ordre prévisible et le sens construit étape par étape — reflètent des contraintes sur le traitement séquentiel de l’information plutôt qu’une quête de compression maximale des données. Le travail a été publié dans Nature Human Behaviour.

Le langage humain est remarquablement riche et complexe. D’un point de vue de la théorie de l’information, les mêmes idées pourraient, en principe, être transmises dans des chaînes bien plus compactes — à l’image de la façon dont les ordinateurs représentent l’information à l’aide de chiffres binaires. nnMichael Hahn, linguiste à l’université de Sarre à Sarrebruck, en Allemagne, et Richard Futrell de l’université de Californie à Irvine, se sont attelés à expliquer pourquoi la parole quotidienne ne ressemble pas à un code numérique fortement compressé. Dans un article publié dans Nature Human Behaviour en novembre 2025, les chercheurs présentent un modèle dans lequel une structure « proche du langage naturel » émerge lorsque la communication est limitée par des contraintes sur la prédiction séquentielle — la quantité d’information devant être conservée de ce qui a déjà été entendu pour anticiper ce qui suit. nnDans ce cadre, le langage tire profit de schémas faciles à traiter par les humains comme un flux. Un résumé de ScienceDaily du travail, citant des documents de l’université d’Osaka, utilise des exemples pour illustrer l’idée : un mot inventé tel que « gol » pour un concept hybride (moitié chat et moitié chien) serait difficile à comprendre car il ne se mappe pas clairement sur l’expérience partagée, et un mélange brouillé comme « gadcot » est tout aussi ardu à interpréter. À l’opposé, « chat et chien » est immédiatement signifiant. nnLes chercheurs soulignent aussi l’ordre des mots comme un signal aidant les auditeurs à réduire l’incertitude en temps réel. Le communiqué de ScienceDaily met en avant la locution nominale allemande « Die fünf grünen Autos » (« les cinq voitures vertes ») comme exemple de la manière dont le sens peut être construit de façon incrémentale alors que chaque mot resserre l’ensemble des interprétations plausibles. Réorganiser ces mots — par exemple, « Grünen fünf die Autos » — perturbe cette prévisibilité et rend la compréhension plus ardue. nnAu-delà d’expliquer pourquoi le langage n’est pas « maximalement compressé », la discussion de l’article relie les résultats à l’apprentissage automatique. Futrell et Hahn soutiennent que le langage naturel est structuré de sorte à rendre la prédiction du jeton suivant relativement plus facile sous contraintes cognitives, un point qu’ils jugent pertinent pour les grands modèles de langage modernes. nn

Vérification des faits

Score de confiance

Commentaire de confiance

La plupart des affirmations concrètes — y compris les auteurs, leurs affiliations, le titre et la date de publication de l’article, l’argument central de l’« information prédictive » et les exemples illustratifs spécifiques (« gol », « gadcot » et les phrases allemandes) — sont étayées directement par le communiqué de ScienceDaily et l’article sous-jacent dans Nature Human Behaviour. Deux éléments ont été atténués car ils n’étaient pas clairement substantiés tels quels : le cadrage de l’article autour d’un arbitrage strict contre la « compression maximale d’information » et le chiffre exact de « près de 7 000 » langues, qui figure dans le communiqué mais n’est pas établi dans l’article lui-même. La fiabilité globale est forte car la reformulation repose principalement sur l’étude soumise à une évaluation par les pairs et un résumé institutionnel cohérent.

Study points to whole-brain network coordination as a key feature of general intelligence

3 mars 2026 Rapporté par l'IA Image générée par IA Vérifié par des faits

University of Notre Dame researchers report evidence that general intelligence is associated with how efficiently and flexibly brain networks coordinate across the whole connectome, rather than being localized to a single “smart” region. The findings, published in Nature Communications, are based on neuroimaging and cognitive data from 831 Human Connectome Project participants and an additional 145 adults from the INSIGHT Study.

Étude explore pourquoi le langage humain n’est pas compressé comme le code informatique

Articles connexes

Study points to whole-brain network coordination as a key feature of general intelligence

Étude révèle des signes vieux de 40 000 ans comme systèmes d'information précoces

Un langage informatique détecte une erreur dans un article de physique largement cité

Étude révèle un chevauchement dans les réseaux cérébraux de la mémoire épisodique et sémantique

US commission credits China’s AI edge to open-source models, manufacturing

Des ingénieurs de Northwestern impriment des neurones artificiels capables de stimuler des cellules cérébrales vivantes

Les scientifiques estiment que définir la conscience est de plus en plus urgent avec les avancées de l’IA et de la neurotechnologie

Les IA recommandent fréquemment des frappes nucléaires dans les simulations de guerre

Une méthode quantique promet de booster l'IA

OpenAI dévoile GPT-Rosalind, un grand modèle linguistique spécialisé en biologie

Cortical Labs va construire des centres de données biologiques à Melbourne et Singapour

Cellules cérébrales humaines sur puce apprennent à jouer à Doom en une semaine

Étude montre que l’IA peut désanonymiser les utilisateurs en ligne à partir de publications

L’IA générative surpasse les équipes humaines dans l’analyse de données médicales

Les bébés de deux mois catégorisent les objets plus tôt que prévu

Les hackers utilisent des LLMs pour concevoir des attaques de phishing de nouvelle génération

Ce site utilise des cookies