En ny studie rapporterar att när människor lyssnar på en talad historia vecklas neural aktivitet i nyckelspråkregioner över tid på ett sätt som speglar lager-för-lager-beräkningar inuti stora språmodeller. Forskarna, som analyserade electrocorticografi-upptagningar från epilepsipatienter under en 30-minuters podcast, släppte också en öppen datamängd avsedd att hjälpa andra forskare att testa konkurrerande teorier om hur mening byggs i hjärnan.
Forskare har rapporterat bevis för att hjärnans bearbetning av talat språk vecklas i en sekvens som liknar de skiktade operationerna i moderna stora språmodeller. Forskningen, publicerad i Nature Communications den 26 november 2025, leddes av Dr. Ariel Goldstein vid Hebrew University of Jerusalem, med medarbetare inklusive Dr. Mariano Schain vid Google Research och Prof. Uri Hasson och Eric Ham vid Princeton University. ## Lyssningsförsök och neurala upptagningar Teamet analyserade electrocorticografi (ECoG)-upptagningar från nio epilepsipatienter medan de lyssnade på en 30-minuters ljudpodcast, “Monkey in the Middle” (NPR, 2017). Forskarna modellerade neurala svar på varje ord i historien med kontextuella inbäddningar hämtade från flera dolda lager i GPT2-XL-modellen och Llama 2. De fokuserade på flera regioner längs en ventral språkbearbetningsväg, inklusive områden i gyrus temporalis superior, gyrus frontalis inferior (som inkluderar Brocas område) och polus temporalis. ## En skiktad tidsförlopp av mening Studien rapporterar att hjärnans svar matchade modellernas interna representationer i ett tidsordnat mönster: tidigare neurala signaler stämde bättre överens med tidigare modells lager, medan senare neural aktivitet motsvarade djupare lager som integrerar bredare kontext. Sambandet beskrevs som särskilt starkt i högre nivåers språkområden som Brocas område. “Det som förvånade oss mest var hur nära hjärnans temporala veckning av mening matchar sekvensen av transformationer inuti stora språmodeller”, sa Goldstein enligt en sammanfattning från Hebrew University of Jerusalem. ## Implikationer och datatillgängliggörande Resultaten presenteras som en utmaning mot strikt regelbaserade förklaringar av språkbegrepp, och föreslår istället att kontextkänsliga statistiska representationer kan förklara realtids neural aktivitet effektivare än traditionella lingvistiska enheter som fonem och morfem. Forskarna släppte också en offentlig datamängd avsedd att stödja ytterligare arbete inom språkneurovetenskap, inklusive neurala upptagningar alignade med lingvistiska egenskaper. Separat från Nature Communications-rapporten beskriver en relaterad databeskrivning i tidskriften Scientific Data en “Podcast” ECoG-datamängd från nio deltagare med 1 330 elektroder som lyssnar på samma 30-minuters stimulus, tillsammans med extraherade egenskaper från fonetisk information till inbäddningar från stora språmodeller och medföljande analyseringsguider.