Sebuah studi baru melaporkan bahwa saat orang mendengarkan cerita yang diucapkan, aktivitas saraf di wilayah bahasa kunci terbentang seiring waktu dengan cara yang mencerminkan komputasi lapis demi lapis di dalam model bahasa besar. Para peneliti, yang menganalisis rekaman electrocorticography dari pasien epilepsi selama podcast 30 menit, juga merilis dataset terbuka yang dimaksudkan untuk membantu ilmuwan lain menguji teori bersaing tentang bagaimana makna dibangun di otak.
Para ilmuwan telah melaporkan bukti bahwa pemrosesan bahasa lisan oleh otak terbentang dalam urutan yang menyerupai operasi berlapis dari model bahasa besar modern. Penelitian, yang diterbitkan di Nature Communications pada 26 November 2025, dipimpin oleh Dr. Ariel Goldstein dari Hebrew University of Jerusalem, dengan kolaborator termasuk Dr. Mariano Schain dari Google Research dan Prof. Uri Hasson serta Eric Ham dari Princeton University. ## Eksperimen mendengarkan dan rekaman saraf Tim menganalisis rekaman electrocorticography (ECoG) dari sembilan pasien epilepsi saat mereka mendengarkan podcast audio 30 menit, “Monkey in the Middle” (NPR, 2017). Para peneliti memodelkan respons saraf terhadap setiap kata dalam cerita menggunakan embedding kontekstual yang diambil dari beberapa lapisan tersembunyi model GPT2-XL dan Llama 2. Mereka fokus pada beberapa wilayah sepanjang jalur pemrosesan bahasa ventral, termasuk area di gyrus temporal superior, gyrus frontal inferior (yang mencakup area Broca), dan kutub temporal. ## Perjalanan waktu berlapis makna Studi melaporkan bahwa respons otak cocok dengan representasi internal model dalam pola berurutan waktu: sinyal saraf awal selaras lebih kuat dengan lapisan model awal, sementara aktivitas saraf selanjutnya sesuai lebih dekat dengan lapisan lebih dalam yang mengintegrasikan konteks lebih luas. Asosiasi tersebut digambarkan sangat kuat di wilayah bahasa tingkat tinggi seperti area Broca. “Yang paling mengejutkan kami adalah betapa dekatnya pengembangan temporal makna otak dengan urutan transformasi di dalam model bahasa besar,” kata Goldstein, menurut ringkasan yang dirilis oleh Hebrew University of Jerusalem. ## Implikasi dan rilis data Temuan ini disajikan sebagai tantangan bagi akun berbasis aturan ketat pemahaman bahasa, menyarankan bahwa representasi statistik sensitif konteks mungkin menjelaskan aktivitas saraf waktu nyata lebih efektif daripada unit linguistik tradisional seperti fonem dan morfem. Para peneliti juga merilis dataset publik yang dimaksudkan untuk mendukung pekerjaan lebih lanjut dalam neurosains bahasa, termasuk rekaman saraf yang selaras dengan fitur linguistik. Terpisah dari laporan Nature Communications, deskriptor data terkait di jurnal Scientific Data menggambarkan dataset ECoG “Podcast” dari sembilan peserta dengan 1.330 elektroda mendengarkan stimulus 30 menit yang sama, bersama dengan fitur yang diekstrak mulai dari informasi fonetik hingga embedding model bahasa besar dan tutorial analisis pendamping.