Illustration depicting linguists studying why human language resists compression like computer code, contrasting brain processing with digital efficiency.

Studi mengeksplorasi mengapa bahasa manusia tidak dikompresi seperti kode komputer

Jumat, 20 Februari 2026

Dilaporkan oleh AI

Gambar dihasilkan oleh AI

Fakta terverifikasi

Model baru dari para linguis Richard Futrell dan Michael Hahn menunjukkan bahwa banyak ciri khas bahasa manusia—seperti kata-kata yang familiar, urutan yang dapat diprediksi, dan makna yang dibangun langkah demi langkah—mencerminkan batasan pada pemrosesan informasi berurutan daripada dorongan untuk kompresi data maksimum. Karya ini diterbitkan di Nature Human Behaviour.

Bahasa manusia sangat kaya dan rumit. Dari perspektif teori informasi, ide-ide yang sama bisa, secara prinsip, ditransmisikan dalam string yang jauh lebih ringkas—mirip dengan bagaimana komputer merepresentasikan informasi menggunakan digit biner. nnMichael Hahn, linguis di Universitas Saarland di Saarbrücken, Jerman, dan Richard Futrell dari Universitas California, Irvine, berusaha menjawab mengapa ucapan sehari-hari tidak menyerupai kode digital yang dikompresi ketat. Dalam makalah yang diterbitkan di Nature Human Behaviour pada November 2025, para peneliti menyajikan model di mana struktur “mirip bahasa alami” muncul ketika komunikasi dibatasi oleh batas prediksi berurutan—berapa banyak informasi yang harus dibawa maju dari apa yang sudah didengar untuk mengantisipasi apa yang akan datang selanjutnya. nnDalam kerangka itu, bahasa mendapat manfaat dari pola-pola yang mudah diproses oleh manusia sebagai aliran. Ringkasan ScienceDaily dari karya tersebut, mengutip materi dari Universitas Osaka, menggunakan contoh untuk mengilustrasikan ide tersebut: kata buatan seperti “gol” untuk konsep hibrida (setengah kucing dan setengah anjing) akan sulit dipahami karena tidak memetakan secara bersih ke pengalaman bersama, dan campuran acak seperti “gadcot” sama sulitnya ditafsirkan. Sebaliknya, “kucing dan anjing” langsung bermakna. nnPara peneliti juga menunjuk pada urutan kata sebagai sinyal yang membantu pendengar mengurangi ketidakpastian secara real-time. Rilis ScienceDaily menyoroti frasa nomina Jerman “Die fünf grünen Autos” (“mobil hijau lima”) sebagai contoh bagaimana makna dapat dibangun secara bertahap saat setiap kata mempersempit kumpulan interpretasi yang masuk akal. Mengubah urutan kata-kata tersebut—misalnya, “Grünen fünf die Autos”—mengganggu prediktabilitas itu dan membuat pemahaman lebih sulit. nnSelain menjelaskan mengapa bahasa tidak “dikompresi secara maksimal,” diskusi makalah menghubungkan temuan dengan pembelajaran mesin. Futrell dan Hahn berpendapat bahwa bahasa alami terstruktur dengan cara yang membuat prediksi token berikutnya relatif lebih mudah di bawah batasan kognitif, poin yang mereka katakan relevan dengan model bahasa besar modern. nn

Pemeriksaan fakta

Skor kepercayaan

Komentar kepercayaan

Klaim-klaim konkret paling banyak—termasuk penulis, afiliasi mereka, judul dan tanggal publikasi makalah, argumen inti “informasi prediktif,” dan contoh ilustrasi spesifik (“gol,” “gadcot,” dan frasa Jerman)—didukung langsung oleh rilis ScienceDaily dan makalah Nature Human Behaviour yang mendasarinya. Dua elemen dilembutkan karena tidak didukung secara bersih seperti yang ditulis: pembingkaian artikel tentang tradeoff ketat terhadap “kompresi informasi maksimum,” dan angka pasti “sekitar 7.000” bahasa, yang muncul dalam rilis tetapi tidak ditegaskan dalam makalah itu sendiri. Keandalan keseluruhan kuat karena penulisan ulang terutama bergantung pada studi peer-reviewed dan ringkasan institusional yang konsisten.

Studi menghubungkan respons otak langkah demi langkah selama bicara dengan pemrosesan berlapis di model bahasa besar

Rabu, 21 Januari 2026 Dilaporkan oleh AI Gambar dihasilkan oleh AI Fakta terverifikasi

Sebuah studi baru melaporkan bahwa saat orang mendengarkan cerita yang diucapkan, aktivitas saraf di wilayah bahasa kunci terbentang seiring waktu dengan cara yang mencerminkan komputasi lapis demi lapis di dalam model bahasa besar. Para peneliti, yang menganalisis rekaman electrocorticography dari pasien epilepsi selama podcast 30 menit, juga merilis dataset terbuka yang dimaksudkan untuk membantu ilmuwan lain menguji teori bersaing tentang bagaimana makna dibangun di otak.

Studi mengeksplorasi mengapa bahasa manusia tidak dikompresi seperti kode komputer

Artikel Terkait

Studi menghubungkan respons otak langkah demi langkah selama bicara dengan pemrosesan berlapis di model bahasa besar

Studi ungkap tanda-tanda berusia 40.000 tahun sebagai sistem informasi awal

Bahasa komputer temukan kesalahan dalam makalah fisika yang banyak dikutip

Studi ungkap tumpang tindih jaringan otak untuk memori episodik dan semantik

US commission credits China’s AI edge to open-source models, manufacturing

Insinyur Northwestern mencetak neuron buatan yang dapat menstimulasi sel otak hidup

Para ilmuwan mengatakan mendefinisikan kesadaran semakin mendesak seiring kemajuan AI dan neuroteknologi

AI sering merekomendasikan serangan nuklir dalam simulasi perang

OpenAI meluncurkan model bahasa besar yang disetel untuk biologi, GPT-Rosalind

Sistem kuantum menunjukkan memori tergantung pada perspektif, temuan ilmuwan

Cortical Labs akan membangun pusat data biologis di Melbourne dan Singapura

Studi menunjukkan koordinasi jaringan seluruh otak sebagai fitur kunci kecerdasan umum

Sel-sel otak manusia di chip belajar main Doom dalam seminggu

Studi menunjukkan AI dapat mengidentifikasi pengguna online dari postingan

AI generatif mengungguli tim manusia dalam menganalisis data medis

Bayi dua bulan mengkategorikan objek lebih awal dari perkiraan

Hacker menggunakan LLM untuk membangun serangan phishing generasi berikutnya

Situs web ini menggunakan cookie