تكشف دراسة جديدة أن نشاط الخلايا العصبية في مناطق اللغة الرئيسية يتكشف مع مرور الوقت بطريقة تعكس الحسابات طبقة بطبقة داخل نماذج اللغة الكبيرة أثناء استماع الناس إلى قصة منطوقة. كما أصدر الباحثون، الذين حللوا تسجيلات الكورتيكوجرافيا الكهربائية من مرضى الصرع أثناء بودكاست لمدة 30 دقيقة، مجموعة بيانات مفتوحة المصدر تهدف إلى مساعدة العلماء الآخرين في اختبار النظريات المنافسة حول كيفية بناء المعنى في الدماغ.
أفاد العلماء بأدلة تشير إلى أن معالجة الدماغ للغة المنطوقة تتكشف في تسلسل يشبه عمليات الطبقات في نماذج اللغة الكبيرة الحديثة. نشرت البحوث في Nature Communications في 26 نوفمبر 2025، وقادها الدكتور أريل غولدشتاين من الجامعة العبرية في القدس، مع مساهمين بما في ذلك الدكتور ماريانو شاين من Google Research والأستاذ أوري هاسون وإريك هام من جامعة برينستون. ## تجربة الاستماع والتسجيلات العصبية حلل الفريق تسجيلات الكورتيكوجرافيا الكهربائية (ECoG) من تسعة مرضى صرع أثناء استماعهم إلى بودكاست صوتي لمدة 30 دقيقة، «Monkey in the Middle» (NPR، 2017). استخدم الباحثون نماذج للاستجابات العصبية لكل كلمة في القصة باستخدام تضمينات سياقية مستمدة من طبقات مخفية متعددة في نموذج GPT2-XL وLlama 2. ركزوا على عدة مناطق على طول مسار معالجة اللغة البطني، بما في ذلك مناطق في الجيروس الصدغي العلوي والجيروس الجبهي السفلي (الذي يشمل منطقة بروكا) وقطب الصدغ. ## مسار زمني طبقي للمعنى تكشف الدراسة أن استجابات الدماغ تطابقت مع التمثيلات الداخلية للنماذج في نمط مرتب زمنيًا: الإشارات العصبية المبكرة تتوافق بقوة أكبر مع الطبقات المبكرة في النموذج، بينما النشاط العصبي اللاحق يتوافق بشكل أقرب مع الطبقات الأعمق التي تدمج سياقًا أوسع. وُصفت الارتباط بأنه قوي بشكل خاص في مناطق اللغة ذات المستوى الأعلى مثل منطقة بروكا. «ما فاجأنا أكثر هو مدى قرب تطور المعنى الزمني في الدماغ من تسلسل التحولات داخل نماذج اللغة الكبيرة»، قال غولدشتاين، وفقًا لملخص أصدرته الجامعة العبرية في القدس. ## الآثار وإصدار البيانات تُقدم النتائج كتحدٍ للحسابات القائمة على القواعد الصارمة لفهم اللغة، مقترحة بدلاً من ذلك أن التمثيلات الإحصائية الحساسة للسياق قد تفسر النشاط العصبي في الوقت الفعلي بشكل أكثر فعالية من الوحدات اللغوية التقليدية مثل الفونيمات والمورفيمات. أصدر الباحثون أيضًا مجموعة بيانات عامة تهدف إلى دعم أعمال إضافية في علم الأعصاب اللغوي، بما في ذلك التسجيلات العصبية المحاذاة مع الخصائص اللغوية. منفصل عن تقرير Nature Communications، يصف وصف بيانات ذو صلة في مجلة Scientific Data مجموعة بيانات ECoG «بودكاست» من تسعة مشاركين مع 1330 قطبًا كهربائيًا يستمعون إلى نفس المنبه لمدة 30 دقيقة، بالإضافة إلى الخصائص المستخرجة التي تتراوح من المعلومات الصوتية إلى تضمينات نماذج اللغة الكبيرة ودروس تعليمية للتحليل.