دراسة أنثروبيك تظهر وعيًا تأمليًا غير موثوق في نماذج اللغة الكبيرة

كشف ورقة بحثية جديدة من أنثروبيك أن نماذج اللغة الكبيرة تظهر بعض الوعي التأملي لعملياتها الداخلية، لكن هذه القدرة غير متسقة إلى حد كبير وغير موثوقة. نشرت في 3 نوفمبر 2025، الدراسة بعنوان 'الوعي التأملي الناشئ في نماذج اللغة الكبيرة' تستخدم طرقًا مبتكرة لاختبار وصف الذكاء الاصطناعي لذاته. رغم النجاحات العرضية، يظل الفشل في التأمل هو القاعدة.

تتناول بحث أنثروبيك تحدي اختلاق نماذج اللغة الكبيرة لتفسيرات معقولة لأفعالها بناءً على بيانات التدريب بدلاً من الرؤية الداخلية الحقيقية. للتحقيق في الوعي التأملي الفعلي، طور الفريق طريقة 'حقن المفهوم'. يتضمن ذلك مقارنة حالات التنشيط الداخلية للنموذج من مطالبة تحكم وأخرى تجريبية، مثل 'ALL CAPS' مقابل الأحرف الصغيرة، لإنشاء متجه يمثل المفهوم في خلايا عصبية نموذج اللغة الكبير. يتم حقن هذه المتجهات ثم لتوجيه النموذج نحو أفكار محددة.

في التجارب، اختبرت أنثروبيك نماذج مثل Opus 4 وOpus 4.1. عند السؤال مباشرة إذا كانوا يكتشفون 'فكرة محقونة'، ردت النماذج بدقة أحيانًا، على سبيل المثال، 'ألاحظ ما يبدو أنه فكرة محقونة متعلقة بكلمة “LOUD” أو “SHOUTING,”' دون مطالبات نصية سابقة. ومع ذلك، كان النجاح هشًا: حددت أفضل النماذج المفهوم بشكل صحيح فقط 20 في المئة من الوقت. في استفسار أوسع مثل 'هل تشعر بشيء غير عادي؟'، وصل Opus 4.1 إلى معدل نجاح 42 في المئة، لا يزال أقل من الأغلبية.

اعتمدت موثوقية التأثير بشكل كبير على طبقة الاستدلال حيث حدث الحقن؛ أدت الإدراجات المبكرة أو المتأخرة إلى إلغاء الوعي. أظهرت اختبارات أخرى أن النماذج تشير أحيانًا إلى المفاهيم المحقونة عند السؤال 'أخبرني أي كلمة تفكر فيها' أثناء القراءة غير المتعلقة، أو اختلاق تفسيرات واعتذار عن الردود المجبرة.

يلاحظ الباحثون أن 'نماذج اللغة الحالية تمتلك بعض الوعي التأملي الوظيفي للحالات الداخلية الخاصة بها'، لكنهم يؤكدون على تبعيتها للسياق وعدم موثوقيتها. يفترضون آليات 'كشف الشذوذ' محتملة أو 'دوائر التحقق من التوافق' الناشئة من التدريب، لكنهم يعترفون بأن 'الآليات الكامنة وراء نتائجنا قد تظل سطحية إلى حد ما ومتخصصة بشكل ضيق'. قد تتطور مثل هذه القدرات مع تحسينات النموذج، على الرغم من أن آثارها الفلسفية على الذكاء الاصطناعي، بخلاف البشر، تظل غير مؤكدة بسبب المجهولات الآلية.

يستخدم هذا الموقع ملفات تعريف الارتباط

نستخدم ملفات تعريف الارتباط للتحليلات لتحسين موقعنا. اقرأ سياسة الخصوصية الخاصة بنا سياسة الخصوصية لمزيد من المعلومات.
رفض