أطلقت شركة OpenAI نموذج GPT-Rosalind، وهو نموذج لغوي ضخم تم تدريبه خصيصاً على سير عمل الأبحاث البيولوجية. يهدف النموذج، الذي سُمي تيمناً بالعالمة روزاليند فرانكلين، إلى معالجة التحديات المتعلقة بالتعامل مع البيانات البيولوجية الضخمة والمجالات الفرعية المتخصصة. ويقتصر الوصول إلى النموذج حالياً على الكيانات الموجودة داخل الولايات المتحدة بسبب مخاوف تتعلق بالسلامة.
أعلنت شركة OpenAI يوم الخميس عن نموذج GPT-Rosalind، مميزة إياه عن النماذج الأخرى الموجهة للأغراض العلمية العامة التي طورتها شركات تقنية أخرى. يستهدف هذا النموذج العقبات الرئيسية في الأبحاث البيولوجية، بما في ذلك الحجم الهائل للبيانات الناتجة عن تسلسل الجينوم والكيمياء الحيوية للبروتينات، بالإضافة إلى المصطلحات المعقدة في مجالات فرعية مثل علم الوراثة وعلم الأعصاب. وأوضحت يون يون وانغ، رئيسة منتجات علوم الحياة في OpenAI، هذه التحديات خلال مؤتمر صحفي، وفقاً لما ذكره موقع Ars Technica. وشرحت وانغ أن أخصائي الوراثة الذي يدرس الجينات المرتبطة بالدماغ قد يجد صعوبة في التعامل مع الأدبيات المتعلقة بعلم الأعصاب دون وجود أدوات متخصصة. وقد تم تدريب النظام على 50 من مسارات العمل البيولوجية الشائعة وطرق الوصول إلى قواعد البيانات العامة، حيث يمكنه اقتراح مسارات بيولوجية، وتحديد أولويات أهداف الأدوية، وربط النمط الجيني بالنمط الظاهري عبر آليات معروفة. وقالت وانغ: "نحن نربط النمط الجيني بالنمط الظاهري من خلال المسارات المعروفة والآليات التنظيمية، ونستنتج الخصائص الهيكلية أو الوظيفية المحتملة للبروتينات، ونستفيد حقاً من هذا الفهم الميكانيكي". وقامت OpenAI بضبط GPT-Rosalind ليكون أكثر تشكيكاً، وذلك لمواجهة ميل النماذج اللغوية الضخمة الأخرى إلى الموافقة التلقائية. وتصف الشركة قدراتها في الاستنتاج بأنها تتعامل مع عمليات معقدة متعددة الخطوات، وبأن مهاراتها تصل إلى مستوى الخبراء بناءً على الاختبارات القياسية، ومع ذلك، لا تزال هناك مخاوف بشأن احتمالية حدوث هلوسة معلوماتية. ويقتصر الوصول إلى النموذج عبر هيكل نشر موثوق للكيانات الأمريكية فقط، وذلك بسبب مخاطر مثل احتمالية استخدامه في تحسين معدل عدوى الفيروسات، بينما ستتوفر إضافة محدودة لأبحاث علوم الحياة للجمهور قريباً.