فشل روبوتات الدردشة بالذكاء الاصطناعي في 60% من استفسارات صحة المرأة العاجلة

نماذج الذكاء الاصطناعي الشائعة الاستخدام، بما في ذلك ChatGPT وGemini، غالباً ما تفشل في تقديم نصائح كافية لقضايا صحة المرأة العاجلة، وفقاً لاختبار معيار جديد. وجد الباحثون أن 60% من الردود على الاستفسارات المتخصصة كانت غير كافية، مما يبرز التحيزات في بيانات تدريب الذكاء الاصطناعي. يدعو الدراسة إلى تحسين المحتوى الطبي لسد هذه الفجوات.

قام فريق مكون من 17 باحثاً في صحة المرأة وصيادلة وأطباء من الولايات المتحدة وأوروبا بإنشاء 345 استفساراً طبياً عبر تخصصات مثل الطب الطارئ والنسائية وعلم الأعصاب. تم اختبار هذه الاستفسارات على 13 نموذجاً كبيراً للغة من شركات مثل OpenAI وGoogle وAnthropic وMistral AI وxAI. راجع الخبراء ردود الذكاء الاصطناعي، وحددوا الإخفاقات وأعدوا معياراً يتكون من 96 استفساراً. بشكل عام، فشلت النماذج في تقديم نصيحة طبية كافية لـ60% من هذه الأسئلة. حقق GPT-5 أفضل أداء بنسبة فشل 47%، بينما سجل Ministral 8B أعلى معدل عند 73%. قالت فيكتوريا-إليزابيث غروبر، عضو في الفريق في Lumos AI، إن الدافع وراء الدراسة: «رأيت المزيد والمزيد من النساء في دائرتي الخاصة يلجأن إلى أدوات الذكاء الاصطناعي لأسئلة الصحة ودعم القرارات». سلطت الضوء على المخاطر الناتجة عن وراثة الذكاء الاصطناعي لفجوات النوع الاجتماعي في المعرفة الطبية، وفوجئت بالتباين في أداء النماذج. شرحت كارا تاننباوم من جامعة مونتريال أن نماذج الذكاء الاصطناعي تُدرب على بيانات تاريخية تحتوي على تحيزات مدمجة، داعية إلى تحديث مصادر الصحة عبر الإنترنت بمعلومات صريحة تتعلق بالجنس والنوع الاجتماعي. ومع ذلك، حذر جوناثان إتش. تشين من جامعة ستانفورد من أن الرقم 60% قد يكون مضللاً، حيث كانت العينة محدودة ومصممة من قبل خبراء، غير ممثلة للاستفسارات النموذجية. أشار إلى سيناريوهات محافظة، مثل توقع الاشتباه الفوري في تسمم الحمل لآلام الرأس بعد الولادة. اعترفت غروبر بهذه النقاط، مشددة على أن المعيار يضع معياراً صارماً مبنياً على أساس سريري: «هدفنا لم يكن الادعاء بأن النماذج غير آمنة بشكل عام، بل تحديد معيار واضح مبني على أساس سريري للتقييم». رد متحدث باسم OpenAI بأن ChatGPT مصمم لدعم الرعاية الطبية لا استبدالها، وأن نموذجهم الأحدث GPT 5.2 يأخذ بعين الاعتبار السياق مثل الجنس بشكل أفضل. لم تعلق الشركات الأخرى. تؤكد النتائج، المنشورة على arXiv (DOI: arXiv:2512.17028)، على الحاجة إلى استخدام الذكاء الاصطناعي بحذر في الرعاية الصحية.

مقالات ذات صلة

Illustration depicting OpenAI's ChatGPT-5.2 launch, showing professionals using the AI to enhance workplace productivity amid rivalry with Google's Gemini.
صورة مولدة بواسطة الذكاء الاصطناعي

OpenAI تُطلق ChatGPT-5.2 لتعزيز إنتاجية العمل

من إعداد الذكاء الاصطناعي صورة مولدة بواسطة الذكاء الاصطناعي

أطلقت OpenAI نموذج ChatGPT-5.2، وهي عائلة جديدة من نماذج الذكاء الاصطناعي مصممة لتعزيز الاستدلال والإنتاجية، خاصة في المهام المهنية. يأتي الإصدار بعد تنبيه داخلي من الرئيس التنفيذي سام ألتمان بشأن المنافسة من Gemini 3 التابع لجوجل. تشمل التحديث ثلاثة إصدارات موجهة لاحتياجات مستخدمين مختلفة، بدءًا من المشتركين المدفوعين.

في تقييم مقارن لنماذج الذكاء الاصطناعي الرائدة، أظهر جيميناي 3.2 فاست من جوجل تفوقاً في الدقة الواقعية على شات جي بي تي 5.2 من أوبن إيه آي، خاصة في المهام المعلوماتية. أبرزت الاختبارات، التي دفعها الشراكة بين أبل وجوجل لتعزيز سيري، التطورات في قدرات الذكاء الاصطناعي التوليدي منذ 2023. رغم قرب النتائج، تجنب جيميناي الأخطاء الكبيرة التي أضعفت موثوقية شات جي بي تي.

من إعداد الذكاء الاصطناعي

A study applying Chile's university entrance exam, PAES 2026, to AI models shows several systems scoring high enough for selective programs like Medicine and Civil Engineering. Google's Gemini led with averages near 950 points, outperforming rivals like ChatGPT. The experiment underscores AI progress and raises questions about standardized testing efficacy.

يستخدم بعض مستخدمي روبوتات الدردشة بالذكاء الاصطناعي من Google وOpenAI لإنشاء صور ديبفيك تغير صور نساء مرتديات ملابس كاملة لإظهارهن ببيكيني. تحدث هذه التعديلات غالباً بدون موافقة النساء، وتُشارك التعليمات للعملية بين المستخدمين. تبرز النشاط مخاطر أدوات الذكاء الاصطناعي التوليدية.

من إعداد الذكاء الاصطناعي

تقرير حديث يسلط الضوء على مخاطر خطيرة مرتبطة بروبوتات الدردشة بالذكاء الاصطناعي المدمجة في ألعاب الأطفال، بما في ذلك محادثات غير لائقة وجمع بيانات. تم العثور على ألعاب مثل كوما من فولوتوي وبو الدب القصصي بالذكاء الاصطناعي تشرك الأطفال في مناقشات حول مواضيع حساسة. توصي السلطات بالالتزام بالألعاب التقليدية لتجنب الضرر المحتمل.

بناءً على ترقية صور ChatGPT أمس، تفصّل OpenAI نموذج GPT Image 1.5 متعدد الوسائط الذي يمكّن من تحرير صور حواري دقيق. يرد على المنافسين مثل Nano Banana من Google مع إدخال ضمانات ضد الاستخدام السيء.

من إعداد الذكاء الاصطناعي

يكشف تقرير جديد من OpenAI أنه رغم الارتفاع الحاد في تبني الذكاء الاصطناعي في الشركات، يوفر معظم العمال فقط من 40 إلى 60 دقيقة يوميًا. تأتي النتائج من بيانات أكثر من مليون عميل واستطلاع لـ9000 موظف. رغم الفوائد في سرعة المهام والقدرات الجديدة، تظل المكاسب في الإنتاجية متواضعة للمستخدم العادي.

 

 

 

يستخدم هذا الموقع ملفات تعريف الارتباط

نستخدم ملفات تعريف الارتباط للتحليلات لتحسين موقعنا. اقرأ سياسة الخصوصية الخاصة بنا سياسة الخصوصية لمزيد من المعلومات.
رفض