AI models surpass cutoff scores in Chile's PAES 2026 test

A study applying Chile's university entrance exam, PAES 2026, to AI models shows several systems scoring high enough for selective programs like Medicine and Civil Engineering. Google's Gemini led with averages near 950 points, outperforming rivals like ChatGPT. The experiment underscores AI progress and raises questions about standardized testing efficacy.

A study by Professor Jonathan Vásquez, Ph.D. in Computer Science from the University of Valparaíso, and Sebastián Cisterna, MBA from Harvard and professor at Universidad Adolfo Ibáñez, assessed AI models' performance on the PAES 2026. The researchers simulated responses to official tests, determining accessible careers as if they were real applicants.

Google led with Gemini 3 Flash, averaging 957.38 points and scoring 1,000 in History and Social Sciences, Biology, Physics, Reading Competency, and Math Competency 1. Its Pro version averaged near 950 points, qualifying for any career in Chilean universities. 'Gemini surpassed' ChatGPT, the authors noted, with lighter models showing unexpected maturity.

All models achieved 100% in History and Social Sciences, a standard that was exceptional in 2025. OpenAI's GPT-5.2 Extended Reasoning performed well in Language and Sciences, accessing fields like Journalism or Psychology, but lagged in Math M2 for complex engineering. GPT-5.2 Instant suited social sciences and education.

Chinese model DeepSeek excelled in cost-efficiency: up to 14 times cheaper in fast versions and 30 in reasoning modes, with an 880-point average for programs like Pedagogy or Nursing, but not top Medicine spots.

Cisterna observed that 'more reasoning' modes didn't always outperform faster ones, challenging expectations. The authors stress AIs optimize prior data, not 'learn' like humans, questioning tests' ability to measure human skills in an automation era: 'The question is no longer just what career an AI could study, but how well current selection metrics reflect expected human competencies'.

مقالات ذات صلة

Chilean students celebrate PAES 2025 results in a lab, with charts showing score rises in all tests except sciences.
صورة مولدة بواسطة الذكاء الاصطناعي

Paes 2025 records score increases in all tests except sciences

من إعداد الذكاء الاصطناعي صورة مولدة بواسطة الذكاء الاصطناعي

This Monday, the results of the Prueba de Acceso a la Educación Superior (PAES) for the 2026 Admission were released, showing a general increase in the averages of the obligatory tests by 10 points, from 610 to 620. All evaluations rose except for Sciences, which fell from 487 to 473. Additionally, there were 2,861 national scores, nearly a thousand more than the previous year.

Chile's recent University Entrance Exam (PAES) has sparked debate over the high number of perfect scores in Math 1, with 2,861 students achieving 1,000 points. Experts highlight progress in equity but warn of limitations in distinguishing performance levels. The system aims to balance selection and recognition of diverse talents.

من إعداد الذكاء الاصطناعي

في تقييم مقارن لنماذج الذكاء الاصطناعي الرائدة، أظهر جيميناي 3.2 فاست من جوجل تفوقاً في الدقة الواقعية على شات جي بي تي 5.2 من أوبن إيه آي، خاصة في المهام المعلوماتية. أبرزت الاختبارات، التي دفعها الشراكة بين أبل وجوجل لتعزيز سيري، التطورات في قدرات الذكاء الاصطناعي التوليدي منذ 2023. رغم قرب النتائج، تجنب جيميناي الأخطاء الكبيرة التي أضعفت موثوقية شات جي بي تي.

تقوم OpenAI بتوجيه الموارد نحو تحسين روبوت الدردشة الرئيسي ChatGPT، مما أدى إلى رحيل عدة باحثين كبار. تواجه الشركة في سان فرانسيسكو منافسة شديدة من Google وAnthropic، مما يدفع إلى تحول استراتيجي من البحث طويل الأمد. أثار هذا التغيير مخاوف بشأن مستقبل استكشاف الذكاء الاصطناعي المبتكر في الشركة.

من إعداد الذكاء الاصطناعي

A recent Ascun study shows artificial intelligence is now a reality in Colombian higher education, but most institutions lack policies and structures for its regulation. While 88.5% of students use it for assignments, only 55.2% of higher education institutions have AI guidelines. Public policy lags behind, creating gaps in equity and educational quality.

قامت تجربة من CNET بمقارنة نموذجي جيميني 3 برو وجيميني 2.5 فلاش من جوجل لترميز الفايب، وهو نهج غير رسمي لتوليد الكود عبر الدردشة مع الذكاء الاصطناعي. أثبت النموذج التفكيري أنه أسهل وأكثر شمولاً، بينما تطلب النموذج السريع تدخلاً يدوياً أكثر. تشير النتائج إلى أن اختيار النموذج يؤثر بشكل كبير على تجربة التطوير.

من إعداد الذكاء الاصطناعي

أطلقت جوجل ميزة تجريبية تُدعى 'الذكاء الشخصي' لوضع الذكاء الاصطناعي في البحث، مما يسمح للمستخدمين بربط Gmail وGoogle Photos للحصول على ردود أكثر تخصيصًا. الأداة الاختيارية، المدعومة بـGemini 3، تهدف إلى جعل نتائج البحث أكثر صلة باستخدام البيانات الشخصية دون تدريب النماذج على صناديق الوارد الكاملة. تُطلق أولاً للمشتركين المدفوعين في الولايات المتحدة.

 

 

 

يستخدم هذا الموقع ملفات تعريف الارتباط

نستخدم ملفات تعريف الارتباط للتحليلات لتحسين موقعنا. اقرأ سياسة الخصوصية الخاصة بنا سياسة الخصوصية لمزيد من المعلومات.
رفض