KI-Modelle übertreffen Schnittwerte im chilenischen PAES-2026-Test

Eine Studie, die den chilenischen Universitätszugangstest PAES 2026 auf KI-Modelle anwendet, zeigt, dass mehrere Systeme Punkte hoch genug für selektive Programme wie Medizin und Bauingenieurwesen erzielen. Googles Gemini führte mit Durchschnitten nahe 950 Punkten an, übertraf Rivalen wie ChatGPT. Das Experiment unterstreicht den KI-Fortschritt und wirft Fragen zur Wirksamkeit standardisierter Tests auf.

Eine Studie von Professor Jonathan Vásquez, Ph.D. in Informatik von der Universität Valparaíso, und Sebastián Cisterna, MBA von Harvard und Professor an der Universidad Adolfo Ibáñez, bewertete die Leistung von KI-Modellen beim PAES 2026. Die Forscher simulierten Antworten auf offizielle Tests und bestimmten zugängliche Studiengänge, als wären sie echte Bewerber. Google führte mit Gemini 3 Flash an, im Durchschnitt 957,38 Punkte und 1.000 in Geschichte und Sozialwissenschaften, Biologie, Physik, Lesekompetenz und Mathematikkompetenz 1. Die Pro-Version schnitt mit nahezu 950 Punkten ab und qualifizierte sich für jeden Studiengang an chilenischen Universitäten. „Gemini hat“ ChatGPT „übertroffen“, notierten die Autoren, wobei leichtere Modelle unerwartete Reife zeigten. Alle Modelle erreichten 100 % in Geschichte und Sozialwissenschaften, ein Maßstab, der 2025 außergewöhnlich war. OpenAIs GPT-5.2 Extended Reasoning schnitt gut in Sprache und Naturwissenschaften ab, ermöglichte Zugang zu Bereichen wie Journalismus oder Psychologie, blieb aber bei Mathematik M2 für komplexe Ingenieurwissenschaften zurück. GPT-5.2 Instant eignete sich für Sozialwissenschaften und Bildung. Das chinesische Modell DeepSeek überzeugte bei Kosteneffizienz: bis zu 14-mal günstiger in schnellen Versionen und 30-mal im Reasoning-Modus, mit einem 880-Punkte-Durchschnitt für Programme wie Pädagogik oder Pflege, jedoch nicht für Spitzenplätze in der Medizin. Cisterna stellte fest, dass Modi mit „mehr Reasoning“ nicht immer die schnelleren übertrafen und damit Erwartungen enttäuschten. Die Autoren betonen, dass KIs frühere Daten optimieren, nicht wie Menschen „lernen“, und bezweifeln die Eignung der Tests, menschliche Fähigkeiten in der Automatisierungsära zu erfassen: „Die Frage lautet nicht mehr nur, welchen Studiengang eine KI studieren könnte, sondern wie gut aktuelle Auswahlkriterien die erwarteten menschlichen Kompetenzen widerspiegeln“.

Verwandte Artikel

Chilean students celebrate PAES 2025 results in a lab, with charts showing score rises in all tests except sciences.
Bild generiert von KI

PAES 2025 verzeichnet Punktestiege bei allen Tests außer Naturwissenschaften

Von KI berichtet Bild generiert von KI

Heute Montag wurden die Ergebnisse der Prueba de Acceso a la Educación Superior (PAES) für die Zulassung 2026 veröffentlicht, die einen allgemeinen Anstieg der Durchschnitte der Pflichttests um 10 Punkte von 610 auf 620 zeigen. Alle Bewertungen stiegen außer Naturwissenschaften, die von 487 auf 473 fielen. Zudem gab es 2.861 nationale Höchstnoten, fast tausend mehr als im Vorjahr.

Die kürzliche Universitätszulassungsprüfung (PAES) in Chile hat eine Debatte über die hohe Anzahl perfekter Ergebnisse in Mathematik 1 ausgelöst, mit 2.861 Studierenden, die 1.000 Punkte erreichten. Experten heben Fortschritte bei der Gleichheit hervor, warnen aber vor Einschränkungen bei der Unterscheidung von Leistungsniveaus. Das System zielt darauf ab, Auswahl und Anerkennung vielfältiger Talente auszugleichen.

Von KI berichtet

In a comparative evaluation of leading AI models, Google's Gemini 3.2 Fast demonstrated strengths in factual accuracy over OpenAI's ChatGPT 5.2, particularly in informational tasks. The tests, prompted by Apple's partnership with Google to enhance Siri, highlight evolving capabilities in generative AI since 2023. While results were close, Gemini avoided significant errors that undermined ChatGPT's reliability.

OpenAI is shifting resources toward improving its flagship chatbot ChatGPT, leading to the departure of several senior researchers. The San Francisco company faces intense competition from Google and Anthropic, prompting a strategic pivot from long-term research. This change has raised concerns about the future of innovative AI exploration at the firm.

Von KI berichtet

A recent Ascun study shows artificial intelligence is now a reality in Colombian higher education, but most institutions lack policies and structures for its regulation. While 88.5% of students use it for assignments, only 55.2% of higher education institutions have AI guidelines. Public policy lags behind, creating gaps in equity and educational quality.

A CNET experiment compared Google's Gemini 3 Pro and Gemini 2.5 Flash models for vibe coding, a casual approach to generating code via AI chat. The thinking model proved easier and more comprehensive, while the fast model required more manual intervention. Results suggest the choice of model significantly affects the development experience.

Von KI berichtet

Google has launched an experimental 'Personal Intelligence' feature for its AI Mode in Search, allowing users to connect Gmail and Google Photos for more tailored responses. The opt-in tool, powered by Gemini 3, aims to make search results more relevant by drawing on personal data without training models on full inboxes. It rolls out first to paid subscribers in the US.

Montag, 02. Februar 2026, 00:15 Uhr

Google expands Genie 3 access to AI Ultra subscribers

Mittwoch, 28. Januar 2026, 11:16 Uhr

Chinese AI advances in geometry at top US maths Olympiad

Dienstag, 27. Januar 2026, 03:25 Uhr

Google upgrades AI overviews to Gemini 3 model

Mittwoch, 07. Januar 2026, 07:47 Uhr

AI chatbots fail on 60 percent of urgent women's health queries

Mittwoch, 07. Januar 2026, 07:17 Uhr

2026 predicted as year of world models in AI

Montag, 05. Januar 2026, 01:58 Uhr

PAES-Ergebnisse veröffentlicht und Universitätsbewerbungen für Aufnahme 2026 beginnen

Mittwoch, 24. Dezember 2025, 10:12 Uhr

AI boosts scientific productivity but erodes paper quality

Freitag, 12. Dezember 2025, 05:25 Uhr

Pentagon launches Gemini-based AI platform

Donnerstag, 11. Dezember 2025, 06:12 Uhr

OpenAI releases ChatGPT-5.2 to boost work productivity

Dienstag, 18. November 2025, 13:57 Uhr

Google unveils Gemini 3 AI model and Antigravity IDE

 

 

 

Diese Website verwendet Cookies

Wir verwenden Cookies für Analysen, um unsere Website zu verbessern. Lesen Sie unsere Datenschutzrichtlinie für weitere Informationen.
Ablehnen