Les modèles d’IA surpassent les scores de coupure au test PAES 2026 du Chili

Une étude appliquant l’examen d’entrée à l’université chilien, PAES 2026, aux modèles d’IA montre que plusieurs systèmes obtiennent des scores suffisamment élevés pour des programmes sélectifs comme la médecine et l’ingénierie civile. Gemini de Google a mené avec des moyennes proches de 950 points, surpassant des rivaux comme ChatGPT. L’expérience souligne les progrès de l’IA et soulève des questions sur l’efficacité des tests standardisés.

Une étude du professeur Jonathan Vásquez, Ph.D. en informatique de l’Université de Valparaíso, et de Sebastián Cisterna, MBA de Harvard et professeur à l’Universidad Adolfo Ibáñez, a évalué les performances des modèles d’IA sur le PAES 2026. Les chercheurs ont simulé des réponses aux tests officiels, déterminant les carrières accessibles comme s’ils étaient de vrais candidats. Google a mené avec Gemini 3 Flash, en moyenne 957,38 points et 1 000 en Histoire et sciences sociales, Biologie, Physique, Compétence de lecture et Compétence en mathématiques 1. Sa version Pro a fait en moyenne près de 950 points, se qualifiant pour n’importe quelle carrière dans les universités chiliennes. « Gemini a surpassé » ChatGPT, ont noté les auteurs, les modèles plus légers montrant une maturité inattendue. Tous les modèles ont obtenu 100 % en Histoire et sciences sociales, un standard exceptionnel en 2025. Le GPT-5.2 Extended Reasoning d’OpenAI a bien performé en Langue et Sciences, accédant à des domaines comme le Journalisme ou la Psychologie, mais a été à la traîne en Mathématiques M2 pour les ingénieries complexes. GPT-5.2 Instant convenait aux sciences sociales et à l’éducation. Le modèle chinois DeepSeek a excellé en efficacité coût : jusqu’à 14 fois moins cher en versions rapides et 30 en modes de raisonnement, avec une moyenne de 880 points pour des programmes comme Pédagogie ou Soins infirmiers, mais pas les premières places en Médecine. Cisterna a observé que les modes « plus de raisonnement » n’ont pas toujours surpassé les plus rapides, contredisant les attentes. Les auteurs insistent sur le fait que les IA optimisent les données antérieures, sans « apprendre » comme les humains, remettant en question la capacité des tests à mesurer les compétences humaines à l’ère de l’automatisation : « La question n’est plus seulement quelle carrière une IA pourrait étudier, mais dans quelle mesure les métriques de sélection actuelles reflètent les compétences humaines attendues ».

Articles connexes

Chilean students celebrate PAES 2025 results in a lab, with charts showing score rises in all tests except sciences.
Image générée par IA

PAES 2025 enregistre des hausses de scores dans toutes les épreuves sauf en sciences

Rapporté par l'IA Image générée par IA

Ce lundi, les résultats de la Prueba de Acceso a la Educación Superior (PAES) pour l'admission 2026 ont été publiés, montrant une augmentation générale des moyennes des épreuves obligatoires de 10 points, de 610 à 620. Toutes les évaluations ont progressé sauf Sciences, qui a chuté de 487 à 473. Par ailleurs, 2 861 scores nationaux ont été enregistrés, près de mille de plus qu'l'an dernier.

L’examen d’entrée universitaire récent au Chili (PAES) a provoqué un débat sur le nombre élevé de notes parfaites en Mathématiques 1, avec 2 861 étudiants obtenant 1 000 points. Les experts soulignent les progrès en équité mais avertissent des limites pour distinguer les niveaux de performance. Le système vise à équilibrer la sélection et la reconnaissance des talents divers.

Rapporté par l'IA

Dans une évaluation comparative de modèles d'IA leaders, le Gemini 3.2 Fast de Google a démontré des forces en précision factuelle sur le ChatGPT 5.2 d'OpenAI, particulièrement dans les tâches informationnelles. Les tests, motivés par le partenariat d'Apple avec Google pour améliorer Siri, mettent en lumière l'évolution des capacités de l'IA générative depuis 2023. Bien que les résultats fussent serrés, Gemini a évité des erreurs significatives qui ont miné la fiabilité de ChatGPT.

OpenAI réoriente ses ressources vers l'amélioration de son chatbot vedette ChatGPT, entraînant le départ de plusieurs chercheurs seniors. L'entreprise de San Francisco fait face à une concurrence intense de Google et Anthropic, provoquant un pivot stratégique loin de la recherche à long terme. Ce changement soulève des inquiétudes sur l'avenir de l'exploration innovante de l'IA au sein de la firme.

Rapporté par l'IA

A recent Ascun study shows artificial intelligence is now a reality in Colombian higher education, but most institutions lack policies and structures for its regulation. While 88.5% of students use it for assignments, only 55.2% of higher education institutions have AI guidelines. Public policy lags behind, creating gaps in equity and educational quality.

Une expérience de CNET a comparé les modèles Gemini 3 Pro et Gemini 2.5 Flash de Google pour le vibe coding, une approche décontractée pour générer du code via chat IA. Le modèle de réflexion s'est avéré plus facile et plus complet, tandis que le modèle rapide a requis plus d'interventions manuelles. Les résultats suggèrent que le choix du modèle affecte significativement l'expérience de développement.

Rapporté par l'IA

Google a lancé une fonctionnalité expérimentale « Personal Intelligence » pour son Mode IA dans Recherche, permettant aux utilisateurs de connecter Gmail et Google Photos pour des réponses plus adaptées. Cet outil opt-in, propulsé par Gemini 3, vise à rendre les résultats de recherche plus pertinents en s'appuyant sur des données personnelles sans entraîner les modèles sur des boîtes de réception complètes. Il est déployé en premier pour les abonnés payants aux États-Unis.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser