Les modèles d’IA surpassent les scores de coupure au test PAES 2026 du Chili

8 janvier 2026

Rapporté par l'IA

Une étude appliquant l’examen d’entrée à l’université chilien, PAES 2026, aux modèles d’IA montre que plusieurs systèmes obtiennent des scores suffisamment élevés pour des programmes sélectifs comme la médecine et l’ingénierie civile. Gemini de Google a mené avec des moyennes proches de 950 points, surpassant des rivaux comme ChatGPT. L’expérience souligne les progrès de l’IA et soulève des questions sur l’efficacité des tests standardisés.

Une étude du professeur Jonathan Vásquez, Ph.D. en informatique de l’Université de Valparaíso, et de Sebastián Cisterna, MBA de Harvard et professeur à l’Universidad Adolfo Ibáñez, a évalué les performances des modèles d’IA sur le PAES 2026. Les chercheurs ont simulé des réponses aux tests officiels, déterminant les carrières accessibles comme s’ils étaient de vrais candidats. Google a mené avec Gemini 3 Flash, en moyenne 957,38 points et 1 000 en Histoire et sciences sociales, Biologie, Physique, Compétence de lecture et Compétence en mathématiques 1. Sa version Pro a fait en moyenne près de 950 points, se qualifiant pour n’importe quelle carrière dans les universités chiliennes. « Gemini a surpassé » ChatGPT, ont noté les auteurs, les modèles plus légers montrant une maturité inattendue. Tous les modèles ont obtenu 100 % en Histoire et sciences sociales, un standard exceptionnel en 2025. Le GPT-5.2 Extended Reasoning d’OpenAI a bien performé en Langue et Sciences, accédant à des domaines comme le Journalisme ou la Psychologie, mais a été à la traîne en Mathématiques M2 pour les ingénieries complexes. GPT-5.2 Instant convenait aux sciences sociales et à l’éducation. Le modèle chinois DeepSeek a excellé en efficacité coût : jusqu’à 14 fois moins cher en versions rapides et 30 en modes de raisonnement, avec une moyenne de 880 points pour des programmes comme Pédagogie ou Soins infirmiers, mais pas les premières places en Médecine. Cisterna a observé que les modes « plus de raisonnement » n’ont pas toujours surpassé les plus rapides, contredisant les attentes. Les auteurs insistent sur le fait que les IA optimisent les données antérieures, sans « apprendre » comme les humains, remettant en question la capacité des tests à mesurer les compétences humaines à l’ère de l’automatisation : « La question n’est plus seulement quelle carrière une IA pourrait étudier, mais dans quelle mesure les métriques de sélection actuelles reflètent les compétences humaines attendues ».

Articles connexes

Chilean students celebrate PAES 2025 results in a lab, with charts showing score rises in all tests except sciences.

PAES 2025 enregistre des hausses de scores dans toutes les épreuves sauf en sciences

5 janvier 2026 Rapporté par l'IA Image générée par IA

Ce lundi, les résultats de la Prueba de Acceso a la Educación Superior (PAES) pour l'admission 2026 ont été publiés, montrant une augmentation générale des moyennes des épreuves obligatoires de 10 points, de 610 à 620. Toutes les évaluations ont progressé sauf Sciences, qui a chuté de 487 à 473. Par ailleurs, 2 861 scores nationaux ont été enregistrés, près de mille de plus qu'l'an dernier.

Débat sur les résultats de la PAES suscite des opinions divisées

L’examen d’entrée universitaire récent au Chili (PAES) a provoqué un débat sur le nombre élevé de notes parfaites en Mathématiques 1, avec 2 861 étudiants obtenant 1 000 points. Les experts soulignent les progrès en équité mais avertissent des limites pour distinguer les niveaux de performance. Le système vise à équilibrer la sélection et la reconnaissance des talents divers.

Le Gemini de Google surpasse ChatGPT dans des tests IA clés

21 janvier 2026 Rapporté par l'IA

Dans une évaluation comparative de modèles d'IA leaders, le Gemini 3.2 Fast de Google a démontré des forces en précision factuelle sur le ChatGPT 5.2 d'OpenAI, particulièrement dans les tâches informationnelles. Les tests, motivés par le partenariat d'Apple avec Google pour améliorer Siri, mettent en lumière l'évolution des capacités de l'IA générative depuis 2023. Bien que les résultats fussent serrés, Gemini a évité des erreurs significatives qui ont miné la fiabilité de ChatGPT.

Amérique

Seulement une école publique dans le top 100 des résultats PAES

Technologie

Les modèles d’IA risquent de promouvoir des expériences de laboratoire dangereuses

Technologie

Des mathématiciens amateurs résolvent des problèmes d'Erdős avec l'aide de l'IA

Cadres supérieurs d'OpenAI partent au milieu du focus sur ChatGPT

OpenAI réoriente ses ressources vers l'amélioration de son chatbot vedette ChatGPT, entraînant le départ de plusieurs chercheurs seniors. L'entreprise de San Francisco fait face à une concurrence intense de Google et Anthropic, provoquant un pivot stratégique loin de la recherche à long terme. Ce changement soulève des inquiétudes sur l'avenir de l'exploration innovante de l'IA au sein de la firme.

AI in Colombian higher education outpaces public policy

13 décembre 2025 Rapporté par l'IA

A recent Ascun study shows artificial intelligence is now a reality in Colombian higher education, but most institutions lack policies and structures for its regulation. While 88.5% of students use it for assignments, only 55.2% of higher education institutions have AI guidelines. Public policy lags behind, creating gaps in equity and educational quality.

Tests des modèles Gemini mettent en lumière les différences en vibe coding

Une expérience de CNET a comparé les modèles Gemini 3 Pro et Gemini 2.5 Flash de Google pour le vibe coding, une approche décontractée pour générer du code via chat IA. Le modèle de réflexion s'est avéré plus facile et plus complet, tandis que le modèle rapide a requis plus d'interventions manuelles. Les résultats suggèrent que le choix du modèle affecte significativement l'expérience de développement.

Google ajoute une intelligence personnelle au mode IA dans la recherche

22 janvier 2026 Rapporté par l'IA

Google a lancé une fonctionnalité expérimentale « Personal Intelligence » pour son Mode IA dans Recherche, permettant aux utilisateurs de connecter Gmail et Google Photos pour des réponses plus adaptées. Cet outil opt-in, propulsé par Gemini 3, vise à rendre les résultats de recherche plus pertinents en s'appuyant sur des données personnelles sans entraîner les modèles sur des boîtes de réception complètes. Il est déployé en premier pour les abonnés payants aux États-Unis.

lundi 02 février 2026 00h15

Les modèles d’IA surpassent les scores de coupure au test PAES 2026 du Chili

Articles connexes

PAES 2025 enregistre des hausses de scores dans toutes les épreuves sauf en sciences

Débat sur les résultats de la PAES suscite des opinions divisées

Le Gemini de Google surpasse ChatGPT dans des tests IA clés

Seulement une école publique dans le top 100 des résultats PAES

Les modèles d’IA risquent de promouvoir des expériences de laboratoire dangereuses

Des mathématiciens amateurs résolvent des problèmes d'Erdős avec l'aide de l'IA

Cadres supérieurs d'OpenAI partent au milieu du focus sur ChatGPT

AI in Colombian higher education outpaces public policy

Tests des modèles Gemini mettent en lumière les différences en vibe coding

Google ajoute une intelligence personnelle au mode IA dans la recherche

Google étend l'accès à Genie 3 aux abonnés AI Ultra

Chinese AI advances in geometry at top US maths Olympiad

Google met à niveau les résumés IA vers le modèle Gemini 3

Les chatbots d'IA échouent sur 60 % des requêtes urgentes en santé des femmes

2026 prédit comme l’année des modèles du monde en IA

Publication des résultats PAES et début des candidatures universitaires pour l’admission 2026

L’IA booste la productivité scientifique mais érode la qualité des articles

Pentagone lance une plateforme d’IA basée sur Gemini

OpenAI lance ChatGPT-5.2 pour booster la productivité au travail

Google dévoile le modèle d'IA Gemini 3 et l'IDE Antigravity

Ce site utilise des cookies