HLE – Humanity’s Last Exam

(HLE) est un benchmark académique multimodal extrêmement difficile, conçu pour mesurer les capacités les plus avancées des grands modèles de langage. Il contient 2 500 questions expertes dans plus de 100 disciplines et se concentre sur la précision factuelle, le raisonnement et la calibration du modèle. C’est un test de niveau “pré-AGI”, mais ne constitue pas une preuve d’intelligence générale.

Niveau

intermediaire

Vous cherchez un autre mot ? Essayez la recherche rapide ci-dessous :

Partager cette page