Come facciamo a sapere se una intelligenza artificiale ha davvero raggiunto, o addirittura superato, l’intelligenza umana?
Per anni, filosofi, scienziati e ingegneri si sono interrogati su quale sia il vero metro di paragone tra cervello umano e macchina. Oggi, una risposta innovativa arriva da un progetto internazionale che sta facendo discutere: l’Ultimo Esame dell’Umanità.
Che cos’è l’Ultimo Esame dell’Umanità?
L’Ultimo Esame dell’Umanità (Humanity’s Last Exam) è una sfida senza precedenti: una sorta di “super-esame” pensato per mettere alla prova le intelligenze artificiali avanzate su tutte le conoscenze umane, senza lasciare spazio a dubbi, interpretazioni o scorciatoie.
Il progetto nasce da una domanda fondamentale:
Se un’AI può sembrare intelligente in una conversazione, come possiamo essere certi che sia davvero intelligente?
Per rispondere, il Center for AI Safety (CAIS) e Scale AI hanno coinvolto centinaia di esperti in ogni campo dello scibile umano: matematica, fisica, biologia, storia, medicina, letteratura, informatica e molto altro.
A ciascun esperto è stato chiesto di proporre le domande più difficili e rappresentative della propria disciplina, ma con una condizione chiave:
la risposta doveva essere certa, univoca e indiscutibile.
Come funziona questo test?
Le domande raccolte sono state sottoposte ai modelli di intelligenza artificiale più avanzati disponibili oggi.
Queste domande non sono aperte o filosofiche, ma esigono risposte oggettive, misurabili e precise.
Le AI che rispondono correttamente a domande di questo tipo in ogni campo del sapere dimostrano di possedere una conoscenza realmente comparabile a quella degli esseri umani più competenti.
Perché è così importante?
Per decenni, l’asticella per “misurare” l’intelligenza delle macchine è stata il Test di Turing: se una AI riesce a “ingannare” un essere umano in una conversazione, allora può essere considerata intelligente.
Ma la storia recente ci ha insegnato che imitare il linguaggio umano non è la stessa cosa che comprendere o conoscere davvero.
L’Ultimo Esame dell’Umanità cambia completamente le regole del gioco.
- Qui non basta sembrare intelligenti: bisogna dimostrare di esserlo, padroneggiando la conoscenza oggettiva e applicandola senza errori.
- È un test che elimina la vaghezza, l’ambiguità e la retorica: le risposte devono essere esatte, punto e basta.
L’AGI supererà mai questo esame?
Al momento, nessuna intelligenza artificiale, nemmeno le più sofisticate, è riuscita a superare interamente l’Ultimo Esame dell’Umanità.
Questo perché l’esame copre non solo la conoscenza teorica, ma anche la comprensione, la logica e la capacità di integrare informazioni da campi molto diversi.
Quando, e se, una AI riuscirà a rispondere correttamente a tutte queste domande, potremo davvero parlare di AGI (Intelligenza Artificiale Generale):
una macchina intelligente in grado di eseguire tutti i compiti intellettuali degli esseri umani allo stesso livello di competenza.
Dove trovare l’Ultimo Esame dell’Umanità
Il progetto è pubblico e consultabile online:
- Center for AI Safety: agi.safe.ai
- Leaderboard di Scale AI: scale.com/leaderboard/humanitys_last_exam
Qui si possono trovare domande, risposte e i risultati dei test più recenti sulle principali AI mondiali.