Nell’episodio di oggi Monty e Paul partono dagli aggiornamenti di GPT-5.1: primi test, nuove opzioni di personalizzazione del modello e un benchmark curioso, con GPT alle prese con sudoku ad altissima difficoltà. Da qui si apre la domanda centrale della puntata: a che punto siamo davvero con l’AGI?