Dopo un’anticipazione avvenuta lo scorso dicembre, OpenAI ha ufficialmente rilasciato o3-mini, un nuovo modello di intelligenza artificiale mirato al ragionamento avanzato. Secondo l’azienda, o3-mini rappresenta un’evoluzione significativa rispetto ai modelli linguistici tradizionali, grazie alla sua capacità di affrontare problemi complessi con un’analisi approfondita. Questa versione, pur essendo più compatta ed efficiente rispetto al modello di punta o3, conserva capacità avanzate in materie quali matematica, scienza e programmazione, risultando particolarmente indicata per il settore STEM (Science, Technology, Engineering, Mathematics). Tra le novità principali si evidenzia l’adozione del ragionamento simulato, una tecnica che consente al modello di riflettere sulle proprie risposte prima di generarle, migliorandone l’accuratezza. Inoltre, è stato introdotto un innovativo sistema di sicurezza noto come allineamento deliberativo, che permette di gestire le richieste degli utenti in modo sofisticato, riducendo il rischio di risposte inappropriate e l’impossibilità di accedere a contenuti validi. OpenAI ha reso disponibile o3-mini anche agli utenti free in un contesto competitivo, considerando il rivale cinese DeepSeek.
Le caratteristiche di o3-mini: come funziona
O3-mini punta sul ragionamento, una funzione che aumenta la sua efficacia in compiti logici e deduttivi. Il ragionamento simulato costituisce un miglioramento rispetto al metodo CoT (Chain of Thought), consentendo un’analisi approfondita prima di fornire una risposta. Questa metodica si traduce in una qualità e una precisione superiori, rendendo il modello utile per applicazioni accademiche e tecniche. Inoltre, l’allineamento deliberativo consente una gestione più accurata della sicurezza, valutando il contesto delle richieste anziché applicare semplici filtri predefiniti, e migliorando così la protezione contro usi impropri.
O3-mini offre anche funzionalità interessanti per gli sviluppatori, come la chiamata di funzioni e output strutturati, facilitando la sua integrazione in applicazioni pratiche. È disponibile un’opzione per selezionare tra tre livelli di ragionamento (basso, medio e alto), consentendo un bilanciamento tra precisione e velocità a seconda delle necessità. Secondo alcune analisi, o3-mini è risultato più veloce ed efficiente rispetto al modello precedente o1-mini, con un incremento del 24% nella rapidità di risposta, senza compromettere le prestazioni nelle discipline STEM. Inoltre, il modello ha dimostrato di essere più accurato, fornendo risposte preferite dagli utenti nel 56% dei casi.
OpenAI ha specificato che «o3-mini ora funziona con la ricerca per trovare risposte aggiornate con collegamenti a fonti Web pertinenti», aggiungendo che «questo è un prototipo iniziale mentre lavoriamo per integrare la ricerca nei nostri modelli di ragionamento».
Performance e risultati
O3-mini ha dimostrato performance superiori rispetto al precedente o1-mini in vari test di riferimento. Ha raggiunto un’accuratezza del 96,7% nell’AIME (American Invitational Mathematics Examination), in contrasto con l’83,3% del suo predecessore. Anche nel campo della programmazione si è distinta, ottenendo il 71,7% di precisione su SWE-bench Verified, un benchmark di coding che si basa su problemi reali, con un miglioramento di circa il 20% rispetto a o1. In ambito scientifico, o3-mini ha superato il modello precedente con un punteggio dell’87,7% nel test GPQA Diamond, valutando la capacità di rispondere a domande di livello accademico avanzato. Ha mostrato anche capacità di adattamento superiori, ottenendo un punteggio dell’87,5% nel benchmark ARC-AGI, superiore alla media umana dell’85%.
Dove e quando sarà disponibile o3-mini OpenAI
O3-mini è già accessibile per gli utenti di ChatGPT Plus, Team e Pro, con integrazione per gli utenti Enterprise prevista entro febbraio. Gli utenti Plus e Team beneficeranno di un aumento del limite di messaggi da 50 a 150 al giorno, mentre gli utenti Pro non incontreranno alcun limite di utilizzo. Gli utenti del piano base di ChatGPT possono provare gratuitamente o3-mini selezionando l’opzione Avvia il ragionamento nel compositore di messaggi. Come evidenziato nell’annuncio di OpenAI, «questa è la prima volta che un modello di ragionamento è stato reso disponibile agli utenti gratuiti in ChatGPT».