OpenAI ha recentemente presentato Operator, il primo agente di intelligenza artificiale della società in grado di eseguire azioni direttamente sul web per conto degli utenti, come prenotare voli e acquisti. Questo sistema innovativo rappresenta un progresso significativo nell’evoluzione dell’intelligenza artificiale, passando da un semplice assistente a un agente autonomo che opera in risposta a comandi testuali. A differenza dei tradizionali chatbot, Operator è in grado di navigare pagine web, compilare moduli, selezionare opzioni e interagire con elementi cliccabili, similmente a un utente umano, con l’intento di ridurre il carico di lavoro delle attività ripetitive.
Attualmente, Operator è disponibile in anteprima per gli utenti del piano ChatGPT Pro negli Stati Uniti, il quale ha un costo di 200 dollari al mese. La società ha annunciato che in futuro il servizio sarà disponibile anche per utenti appartenenti ai piani Plus, Team ed Enterprise. Durante il lancio, è stato dichiarato che l’espansione avverrà anche in altri paesi, anche se l’implementazione in Europa richiederà più tempo.
Indice Articolo
Funzionamento e caratteristiche di Operator
OpenAI ha sviluppato Operator utilizzando un modello avanzato denominato CUA (Computer-Using Agent), che combina la visione di GPT-4 con un sistema di “apprendimento rinforzato”. Questo modello consente all’agente di riconoscere le interfacce grafiche dei siti e interagire con esse autonomamente. Le capacità includevano l’operatività senza necessitare integrazioni API complesse. È stato specificato che Operator “vede” attraverso screenshot e “interagisce” utilizzando mouse e tastiera.
Per migliorare l’affidabilità, il modello CUA è progettato per richiedere conferma all’utente prima di completare operazioni significative, come l’invio di email o ordini. Nonostante ciò, OpenAI ha avvertito che il modello non funziona sempre in modo sicuro in ogni situazione, riconoscendo che Operator è ancora in una fase di sviluppo e potrebbe commettere errori. Per affrontare eventuali imprecisioni, l’agente è in grado di ricorrere alle proprie capacità di ragionamento per corregersi autonomamente.
Potenziali applicazioni di Operator
L’agente AI ha enormi potenzialità per automatizzare numerose attività quotidiane, inclusi viaggi, prenotazioni di ristoranti, shopping online e compilazione di moduli. L’interfaccia di utilizzo è stata progettata per essere intuitiva; gli utenti devono semplicemente descrivere l’attività da svolgere e Operator provvederà a completarla. È possibile interventire per controllare in tempo reale il browser utilizzato da Operator e ricevere richieste di assistenza per l’inserimento di dati sensibili, come credenziali e pagamenti.
Sicurezza e limitazioni di utilizzo
In termini di sicurezza, OpenAI ha implementato tre livelli di protezione. Prima di intraprendere azioni delicate, come pagamenti o inserimento di credenziali, Operator richiede sempre una conferma. Gli utenti hanno la possibilità di disattivare l’uso dei propri dati per l’addestramento e di rimuovere cronologie con facilità. Inoltre, è stato creato un sistema di monitoraggio avanzato per prevenire minacce informatiche.
Nonostante le sue capacità, Operator presenta ancora delle limitazioni e non gestisce sempre in modo efficace attività complesse o specializzate. OpenAI ha dichiarato che l’agente non può raccogliere screenshot relativi a informazioni di pagamento e richiede sempre la supervisione dell’utente per attività giudicate sensibili. In caso di malfunzionamento, l’agente restituisce il controllo all’utente, garantendo una supervisione continua delle operazioni in corso.