ChatGPT viene lanciata su internet, raccogliendo il suo primo milione di utenti in meno di una settimana. La sua imitazione della conversazione umana ha suscitato speculazioni sul suo potenziale per soppiantare gli scrittori professionisti, rivoluzionare la scrittura del software e persino minacciare il core business di ricerca di Google. L’organizzazione dietro di essa, co-fondata da Elon Musk e dall’investitore della Silicon Valley Sam Altman, guadagna facendo pagare agli sviluppatori la licenza della sua tecnologia. La nuova tecnologia si basa sul modello linguistico GPT-3 di OpenAI e arriva alla fine di un anno di progressi nell’intelligenza artificiale che hanno fatto notizia. Il modello di generazione di immagini Dall-E dell’azienda, che accetta suggerimenti scritti per sintetizzare arte e altre immagini, ha anche dato origine a un ampio dibattito sull’infusione dell’intelligenza artificiale nelle industrie creative. OpenAI sta già lavorando a un modello GPT-4 successivo per la sua elaborazione del linguaggio naturale. ChatGPT è stato messo a punto utilizzando supervised learning e reinforcement learning. Entrambi gli approcci hanno utilizzato trainer umani per migliorare le prestazioni del modello. Nel caso del supervised learning, il modello è stato dotato di conversazioni in cui i formatori interpretavano entrambe le parti: l’utente e l’assistente AI. Nella fase di reinforcement step, i formatori umani hanno prima classificato le risposte che il modello aveva creato in una conversazione precedente. Queste classifiche sono state utilizzate per creare “modelli di ricompensa” su cui il modello è stato ulteriormente perfezionato utilizzando diverse iterazioni di Proximal Policy Optimization (PPO). I modelli sono stati addestrati in collaborazione con Microsoft sulla loro infrastruttura di supercalcolo Azure.



