L’AI generativa è letteralmente esplosa. Sembra che tutti avessero un modello super performante e addestrato nel cassetto. Come si sta configurando la scena globale della battaglia del modello migliore, più etico, più disponibile alle integrazioni e usi?
Vediamo qualcuno dei concorrenti più noti di ChatGPT di OpenAI e in cosa differiscono.
Concorrenti dell’AI generativa di ChatGPT
Bloom
Uno dei primi concorrenti dichiaratisi circa un anno fa (sembrano secoli!) è Bloom di BigScience. Con 176 miliardi di parametri, BLOOM è in grado di generare testi in 46 lingue naturali.
Benché sia un open source bisogna fare attenzione: non si tratta di una licenza open source secondo la definizione dell’Open Source Initiative, perché prevede alcune restrizioni sull’uso del modello.
Lo si può testare qui https://huggingface.co/bigscience/bloom
Anthropic
Il modello di linguaggio di Anthropic, finanziato da Google con oltre 300 milioni di dollari, si basa su un apprendimento rinforzato e supervisionato da esseri umani (reinforced learning from human feedback (RLHF)), addestrato su 52 milioni di parametri.
Un modello commerciale che sta dimostrando accuratezza e attenzione verso la data privacy. Diverse grandi aziende stanno adottando Claude, l’assistente intelligente, il ChatGPT derivato da Anthropic. Fra le varie adozioni DuckDuckGo, Notion,
Attenzione, anche il modello su cui si basa ChatGPT è un RLHF, solo che Anthropic si basa su un approccio detto (e da loro inventato) di “Constitutional AI“.
I modelli di AI generativa (davvero) Open
OpenAI ha un nome in un certo senso ingannatorio: non ha nulla di “open”. Le licenze sono commerciali, l’azienda è privata, il codice è chiuso e riservato.
Ci sono però dei modelli LLM (Large Language Models) davvero open source. Vediamone alcuni.
OpenChat Kit
OpenChat Kit è un sistema simile a ChatGPT, addestrato su 20 milioni di parametri e 43 milioni di istruizioni. Creato da un team di studiosi il cui obiettivo dichiarato è quello di far progredire tecnologicamente la società con benefici comuni.
Creato in collaborazione con LAION, Large-scale Artificial Intelligence Open Network, e ONTOCORD.
Altre informazioni sul blog ufficiale: https://www.together.xyz/blog/openchatkit
LLaMA
Anche Meta AI di Facebook ha presentato un nuovo modello linguistico “all’avanguardia” chiamato Large Language Model Meta AI (LLaMA).
Contrariamente ai sistemi di training estesi come quello di OpenAI da 75 milioni di parametri, LLaMa sarà disponibile con vari formati di dataset di training: 7, 13, 33, e 65 milioni di parametri.
L’obiettivo è quello di permettere attività di ricerca anche con un minore consumo di risorse. Infatti modelli vasti come quello di OpenAI richiedono delle infrastrutture di studio molto costose e a cui npn tutti possono avere accesso.
Approfondimenti sulla pagina ufficiale del blog: https://ai.facebook.com/blog/large-language-model-llama-meta-ai/
Conclusioni
Quale nuovo modello nascerà? Lo studio e le sfide sono adesso verso modelli etici di utilizzo dei dati che non creino buchi di sicurezza alle aziende. O peggio, che non causino con i loro suggerimenti generati a caso problemi gravi, se non la morte, delle persone.
La sfida è una AI più a misura di persona.