Parla Roberto Navigli, creatore di Minerva, su cui è basata la soluzione in grado di comprendere immagini, documenti e conversare in italiano
Arriva un nuovo assistente Ai multimodale tutto italiano: si chiama ChatMinerva ed è progettato per comprendere testi, immagini e documenti, accedere al Web in tempo reale e dialogare in italiano con maggiore affidabilità e sicurezza. È targato Sapienza Nlp, il gruppo di ricerca della Sapienza Università di Roma guidato dal docente Roberto Navigli, e Babelscape, spinoff della stessa Sapienza. Si tratta di un’evoluzione del large language model Minerva 7B, ma Navigli racconta all’Adnkronos che in autunno verrà presentato un nuovo modello da 20 miliardi di parametri (già pienamente multilingue e multimodale come ChatMinerva), attualmente in addestramento sull’infrastruttura Hpc del Cineca a Bologna, dove c’è il supercomputer Leonardo e dove si sta costruendo l’Ai Factory finanziata dall’Europa.
Nonostante le performance dei modelli americani e cinesi siano lontane, i punti da tenere a mente sono altri, ricorda Navigli. ChatMinerva, che arriva dopo un lavoro lungo otto mesi, nasce come progetto di ricerca interamente sviluppato in Italia con approccio aperto, trasparente e controllabile in tutte le sue fasi di sviluppo: dal pretraining al fine-tuning, fino ai meccanismi di sicurezza e moderazione. “Il lancio di ChatMinerva segna una nuova tappa nel percorso di innovazione del nostro ateneo nel campo dell’intelligenza artificiale”, secondo la rettrice della Sapienza Antonella Polimeni. “L’evoluzione del progetto Minerva verso assistenti AI multimodali e interattivi conferma la capacità della Sapienza di trasformare la ricerca di frontiera in innovazione concreta”.
Tra gli sviluppi, è prevista anche una ‘Agentic Minerva’, a indicare dei sistemi AI capaci di pianificare azioni e utilizzare strumenti in autonomia. ChatMinerva trasforma il modello in un vero assistente AI multimodale. Si possono caricare fotografie, immagini, pagine scannerizzate, articoli scientifici, report e documentazione tecnica, chiedendo di interpretarli, riassumerli, analizzarli o rispondere a domande sul loro contenuto. Si può anche conversare con il modello, come si fa con quelli più avanzati. E la finestra contestuale è stata estesa fino a 32.000 token consentendo di elaborare documenti complessi e conversazioni estese. Peculiare la scelta sul motore di ricerca su cui si basa l’interazione del modello con il Web (altra novità per un modello italiano).
Navigli ha scelto DuckDuckGo, una soluzione 'aperta' che il professore spiega così: “La nostra architettura deve essere completamente open, e questo browser aperto funziona bene per questo tipo di servizio”. Minerva è sempre stato sviluppato con controllo diretto sulle fonti e sui processi di addestramento.
I creatori di Minerva sottolineano l’importanza delle 25.000 conversazioni da oltre 5.200 utenti registrate finora, con “7,4 milioni di istruzioni utilizzate per il fine tuning, di cui il 42% in italiano, un lavorone”, dice Navigli. Anche se i numeri americani sono irraggiungibili, Navigli sottolinea che le conversazioni con Minerva sono le uniche di utenti italiani in mano a un’università italiana. Secondo Sapienza Nlp le interazioni raccolte durante l’utilizzo pubblico di Minerva 7B hanno permesso di migliorare sensibilmente le capacità conversazionali del sistema e la qualità delle risposte.
“Minerva è cresciuta insieme ai suoi utenti. Ogni prompt, interazione e feedback ha contribuito a costruire un assistente Ai più utile, più robusto e più vicino alle esigenze reali delle persone”, dichiara Navigli. “Vogliamo dimostrare che è possibile costruire tecnologia Ai di frontiera anche in Europa e in Italia, con un approccio aperto, scientificamente rigoroso e indipendente. ChatMinerva è stato costruito con molta più passione che budget, grazie al lavoro incessante di decine di ricercatori, dottorandi, studenti e collaboratori che credono nella possibilità di creare tecnologia AI italiana da cui partire per costruire prodotti competitivi, pur nascendo in un contesto molto diverso da quello dei grandi colossi globali ma con la forza della collaborazione tra la più importante università italiana e uno spin-off di successo, Babelscape, che ha appena festeggiato 10 anni di intensa attività di ricerca e innovazione industriale”. (di Alessandro Pulcini)