La biotech cinese BGI-Research e Zhejiang Lab, specializzato in tecnologia AI, hanno lanciato il modello "Genos", celebrato come il primo genomic foundation model implementabile al mondo con 10 miliardi di parametri, secondo quanto riportato da Science and Technology Daily. Il modello promette di accelerare in modo decisivo la comprensione funzionale del genoma umano e l'identificazione di mutazioni che causano malattie in contesti clinici.

Nonostante la sequenza completa dei 3 miliardi di paia di basi del genoma umano sia nota, interpretare le funzioni specifiche di singole basi resta una sfida monumentale. La maggior parte dei modelli AI esistenti, infatti, è addestrata su appena uno o due genomi di riferimento, fallendo nel cogliere la vasta diversità genetica umana.

Genos affronta questa limitazione alla radice: è stato addestrato su un set completo di 636 genomi umani di alta qualità "telomero-a-telomero", che integrano genomi provenienti da diverse popolazioni globali. Il modello è progettato per analizzare sequenze lunghe fino a un milione di paia di basi, raggiungendo la risoluzione della singola base.

Architettura MoE e performance elevate

Dal punto di vista tecnico, il modello sfrutta un’architettura Mixture-of-Experts (MoE) per gestire la sua enorme scala in modo efficiente. Questo design innovativo permette a Genos di attivare solo le reti "esperte" più rilevanti per un dato compito, riducendo significativamente i costi computazionali e il consumo di risorse. I test sulle performance hanno confermato l'efficacia del sistema nell'interpretazione delle mutazioni patogene: Genos ha raggiunto un'accuratezza del 92%. Quando combinato con un altro scientific foundation model, l'accuratezza è schizzata al 98,3%.

In linea con l'impegno per la trasparenza e la promozione della ricerca, Genos è stato reso open-source su piattaforme come Hugging Face, ed è disponibile in due versioni: una da 1,2 miliardi e l'altra da 10 miliardi di parametri.