Dal giugno 2022 è operativo il Cloud genomico dei 101 genomi. Ad oggi, questa biobanca bioinformatica (Bio-Biobank) è probabilmente già uno dei più grandi database genomici (WGS) di pazienti con sindrome di Marfan al mondo (se non il più grande). Ed è destinato a crescere ancora! Questa risorsa rivoluzionaria consentirà ai ricercatori bioinformatici di comprendere meglio la sindrome di Marfan e potrà servire da modello per la ricerca su altre malattie rare. Colby T. Ford è l'architetto del nostro Genomic Cloud. Parla del lavoro svolto con noi e risponde alle domande di Ludivine in occasione della recente pubblicazione del suo libro "Genomics in the Azure Cloud", frutto di questa esperienza.
Ludivine: Ciao Colby, puoi presentarti?
Colby: Mi chiamo Colby T. Ford, dottore di ricerca in scienze e matematica, e sono uno scienziato genomico e architetto cloud. Sono il proprietario di Tuple, una società di consulenza partner di Microsoft e Databricks specializzata nella creazione di soluzioni genomiche basate sul cloud per le organizzazioni del settore life science. Al di fuori di Tuple, sono un ricercatore appassionato di genomica umana e di malattie infettive. Ho contribuito a temi quali oncologia, immunologia, malaria, SARS-CoV-2, ecc. Sono un formatore certificato Microsoft e l'autore di La genomica nel cloud Azurepubblicato da O'Reilly Media nel 2022.
L.: Può spiegare brevemente il suo ruolo di architetto del cloud per l'F101G?
C. Il mio ruolo di consulente per F101G è stato quello di lavorare con i fondatori di F101G per comprendere gli obiettivi della loro piattaforma genomica cloud (per la sindrome di Marfan come punto di partenza). Abbiamo iniziato creando un data lake (lago di dati) per ospitare tutti i dati genomici e fenotipici dei partecipanti allo studio. Ho poi collaborato con altri membri del team per impostare le pipeline di dati per raccogliere i genomi dai fornitori di sequenziamento. Abbiamo anche creato dei servizi informatici per analizzare e visualizzare i dati lago di dati. Questo includeva pipeline bioinformatiche e logica per interrogare i dati sulle varianti in modo scalabile, nonché un'applicazione di visualizzazione DICOM per visualizzare i dati di imaging dei pazienti (radiografie e risonanze magnetiche). Infine, abbiamo lavorato a stretto contatto con un consulente per la sicurezza e abbiamo ottenuto la conformità ISO 27001:2013 per l'intera architettura cloud.
L.: Cosa pensa della sua collaborazione con l'F101G e del progetto F101G?
C. L'intero progetto F101G ha rappresentato una sfida interessante con un obiettivo di ricerca molto importante. Venendo dagli Stati Uniti, non conoscevo le normative e le regole europee sui dati dei pazienti, quindi sono stata felice di saperne di più.
In passato avevo lavorato su altre malattie rare, ma la sindrome di Marfan non era una di queste. Sono sempre entusiasta di lavorare su un nuovo caso d'uso biologico, una nuova malattia, un nuovo target farmacologico, ecc. in diversi incarichi per i miei clienti.
Inoltre, la collaborazione con F101G è stata piuttosto unica, in quanto siamo stati in grado di collaborare sia dal punto di vista scientifico nello studio della malattia sia dal punto di vista tecnico nella progettazione dell'architettura del cloud. Mi piace l'impegno del team di F101G nel trasformare la ricerca sulla sindrome di Marfan e su altre malattie rare in generale, attraverso un approccio innovativo e orientato al cloud.
L.: Recentemente ha pubblicato un libro intitolato "Genomics in the Azure Cloud", può dirci qualcosa di più?
C. Questo libro fornisce una base di considerazioni essenziali per la costruzione di un'architettura cloud nel settore della genomica. Ho scritto questo libro perché ho notato che non c'erano molti contenuti o esempi per la genomica su scala aziendale, anche se ce ne sono molti per la finanza, la vendita al dettaglio e altri settori. Nel libro, analizzo in dettaglio le problematiche relative ai servizi della piattaforma dati, come ad esempio lago di dati e magazzini di dati, e poi esaminiamo i servizi IT che possono aiutare ad automatizzare e scalare l'elaborazione dei dati bioinformatici. Questo libro si rivolge agli scienziati che vogliono imparare a lavorare meglio con Azure e agli architetti cloud che vogliono saperne di più sulle soluzioni per la gestione dei carichi di lavoro genomici.
L.: C'è qualcosa che vorrebbe aggiungere?
C. Credo davvero che il lavoro svolto con F101G sarà rivoluzionario per la ricerca sulla sindrome di Marfan. Inoltre, l'architettura e le risorse di cloud computing che abbiamo messo a punto possono essere facilmente estese ad altre malattie rare in futuro. Sarà sorprendente vedere come il cloud Azure contribuirà a fornire informazioni scalabili nella ricerca sulle malattie nel corso del tempo!