Sinds juni 2022 is de Genomic Cloud of 101 Genomes operationeel. Tot op heden is deze bio-informatica biobank (Bio-Biobank) waarschijnlijk al een van de grootste genomische databanken (WGS) van Marfan syndroom patiënten ter wereld (zo niet de grootste). En het blijft groeien! Deze revolutionaire bron zal bioinformatici in staat stellen het Marfan-syndroom beter te begrijpen en kan als proef dienen voor onderzoek naar andere zeldzame ziekten. Colby T. Ford is de architect van onze Genomic Cloud. Hij vertelt over het werk dat hij met ons heeft gedaan en beantwoordt de vragen van Ludivine ter gelegenheid van de recente uitgave van zijn boek "Genomics in the Azure Cloud", dat op deze ervaring is gebaseerd.
Hallo Colby, kun je jezelf voorstellen?
Colby: Mijn naam is Colby T. Ford, PhD in wetenschap en wiskunde, en ik ben een genomisch wetenschapper en cloud architect. Ik ben de eigenaar van Tuple, een Microsoft en Databricks partner consultancy gespecialiseerd in het creëren van cloud-based genomic oplossingen voor life science organisaties. Buiten Tuple ben ik een gepassioneerd onderzoeker in menselijke genomica en infectieziekten. Ik heb bijgedragen aan onderwerpen als oncologie, immunologie, malaria, SARS-CoV-2, enz. Ik ben een Microsoft Certified Trainer en de auteur van Genomica in de Azure Cloudgepubliceerd door O'Reilly Media in 2022.
L.: Kunt u uw rol als cloudarchitect voor de F101G kort toelichten?
C. Mijn rol als consultant voor F101G was om samen met de oprichters van F101G de doelstellingen van hun cloud genomics platform te begrijpen (voor het Marfan syndroom als uitgangspunt). We zijn begonnen met het creëren van een data lake (datameer) om alle genomische en fenotypische gegevens van de studiedeelnemers in onder te brengen. Vervolgens werkte ik samen met andere teamleden aan het opzetten van datapijplijnen om genomen te verzamelen van leveranciers van sequencing. Wij hebben ook IT-diensten opgezet voor het analyseren en visualiseren van de datameer. Dit omvatte bioinformatica pipelines en logica om op een schaalbare manier variantgegevens te bevragen, alsmede een DICOM-visualisatietoepassing om beeldgegevens van patiënten (röntgenfoto's en MRI's) te visualiseren. Tot slot hebben we nauw samengewerkt met een beveiligingsadviseur en hebben we ISO 27001:2013 compliance bereikt voor de gehele cloudarchitectuur.
L.: Wat vindt u van uw samenwerking met de F101G en het F101G-project?
C. Het hele F101G-project was een interessante uitdaging met een zeer belangrijk onderzoeksdoel. Omdat ik uit de VS kom, was ik niet bekend met de Europese voorschriften en regels inzake patiëntengegevens, dus ik was blij dat ik meer te weten kwam.
Ik had in het verleden aan andere zeldzame ziekten gewerkt, maar het Marfan syndroom hoorde daar niet bij. Ik ben altijd enthousiast om te werken aan een nieuwe biologische use case, een nieuwe ziekte, een nieuw drug target, enz. in verschillende opdrachten voor mijn klanten.
Bovendien was de samenwerking met F101G vrij uniek omdat we zowel wetenschappelijk hebben kunnen samenwerken bij het bestuderen van de ziekte als technisch bij het ontwerpen van de cloud-architectuur. Ik hou van de inzet van het F101G-team om het onderzoek naar het Marfan-syndroom en andere zeldzame ziekten in het algemeen te transformeren door middel van een innovatieve en cloud-georiënteerde aanpak.
L.: U hebt onlangs een boek gepubliceerd genaamd "Genomics in the Azure Cloud", kunt u ons daar meer over vertellen?
C. Dit boek biedt een basis van essentiële overwegingen voor het bouwen van een cloud architectuur in het genomics domein. Ik heb dit boek geschreven omdat ik merkte dat er niet veel inhoud of voorbeelden waren voor genomics op bedrijfsschaal, hoewel er genoeg zijn voor financiën, detailhandel en andere bedrijfstakken. In het boek ga ik uitvoerig in op de problemen rond dataplatformdiensten, zoals datameer en datawarehouses, en dan kijken we naar IT-diensten die kunnen helpen bij het automatiseren en opschalen van de verwerking van bioinformatica-gegevens. Dit boek is bedoeld voor wetenschappers die beter willen leren werken in Azure, en voor cloud-architecten die meer willen weten over oplossingen voor het beheer van genomics workloads.
L.: Is er iets dat je zou willen toevoegen?
C. Ik geloof echt dat het werk dat we met F101G hebben gedaan revolutionair zal zijn voor het onderzoek naar het Marfan syndroom. Bovendien kunnen de cloud computing-architectuur en de middelen die we hebben ingezet in de toekomst gemakkelijk worden uitgebreid tot andere zeldzame ziekten. Het zal verbazingwekkend zijn om te zien hoe de Azure-cloud in de loop der tijd schaalbare informatie voor ziekteonderzoek oplevert!