Colby T. Ford, unser Cloud-Architekt


2023 / Dienstag, Februar 7th, 2023

Seit Juni 2022 ist die "Genomic Cloud" von 101 Genomes in Betrieb. Bis heute ist diese Bioinformatik-Biobank (Bio-Biobank) wahrscheinlich bereits eine der größten (wenn nicht sogar die größte) Genomdatenbank (WGS) für Marfan-Patienten weltweit. Und alles ist bereit, damit sie weiter wächst! Diese bahnbrechende Ressource wird es Bioinformatikern ermöglichen, das Marfan-Syndrom besser zu verstehen, und könnte als Pilotprojekt für die Forschung an anderen seltenen Krankheiten dienen. Colby T. Ford ist der Architekt unserer "Genomic Cloud". Er blickt auf seine Arbeit mit uns zurück und beantwortet Ludivines Fragen anlässlich der kürzlich erfolgten Veröffentlichung seines Buches "Genomics in the Azure Cloud", das von dieser Erfahrung geprägt wurde.

Ludivine: Hello Colby, kannst du dich vorstellen?

Colby: Mein Name ist Colby T. Ford, Doktor der Naturwissenschaften und Mathematik, und ich bin Wissenschaftler mit Schwerpunkt Genomik und Cloud-Architekt. Ich bin Eigentümer von Tuple, einer Beratungsfirma, die Partner von Microsoft und Databricks ist und sich auf die Erstellung von Cloud-basierten Genomiklösungen für Organisationen der Biowissenschaften spezialisiert hat. Außerhalb von Tuple bin ich ein begeisterter Forscher auf dem Gebiet der Humangenomik und der Infektionskrankheiten. Ich habe zu Themen wie Onkologie, Immunologie, Malaria, SARS-CoV-2 usw. beigetragen. Ich bin zertifizierter Microsoft-Trainer und Autor von Genomics in der Azure CloudDas Buch wird von O'Reilly Media im Jahr 2022 veröffentlicht.

L.: Kannst du kurz deine Rolle als Cloud-Architekt für den F101G erklären?

C. : Meine Rolle als Berater für F101G bestand darin, mit den Gründern von F101G zusammenzuarbeiten, um die Ziele ihrer Cloud-Genomikplattform (für das Marfan-Syndrom als Ausgangspunkt) zu verstehen. Wir begannen mit der Erstellung eines Datensees (Datensee) genomische Daten, um alle genomischen und phänotypischen Daten der Studienteilnehmer zu beherbergen. Anschließend arbeitete ich mit anderen Teammitgliedern zusammen, um Datenpipelines einzurichten, um die Genome von den Sequenzierungsanbietern zu sammeln. Wir richteten auch IT-Dienste zur Analyse und Visualisierung der Daten des Datensee. Dazu gehörten bioinformatische Pipelines und eine Logik zur skalierbaren Abfrage von Variantendaten sowie eine DICOM-Visualisierungsanwendung zur Visualisierung von Bilddaten (Röntgen- und MRT-Aufnahmen) der Patienten. Schließlich arbeiteten wir eng mit einem Sicherheitsberater zusammen und erreichten die Einhaltung der ISO-Norm 27001:2013 für die gesamte Cloud-Architektur.

L.: Was denkst du über eure Zusammenarbeit mit F101G und das F101G-Projekt?

C. : Das gesamte Projekt F101G war eine interessante Herausforderung mit einem sehr wichtigen Forschungsziel. Da ich aus den USA komme, waren mir die europäischen Vorschriften und Regelungen zu Patientendaten unbekannt.

Ich hatte in der Vergangenheit bereits an anderen seltenen Krankheiten gearbeitet, das Marfan-Syndrom gehörte jedoch nicht dazu. Ich bin immer begeistert von der Idee, im Rahmen verschiedener Aufträge für meine Kunden an einem neuen Projekt zur biologischen Nutzung, einer neuen Krankheit, einem neuen Ziel für Medikamente usw. zu arbeiten.

Darüber hinaus war die Zusammenarbeit mit F101G ziemlich einzigartig, da wir sowohl auf wissenschaftlicher Ebene bei der Erforschung der Krankheit als auch auf technischer Ebene bei der Gestaltung der Cloud-Architektur zusammenarbeiten konnten. Mir gefällt das Bestreben des Teams von F101G, die Forschung zum Marfan-Syndrom und zu anderen seltenen Krankheiten im Allgemeinen durch einen innovativen, cloudorientierten Ansatz zu verändern.

L.: Du hast kürzlich ein Buch mit dem Titel "Genomics in the Azure Cloud" veröffentlicht, kannst du uns mehr über dieses Buch erzählen?

C. : Dieses Buch bietet eine Grundlage für die wichtigsten Überlegungen zum Aufbau einer Cloud-Architektur im Bereich der Genomik. Ich habe das Buch geschrieben, weil mir aufgefallen ist, dass es nicht viele Inhalte oder Beispiele für die Genomik auf Unternehmensebene gibt, obwohl es viele für den Finanzbereich, den Einzelhandel und andere Branchen gibt. In dem Buch gehe ich detailliert auf Fragen zu Datenplattformdiensten ein, wie z. B. Datensee und Data Warehouses, dann beschäftigen wir uns mit IT-Diensten, die bei der Automatisierung und Skalierung der bioinformatischen Datenverarbeitung helfen können. Dieses Buch richtet sich an Wissenschaftler, die lernen wollen, wie sie besser in Azure arbeiten können, sowie an Cloud-Architekten, die mehr über Lösungen zur Bewältigung von Arbeitslasten in der Genomik erfahren wollen.

L.: Gibt es etwas, das du noch hinzufügen möchtest?

C. : Ich bin fest davon überzeugt, dass die Arbeit, die wir mit F101G geleistet haben, für die Erforschung des Marfan-Syndroms revolutionär sein wird. Darüber hinaus können die Cloud-Architektur und die IT-Ressourcen, die wir aufgebaut haben, in Zukunft leicht auf andere seltene Krankheiten ausgeweitet werden. Es wird erstaunlich sein zu sehen, wie die Azure-Cloud dazu beiträgt, im Laufe der Zeit skalierbare Informationen in der Krankheitsforschung bereitzustellen!

 

Einen Kommentar hinterlassen

Diese Seite verwendet Akismet, um Junk-Mails zu reduzieren. Mehr darüber, wie Ihre Feedback-Daten verwendet werden.