Géraldine Van der Auwera ist eine talentierte Forscherin aus Brüssel. Sie lebt in den USA, wo sie viele Jahre lang für das Broad Institute (gemeinsam gegründet vom MIT und der Harvard University) gearbeitet hat. Sie ist Autorin eines der allerersten Bücher über die Verbindung von Cloud und Genomik und war an der Einrichtung der Plattform "Terra" beteiligt. Seit 2020 stellt sie ihr Fachwissen in den Dienst der Global Alliance for Genomics and Health (GA4GH) und der 101 Genomes Foundation. Ludivine interviewte sie bei einem ihrer seltenen Besuche in Brüssel und versuchte, Geraldines einzigartige Expertise und ihren Beitrag zu 101 Genomes zu beleuchten.
Ludivine : Hallo Géraldine, kannst du dich vorstellen?
Géraldine : Ich bin ausgebildete Mikrobiologin und habe mich nach einem Postdoktorat in mikrobieller Genetik auf die Humangenomik umgestellt. Ich habe etwa zehn Jahre lang am Broad Institute of MIT and Harvard, einem Forschungsinstitut für Genomik in Boston, USA, gearbeitet. Dort war ich hauptsächlich für die technische und wissenschaftliche Unterstützung von Forschern zuständig, die bestimmte bioinformatische Werkzeuge nutzen, die das Broad Institute der wissenschaftlichen Gemeinschaft zur Verfügung stellt. Derzeit bin ich als freiberufliche Beraterin für Bioinformatik und Wissenschaftskommunikation tätig. In einer zusätzlichen Tätigkeit bin ich Co-Leiterin des Large-Scale Genomics Workstream (Arbeitsbereich für großmaßstäbliche Genomik) der Global Alliance for Genomics and Health (Globale Allianz für Genomik und Gesundheit) (GA4GH), einer internationalen Organisation zur Entwicklung technischer Standards und regulatorischer Rahmenbedingungen, die den verantwortungsvollen Austausch genomischer Daten fördern soll.
L.: Kannst du deine Rolle für die 101 Genome Foundation erklären und warum du dich entschieden hast, dich ab 2020 zu engagieren?
G. : Du und Romain habt mich kontaktiert, um mir Fragen zu den groß angelegten Genomstudien des Broad Institute und zur Migration von Systemen zur Analyse und gemeinsamen Nutzung von Genomdaten in die Cloud zu stellen, die bei der Durchführung solcher Studien eine Schlüsselrolle spielen. Ich war sehr berührt von ihrer Familiengeschichte und beeindruckt von ihrem Vorgehen bei der Gründung der Stiftung; das hat mich dazu inspiriert, ihnen zu helfen. Ich spiele eine beratende Rolle, vor allem bei der Entwicklung der Cloud-Infrastruktur, um die wissenschaftlichen Ziele des Projekts zu unterstützen.
L.: Du hast das Buch "Genomics in Cloud" geschrieben. Es ist eines der ersten Bücher, das sich mit der Nutzung der Cloud zur Aufbewahrung und Erforschung des Genoms befasst. Kannst du uns etwas mehr über dieses Buch erzählen?
G. : Das Buch Genomics in der Cloudveröffentlicht bei O'Reilly Media im Jahr 2020Der Kurs bietet eine theoretische und praktische Einführung in die Analysemethoden der Humangenomik, die sich vor allem auf die Datenverarbeitung und die Identifizierung von Varianten aus Sequenzierungsdaten unter Verwendung der Cloud-Infrastruktur konzentrieren.
Mein Co-Autor Brian O'Connor und ich haben dieses Buch auf der Grundlage unserer gemeinsamen Erfahrung an der Schnittstelle zwischen Genomik und Computertechnologie konzipiert. Es handelt sich um einen sehr interdisziplinären Bereich, in dem sowohl Biologie- und Medizinspezialisten, die in ihrem Werdegang in der Regel nur wenig Informatikausbildung haben, als auch Technologen, Programmierer und andere Fachleute für IT-Infrastruktur zusammenkommen, die mit besonders komplexen wissenschaftlichen Konzepten und Vokabularen konfrontiert sind.
Unser Buch bietet dem Leser also eine Auffrischung seiner technischen und wissenschaftlichen Kenntnisse durch praktische Übungen mit sehr geringen Vorkenntnissen, mit dem Ziel, die Humangenomik zugänglicher zu machen.
L.: Du hast sehr viel Arbeit in die Entwicklung von "Terra" investiert. Warum denkst du, dass 101 Genomes ein guter Kandidat für "Terra on Azure" ist?
G. : Eine der größten Schwierigkeiten, mit denen die Forschungsverbände für seltene Krankheiten konfrontiert sind, ist die Zersplitterung der Quellen für genomische Daten. Viele Studien basieren auf einer relativ geringen Anzahl von Patienten - zu gering, um die groß angelegten Analysetechniken nutzen zu können, die erforderlich sind, um komplexe genetische Mechanismen auf statistisch robuste Weise zu untersuchen.
Die Lösung für dieses Problem besteht darin, die Daten aus mehreren Studien zusammenzuführen. Die Terra-Plattform wurde entwickelt, um eine solche Datenföderation innerhalb eines wissenschaftlichen Open-Source-Ökosystems zu ermöglichen, das die wissenschaftliche Zusammenarbeit fördert und gleichzeitig die Sicherheit und Zugehörigkeit der Daten schützt.
101 Genome ist ein hervorragendes Beispiel für ein Projekt, das von einer solchen Plattform profitieren kann, um seine wissenschaftlichen Ziele zu erreichen, ohne sich um die Entwicklung und den Betrieb einer kompletten Infrastruktur kümmern zu müssen. Nachdem es bereits ein Datensee auf Azure, der Microsoft-Cloud, wird F101G in Kürze seinen Data Lake mit Terra on Azure verbinden können, sodass die Forschungsteams diese Daten über Terra kollaborativ analysieren können. Wenn andere Gruppen ihre Daten in dieses Ökosystem der Datenföderation migrieren, werden diese Analysen an statistischer Aussagekraft gewinnen und unser Verständnis der beteiligten biologischen Mechanismen weiter vorantreiben.
L.: Gibt es etwas, das du noch hinzufügen möchtest?
G. : Ich denke, es ist wichtig, sich daran zu erinnern, dass die Humangenomik zurückkommt, in fineDas Genom des Menschen ist Teil des globalen biologischen Erbes der Menschheit. Dies hat nicht nur ethische, sondern auch ganz praktische Auswirkungen: Wir können das menschliche Genom nur dann hinreichend verstehen, wenn wir über eine ausreichende Vertretung der Bevölkerung auf der ganzen Welt verfügen. Aus diesem Grund ist es unerlässlich, auf eine grundlegende internationale Zusammenarbeit hinzuarbeiten, wie es zum Beispiel die Global Alliance for Genomics and Health (Globale Allianz für Genomik und Gesundheit). Dies ist eine Anstrengung, die die Beteiligung von Akteuren aus allen Bereichen erfordert - sowohl Forscher, Ärzte, Technologen, Rechtswissenschaftler, Politiker als auch Patientenorganisationen und sogar die breite Öffentlichkeit.