Desde junio de 2022, la Nube Genómica de 101 Genomas está operativa. Hasta la fecha, este biobanco bioinformático (Bio-Biobank) es probablemente ya una de las mayores bases de datos genómicos (WGS) de pacientes con síndrome de Marfan del mundo (si no la mayor). Y todo está preparado para seguir creciendo. Este revolucionario recurso permitirá a los investigadores en bioinformática comprender mejor el síndrome de Marfan y puede servir de piloto para la investigación de otras enfermedades raras. Colby T. Ford es el arquitecto de nuestra Nube Genómica. Nos habla del trabajo que ha realizado con nosotros y responde a las preguntas de Ludivine con motivo de la reciente publicación de su libro "Genómica en la nube Azure", que se nutrió de esta experiencia.
Ludivine: Hola Colby, ¿puedes presentarte?
Colby: Me llamo Colby T. Ford, doctor en ciencias y matemáticas, y soy científico genómico y arquitecto de la nube. Soy el propietario de Tuple, una consultoría asociada a Microsoft y Databricks especializada en la creación de soluciones genómicas basadas en la nube para organizaciones de ciencias de la vida. Fuera de Tuple, soy un investigador apasionado de la genómica humana y las enfermedades infecciosas. He colaborado en temas como oncología, inmunología, malaria, SARS-CoV-2, etc. Soy formador certificado de Microsoft y autor de Genómica en la nube Azurepublicado por O'Reilly Media en 2022.
L.: ¿Puede explicarnos brevemente su papel como arquitecto de la nube para el F101G?
C. Mi papel como consultor para F101G fue trabajar con los fundadores de F101G para entender los objetivos de su plataforma genómica en la nube (para el síndrome de Marfan como punto de partida). Empezamos creando un lago de datos (lago de datos) para albergar todos los datos genómicos y fenotípicos de los participantes en el estudio. A continuación, colaboré con otros miembros del equipo en la creación de canalizaciones de datos para recopilar genomas de proveedores de secuenciación. También creamos servicios informáticos para analizar y visualizar la lago de datos. Esto incluía procesos bioinformáticos y lógica para consultar datos de variantes de forma escalable, así como una aplicación de visualización DICOM para visualizar datos de imágenes de pacientes (radiografías y resonancias magnéticas). Por último, trabajamos en estrecha colaboración con un consultor de seguridad y logramos la conformidad con la norma ISO 27001:2013 para toda la arquitectura de la nube.
L.: ¿Qué opina de su colaboración con la F101G y del proyecto F101G?
C. Todo el proyecto F101G fue un reto interesante con un objetivo de investigación muy importante. Al venir de Estados Unidos, desconocía la normativa europea sobre datos de pacientes, así que me alegró aprender más.
Había trabajado en otras enfermedades raras en el pasado, pero el síndrome de Marfan no era una de ellas. Siempre me entusiasma trabajar en un nuevo caso de uso biológico, una nueva enfermedad, una nueva diana farmacológica, etc. en distintos encargos para mis clientes.
Además, la colaboración con F101G ha sido bastante singular, ya que hemos podido colaborar tanto científicamente en el estudio de la enfermedad como técnicamente en el diseño de la arquitectura de la nube. Me gusta el compromiso del equipo de F101G de transformar la investigación sobre el síndrome de Marfan y otras enfermedades raras en general, mediante un enfoque innovador y orientado a la nube.
L.: Recientemente ha publicado un libro titulado "Genómica en la nube Azure", ¿puede hablarnos más de él?
C. Este libro proporciona una base de consideraciones esenciales para construir una arquitectura en la nube en el ámbito de la genómica. Escribí este libro porque me di cuenta de que no había mucho contenido o ejemplos para la genómica a escala empresarial, aunque hay muchos para las finanzas, el comercio minorista y otras industrias. En el libro, detallo las cuestiones que rodean a los servicios de plataformas de datos, tales como lago de datos y almacenes de datos, y luego examinamos los servicios informáticos que pueden ayudar a automatizar y ampliar el procesamiento de datos bioinformáticos. Este libro está dirigido a científicos que quieran aprender a trabajar mejor en Azure, así como a arquitectos de la nube que quieran saber más sobre soluciones para gestionar cargas de trabajo de genómica.
L.: ¿Hay algo que quiera añadir?
C. Creo sinceramente que el trabajo que hemos realizado con F101G será revolucionario para la investigación del síndrome de Marfan. Además, la arquitectura de computación en nube y los recursos que hemos puesto en marcha pueden ampliarse fácilmente a otras enfermedades raras en el futuro. Será increíble ver cómo la nube Azure ayuda a proporcionar información escalable en la investigación de enfermedades a lo largo del tiempo.