Infraestructura de datos de SFARI para el descubrimiento del autismo

 

 

Hace unos 15 años, comenzó a surgir un consenso de que el autismo no es una condición única, sino más bien diversa, con cientos de subtipos diferentes y genes subyacentes. Dada esta complejidad, la Iniciativa de Investigación del Autismo de la Fundación Simons (SFARI) concluyó que el enfoque tradicional para el descubrimiento científico, en el que cada laboratorio recolecta sus propios conjuntos de datos, no tendría el poder suficiente para mapear el autismo. Lo que se requeriría en su lugar eran vastos conjuntos de datos compartidos que permitirían a muchos grupos de investigación diferentes ayudar a completar la imagen del autismo.

SFARI asumió la tarea de crear dichos conjuntos de datos. De manera crucial, tomó la decisión temprana de administrar los conjuntos de datos en sí, en lugar de depender de una entidad gubernamental o un grupo externo de investigadores. A lo largo de los años, esta administración directa ha permitido a SFARI garantizar que los conjuntos de datos cumplan con los más altos estándares de calidad y privacidad, al tiempo que se mantienen lo suficientemente flexibles como para satisfacer las necesidades cada vez mayores de los investigadores del autismo.

Hoy, un grupo informático dedicado dentro de la fundación distribuye datos de cuatro grupos diferentes relacionadas con el autismo que abarcan miles de familias. La Colección Simons Simplex (SSC) es un conjunto de datos genéticos y fenotípicos de más de 2.600 familias ‘simplex’ que tienen un hijo afectado junto con padres y hermanos no afectados. El Proyecto Simons Variation in Individuals (Simons VIP), recientemente renombrado Searchlight, recopila datos fenotípicos y muestras biológicas de individuos con una mutación en uno de los más de 50 genes diferentes vinculados al autismo. La Colección de pacientes con autismo (el único de los cuatro conjuntos de datos que SFARI no maneja directamente) es un grupo de individuos cuyo autismo es lo suficientemente grave como para requerir hospitalizaciones prolongadas. Finalmente, el proyecto más ambicioso de SFARI hasta la fecha, la Fundación Simons para la Investigación del Conocimiento sobre el Autismo (SPARK), tiene como objetivo recopilar datos genotípicos y fenotípicos de 50.000 familias.

Estos conjuntos de datos han dado lugar a más de 200 artículos publicados sobre el autismo, una cifra que es “un testimonio del éxito de estos grupos”, dice Stephan Sanders, genetista de la Universidad de California en San Francisco. “Han tenido un impacto realmente masivo en el campo”.

 Una visualización de nueve genes (DPP6, ITSN1, BRSK2, etc.) descubrió recientemente que está relacionada con el trastorno del espectro autista según los datos piloto de SPARK. Los genes se colorean según su función, como el transporte de iones de potasio, el movimiento celular y la señalización mediada por esteroides, y se agrupan según las asociaciones entre los genes. P. Feliciano y col. /bioRxiv.org 2019 

Una visualización de nueve genes (DPP6, ITSN1, BRSK2, etc.) descubrió recientemente que está relacionada con el trastorno del espectro autista según los datos piloto de SPARK. Los genes se colorean según su función, como el transporte de iones de potasio, el movimiento celular y la señalización mediada por esteroides, y se agrupan según las asociaciones entre los genes. P. Feliciano y col. /bioRxiv.org 2019

 

Los conjuntos de datos no solo proporcionan recursos para los investigadores que ya estudian el autismo, sino que también atraen a nuevos investigadores al campo de investigación. “Es como tener flores muy bonitas para las abejas”, dice Wendy Chung, investigadora principal de SPARK y directora de investigación clínica de SFARI.

Con los años, los conjuntos de datos han lanzado una nueva generación de investigadores de autismo. “Mi carrera de investigación se hizo en la parte posterior del SSC”, dice Sanders. “Cuando miro los artículos que publiqué, todos los que tuvieron el mayor impacto fueron el resultado del SSC”.

Minería para la investigación de oro:

Los investigadores pueden solicitar acceso a los conjuntos de datos a través de un portal en línea llamado SFARI Base. Una vez que se aprueban sus solicitudes, el grupo de informática de la Fundación Simons está listo para ayudarlos a obtener lo que necesitan de casi un petabyte de datos. Los investigadores pueden descargar datos a sus computadoras de escritorio o ejecutar cálculos en la nube que no requieren descargas masivas.

SFARI ha invertido en la construcción de una variedad de herramientas de visualización de datos en línea para ayudar a los científicos a extraer los datos para la mayor cantidad posible de investigación valiosa. La herramienta Genotipos y fenotipos en familias , desarrollada por el investigador SFARI Ivan Iossifov del Laboratorio Cold Spring Harbor y sus colaboradores, ayuda a los usuarios a buscar variantes genéticas y explorar datos conductuales e historias clínicas de los participantes en el SSC, Simons Searchlight y SPARK. SFARI Viewer , desarrollado por la compañía Frameshift Genomics en colaboración con el grupo de informática de SFARI y un equipo dirigido por el investigador SFARI Gabor Marth de la Universidad de Utah, permite a los investigadores interactuar dinámicamente con datos SSC y SPARK, filtrándolos de acuerdo con una amplia gama de opciones . Además, el portal SSC WuXi NextCODE basado en la nube (que no fue financiado directamente por SFARI) ofrece otra forma para que los investigadores visualicen y analicen los datos de SSC.

El papel del equipo informático se extiende mucho más allá de ayudar a los investigadores a acceder y analizar los conjuntos de datos. El equipo está involucrado en casi todas las etapas del proceso de preparación y distribución de los conjuntos de datos, desde el filtrado de errores hasta la predicción del impacto de las variantes genéticas y la integración de datos genómicos y fenotípicos. “Muchas personas participan para asegurarse de que los conjuntos de datos sean de la más alta calidad que podamos hacer razonablemente antes de que se distribuyan a la comunidad de investigación”, dice Alex Lash, director de informática de la fundación.

A lo largo de los años, esta administración directa ha permitido a SFARI garantizar que los conjuntos de datos cumplan con los más altos estándares de calidad y privacidad, al tiempo que se mantienen lo suficientemente flexibles como para satisfacer las necesidades cada vez mayores de los investigadores del autismo.

Una vez que un grupo de investigación ha realizado un estudio utilizando datos SFARI, el equipo de informática trabaja para integrar los descubrimientos del grupo en los conjuntos de datos existentes, enriqueciendo continuamente cada conjunto de datos con nueva información. Este proceso significa que incluso el SSC, que dejó de inscribir a nuevas familias hace años, sigue siendo “un regalo que sigue dando”, dice Marta Benedetti, científica senior de SFARI. “Hay tanto que ha salido y mucho que aún se puede extraer de este conjunto de datos”. Aunque en todos los casos la identidad de las personas en los conjuntos de datos se mantiene estrictamente privada, los participantes de SPARK, si están de acuerdo, pueden ser contactados por los investigadores si desean conocer los estudios de seguimiento para los que son elegidos. Hasta ahora, “la respuesta de los grupos ha sido fantástica”, dice Benedetti. Recientemente, este programa SPARK ‘match de investigación’ permitió a un equipo liderado por Jacob Michaelson, un investigador de autismo de la Universidad de Iowa, contactar a unas 5.000 familias para una encuesta sobre problemas comunes en el autismo, como trastornos del sueño, trastornos alimentarios y problemas gastrointestinales. . “Trabajando por nuestra cuenta, probablemente estaría al final de mi carrera antes de poder recopilar esta cantidad de datos”, dice Michaelson. El programa de investigación es un “cambio de juego”, dice. “Es el tipo de infraestructura que ningún laboratorio podría esperar tener por sí solo”. SFARI tiene una deuda especial de gratitud con las familias que han permitido que se utilicen sus datos, dice Casey White-Lehman, supervisora ​​y gerente de proyectos senior de varias cohortes de SFARI. “Sin ellos, no tendríamos ninguna de estos grupos”, dice ella. “Algunos han estado comprometidos con nosotros durante una década, y estamos humildes y agradecidos de que estén dispuestos a compartir su tiempo con nosotros”.


Descubre más desde Autismo Diario

Suscríbete y recibe las últimas entradas en tu correo electrónico.

1 comentario en «Infraestructura de datos de SFARI para el descubrimiento del autismo»

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Descubre más desde Autismo Diario

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo

×