La superinformática y su importancia en el Centro Nacional de Análisis Genómico

El Centro Nacional de Análisis Genómico (CNAG-CRG) participa en proyectos de secuenciación a gran escala en temas tan diversos como la genética del cáncer, las enfermedades raras, las interacciones huésped-patógeno, la conservación de especies en peligro de extinción, los estudios evolutivos y la mejora de las especias agrícolas útiles.

Su objetivo es proporcionar estudios y resultados para mejorar las vidas de los ciudadanos.  El CNAG-CRG ha colaborado con Intel y Atos para la creación de su última plataforma analítica, desarrollada para impulsar nuevos conocimientos más rápidamente y con unas aplicaciones más amplias.

 

 

El CNAG-CRG secuencia más de 800.000 millones de bases del genoma cada día, y necesita realizar unos análisis rápidos y precisos para procesar grandes cantidades de datos con la máxima eficiencia posible. La identificación de un número pequeño de variaciones que impulsan conocimientos innovadores puede convertirse en una tarea compleja y que precisa una gran cantidad de tiempo.

La secuenciación del genoma es una tarea compleja y difícil. “Cada genoma está formado por más de 3.000 millones de bases.  No se trata de comenzar con la primera base del genoma para identificar todas los demás en orden hasta que tengamos la secuencia completa”, indicó Ivo Gut, director del CNAG-CRG. “Todos los genomas son un 99,9 % idénticos, pero lo que buscamos son las variaciones de ese 0,1% restante. Para encontrarlas, necesitamos descomponer cada genoma en cadenas de cientos de bases (o más), secuenciar las cadenas cortas y volver a componerlas.  Es como hacer un rompecabezas con miles de millones de piezas”.

Una vez encontradas, estas variaciones en las bases del genoma, pueden usarse para identificar ciertas características de cualquier organismo, desde el color de los ojos a la predisposición a padecer una enfermedad o la tolerancia a una medicación.

Con unas analíticas tan complejas, resulta esencial el uso de una plataforma informática potente. Los análisis de cada secuencia genómica pueden precisar cientos de horas de CPU, algo que limita el número de proyectos que se pueden realizar y dificulta la repetición de los análisis.

 

 

El CNAG-CRG ha renovado su plataforma de superinformática para garantizar la escalabilidad y el rendimiento necesario para ofrecer soporte a esta continua ampliación.  Los secuenciadores especializados suministran los datos de las secuencias genómicas a la plataforma de analíticas, que funciona en un clúster de 52 servidores bullx R4222E2* equipados con procesadores Intel Xeon E5.

Las plataformas para superinformática como la del CNAG-CRG pueden ofrecer unos resultados asombrosos.  Sin embargo, para ampliarlas a medida que aumentan los volúmenes de los datos y la demanda de mayores conocimientos, es esencial tener la flexibilidad suficiente para crecer. El CNAG-CRG colaboró con Intel y Atos para diseñar y poner en marcha una plataforma analítica sofisticada capaz de crecer sencillamente a lo largo del tiempo.

“Hemos observado que nuestra colaborando con Atos como nuestro único punto de contacto para toda la solución ha convertido la gestión en un proceso muy sencillo y nos ha permitido centrarnos en nuestras investigaciones, en vez de ocuparnos de la administración de la tecnología”, afirma Simon Heath, director tecnológico del CNAG-CRG. “También estamos muy impresionados con los últimos procesadores Intel Xeon que hemos instalado, algo que, según nuestras estimaciones, ha contribuido a un incremento x10 en el rendimiento del software que utilizamos para realizar analíticas”.

 

 

Asimismo, el CNAG-CRG reforzará en breve su capacidad, con la incorporación de nuevos secuenciadores, que se van a ocupar cada uno de 3.2TBases a la semana, una cantidad similar a la secuenciación de 32 genomas humanos completos con 30 lecturas. Esta nueva capacidad se realizará de forma simultánea a la ampliación de sus sistemas de superinformática, con lo que el CNAG no solo incrementará su capacidad de secuenciación sino también su ámbito de investigación. Esto, a su vez, ayudará al CNAG-CRG a mantener su posición cono un centro internacional de referencia en investigaciones genómicas, además de asegurar el puesto de liderazgo de España en el campo estratégico de la genómica.

 

Share This Article

Related Topics

Read This Next

Read Full Story