La Genómica está revolucionando la medicina y permite entender muchos procesos de información genética y su relación con las enfermedades personalizadas para cada paciente. Las computadoras de hoy y los sistemas están haciendo a la Medicina genómica hoy una realidad.
La informática médica, es una disciplina con más de 40 años. Surge en los EE.UU, en la década del 50, con el auge de las computadoras y el microchip. La informática médica es la aplicación de la informática y las comunicaciones al área de la salud, mediante el uso del software médico formando parte de las tecnologías sanitarias. Su objetivo principal es prestar servicio a los profesionales de la salud para mejorar la calidad de la atención médica.
El primer paso decisivo en el análisis del genoma molecular, y en gran parte de las investigaciones biológicas moleculares del medio siglo pasado, fue el descubrimiento de la estructura de doble hélice de la molécula del ADN en 1953 por Francis Crick y James Watson.
Secuenciación Genómica
La secuenciación del genoma completo, también conocida como secuenciación del genoma completo, secuenciación del genoma completo o secuenciación del genoma completo, es el proceso de determinar la totalidad, o casi la totalidad, de la secuencia de ADN del genoma de un organismo en un solo momento.
En 2003, con la finalización del Proyecto Genoma Humano, se secuenció por primera vez el genoma humano completo. La secuenciación costó casi mil millones de dólares y tardó 13 años en completarse.
Hoy, el genoma humano se puede secuenciar en menos de dos días. Los líderes de la industria esperan reducir ese costo a solo $ 100 dentro de los próximos diez años. Por supuesto, el conocimiento científico obtenido del Proyecto Genoma Humano ayudó a impulsar la tecnología de secuenciación de ADN a su estado actual, pero otro factor importante en el proceso ha sido el avance de la informática y la ingeniería.
¿Qué rol juega la capacidad de almacenamiento, velocidad y capacidad de procesamiento de las computadoras?
Una de las mayores diferencias entre las computadoras de hoy y las de 2003 es la cantidad de espacio de almacenamiento y la velocidad de procesamiento que tienen. De hecho, estas mejoras ayudaron a lanzar un tipo de técnica de secuenciación de ADN completamente diferente a la que se usaba hace solo dos décadas. La secuenciación de Sanger, el método utilizado en el Proyecto Genoma Humano, solo podía leer pequeños fragmentos de ADN a la vez. Estas lecturas superpuestas se juntaron para producir hebras más largas y finalmente ensamblar el genoma completo.
La secuenciación de próxima generación (NGS), la técnica ampliamente utilizada en la actualidad, funciona paralelizando muchas reacciones a microescala al mismo tiempo. Como resultado, los sistemas NGS generan alrededor de 15 000 veces más datos por día que un secuenciador Sanger (Figura 1). Gracias a los avances en el procesamiento, los científicos pueden secuenciar un genoma completo en una máquina NGS en solo días, en comparación con los años que tomó con un secuenciador Sanger. Este aumento en la potencia de procesamiento y la generación de datos requería un aumento comparable en la capacidad de almacenamiento, ya que una máquina NGS puede producir 1 terabyte de datos en un solo día. Debido a las actualizaciones de memoria en el espacio del disco duro y la RAM, los secuenciadores NGS pueden almacenar los terabytes de información generados a partir de la secuenciación del genoma, una hazaña que de otro modo sería imposible. Sin los rápidos avances computacionales de la última década, es poco probable que la secuenciación del ADN tuviera la velocidad y el bajo costo que tiene hoy.
Tipos de enfermedades genéticas:
- Defectos monogenéticos, que afectan solo un gen.
- Trastornos cromosómicos, donde los cromosomas (o parte de cromosomas) faltan o cambian. Los cromosomas son las estructuras que contienen nuestros genes. ...
- Multifactoriales, donde hay mutaciones en dos o más genes.
BIOINORMATICA
Una vez que se secuencia un genoma, se debe interpretar. Específicamente, se deben analizar miles de millones de puntos de datos para detectar variaciones (es decir, mutaciones) dentro del genoma. Encontrar mutaciones puede ayudar a identificar la causa y, finalmente, la cura de una serie de enfermedades. Completar esta tarea a mano sería inviable, pero con el auge de la biología computacional, los investigadores y los médicos pueden encontrar mutaciones de interés en cuestión de días. Los biólogos computacionales utilizan algoritmos de coincidencia de patrones, modelos matemáticos, procesamiento de imágenes y otras técnicas para resumir y extraer significado de los datos de secuenciación. Además, muchos biólogos computacionales ejecutan simulaciones para predecir cómo reaccionarán ciertos sistemas biológicos en diferentes entornos. Por ejemplo, una simulación podría predecir cómo reaccionan las células cancerosas a diferentes tratamientos farmacológicos y, a su vez, ayudar a encontrar una cura. La esperanza es que estos modelos computacionales y simulaciones puedan finalmente conducir al descubrimiento de nuevos tratamientos para una serie de enfermedades.
Colaboración colectiva
Una implicación importante de los avances en la tecnología de secuenciación es el auge de los kits de pruebas genéticas en el hogar, como 23andMe. Aunque tales pruebas no secuencian el genoma completo, su éxito ha sido posible gracias al bajo costo de NGS y la disponibilidad de tecnologías modernas de secuenciación. Muchas personas usan estos kits para obtener más información sobre su ascendencia y los posibles riesgos para la salud escritos en su ADN. Los investigadores, sin embargo, han encontrado una oportunidad diferente en servicios como 23andMe.
Con una amplia gama de usuarios y acceso a una serie de variantes genéticas, 23andMe anima a sus clientes a participar en varios proyectos de investigación. Muchos de estos proyectos involucran una serie de preguntas de encuestas que cubren rasgos específicos que van desde el levemente caprichoso "¿puedes hacer una división lateral?" hasta los antecedentes familiares más graves de una enfermedad o dolencia. Luego, los científicos e investigadores de datos usan los resultados de la encuesta para agrupar grupos similares de individuos en función de las mutaciones que encuentran en los datos de secuenciación. Estos resultados se pueden usar para construir mejores modelos de predicción de diferentes rasgos y proporcionar información más precisa y beneficiosa, como los posibles riesgos para la salud, a los clientes. Por ejemplo, los usuarios que indican tener antecedentes familiares de cáncer de mama tendrían todas sus secuencias de ADN comparadas para predecir segmentos o mutaciones de ADN que se correlacionan con la enfermedad.
Bases de datos y almacenamiento en la nube
Con el auge de la información genética colaborativa vino el desarrollo de varias bases de datos en línea y plataformas de almacenamiento en la nube que permiten acceder y analizar esta gran cantidad de datos. Las bases de datos modernas y las plataformas de almacenamiento en la nube brindan suficiente espacio de almacenamiento para almacenar aproximadamente 1 de cada 25 datos de ADN de estadounidenses para referencia repetida. Las capacidades de almacenamiento, las copias de seguridad y el acceso universal que brindan las bases de datos basadas en la nube permiten que los equipos globales trabajen juntos para resolver algunos de los problemas más difíciles que enfrentamos en la medicina hoy en día.
Los funcionarios encargados de hacer cumplir la ley también han encontrado valor en las bases de datos de ADN. En abril de 2018, en los EE. UU., el infame Golden State Killer fue capturado a través de la información genética que uno de sus parientes lejanos compartió en un sitio web de genealogía llamado GEDMatch. De hecho, muchos estados de EE. UU. y otros países recopilan datos de ADN de escenas del crimen y personas arrestadas por delitos graves para crear su propia base de datos de ADN forense. Aunque las bases de datos de ADN sin duda han ayudado a atrapar a delincuentes que deberían estar tras las rejas, ha planteado muchas cuestiones de privacidad.
Las trampas: privacidad y seguridad
Al igual que con cualquier dato almacenado en la nube, existe un riesgo inherente para el ADN que ha sido secuenciado y almacenado en una base de datos pública. Aunque la mayoría de las personas no son asesinos en serie, todavía existe una creciente preocupación por los problemas de privacidad y seguridad que rodean a las bases de datos de ADN. Por supuesto, cualquier persona puede acceder a las bases de datos públicas, por lo que la combinación de casi 1 millón de perfiles de ADN en GEDMatch con los registros públicos de ascendencia podría ayudar a alguien a encontrar información genealógica sobre más de la mitad de la población de EE. UU.
Incluso con bases de datos privadas como 23andMe, todavía existe la posibilidad de que los datos sean pirateados. Las implicaciones de la piratería de datos son amplias, y a algunas personas les preocupa que puedan ser incriminados por un delito o incluso clonados contra su voluntad si les roban su información genética. La naturaleza sensible y personal del ADN ofrece increíbles desafíos de seguridad y privacidad que solo pueden abordarse con la ayuda de expertos en informática.
El futuro: almacenamiento de ADN
Los avances tecnológicos claramente han facilitado avances significativos en nuestra comprensión del ADN, pero ¿es posible que lo contrario también sea cierto? Con el auge de los grandes datos, los usuarios globales de Internet ahora generan colectivamente más de 2,5 exabytes (1 exabyte = mil millones de gigabytes) de datos cada día. Los investigadores han estado trabajando para encontrar nuevas formas de almacenar esta gran cantidad de datos, lo que provocó que algunos recurrieran a un lugar sorprendente: nuestro ADN.
Referencias
https://elinsignia.com/2016/11/29/la-informatica-la-medicina/
https://sitn.hms.harvard.edu/flash/2019/the-computer-science-behind-dna-sequencing/
Comentarios
Publicar un comentario