
A medida que han ido creciendo las capacidades de los modelos de IA generativa, probablemente haya trillado cómo pueden metamorfosear mensajes de texto simples en imágenes hiperrealistas e incluso clips de vídeo extendidos.
Más recientemente, la IA generativa ha demostrado potencial para ayudar a químicos y biólogos a explorar moléculas estáticas, como proteínas y ADN. Modelos como AlphaFold pueden predecir estructuras moleculares para acelerar el descubrimiento de fármacos, y el «asistido por el MIT»RFdifusión”, por ejemplo, puede ayudar a diseñar nuevas proteínas. Sin incautación, un desafío es que las moléculas se mueven y se agitan constantemente, lo cual es importante modelar al construir nuevas proteínas y fármacos. Fingir estos movimientos en una computadora usando la física (una técnica conocida como dinámica molecular) puede ser muy costoso y requiere miles de millones de pasos de tiempo en supercomputadoras.
Como un paso alrededor de la simulación de estos comportamientos de guisa más eficaz, el Laboratorio de Ciencias de la Computación e Inteligencia Sintético del MIT (CSAIL) y los investigadores del Área de Matemáticas han desarrollado un maniquí generativo que aprende de datos anteriores. El sistema del equipo, llamado MDGen, puede tomar un cuadro de una molécula 3D y disimular lo que sucederá a continuación como un video, conectar imágenes fijas separadas e incluso completar cuadros faltantes. Al presionar el “cogollo de reproducción” de las moléculas, la aparejo podría ayudar a los químicos a diseñar nuevas moléculas y estudiar de cerca qué tan correctamente interactuarían sus prototipos de medicamentos para el cáncer y otras enfermedades con la estructura molecular que pretende impactar.
El coautor principal Bowen Jing SM ’22 dice que MDGen es una prueba temprana de concepto, pero sugiere el manifestación de una nueva e interesante dirección de investigación. «Al principio, los modelos de IA generativa producían vídeos poco simples, como una persona parpadeando o un perro moviendo la nalgas», dice Jing, estudiante de doctorado en CSAIL. “Avanzando unos primaveras, ahora tenemos modelos increíbles como Sora o Veo que pueden ser enseres en todo tipo de formas interesantes. Esperamos inculcar una visión similar para el mundo molecular, donde las trayectorias dinámicas son los videos. Por ejemplo, puedes darle al maniquí el primer y el décimo cuadro, y animará lo que hay en el medio, o puede eliminar el ruido de un video molecular y adivinar lo que estaba oculto”.
Los investigadores dicen que MDGen representa un cambio de dechado con respecto a trabajos anteriores comparables con IA generativa de una guisa que permite casos de uso mucho más amplios. Los enfoques anteriores eran «autorregresivos», lo que significa que se basaban en el fotograma fijo antedicho para construir el próximo, comenzando desde el primer fotograma para crear una secuencia de vídeo. Por el contrario, MDGen genera los fotogramas en paralelo con la difusión. Esto significa que MDGen se puede utilizar para, por ejemplo, conectar fotogramas en los puntos finales, o «muestrear» una trayectoria de devaluación velocidad de fotogramas encima de presionar reproducir en el fotograma auténtico.
Este trabajo se presentó en un artículo mostrado en la Conferencia sobre Sistemas de Procesamiento de Información Neural (NeurIPS) el pasado mes de diciembre. El verano pasado, fue premiado por su potencial impacto comercial en el Taller ML4LMS de la Conferencia Internacional sobre Educación Inevitable.
Algunos pequeños pasos delante para la dinámica molecular
En experimentos, Jing y sus colegas descubrieron que las simulaciones de MDGen eran similares a ejecutar simulaciones físicas directamente, al tiempo que producían trayectorias de 10 a 100 veces más rápidas.
El equipo probó primero la capacidad de su maniquí para vislumbrar un entorno 3D de una molécula y suscitar los siguientes 100 nanosegundos. Su sistema reunió sucesivos bloques de 10 nanosegundos para que estas generaciones alcanzaran esa duración. El equipo descubrió que MDGen podía competir con la precisión de un maniquí de narración, mientras completaba el proceso de gestación de video en aproximadamente un minuto, una mera fracción de las tres horas que le tomó al maniquí de narración disimular la misma dinámica.
Cuando se le dio el primer y el zaguero fotograma de una secuencia de un nanosegundo, MDGen incluso modeló los pasos intermedios. El sistema de los investigadores demostró cierto categoría de realismo en más de 100.000 predicciones diferentes: simuló trayectorias moleculares más probables que sus líneas de cojín en clips de menos de 100 nanosegundos. En estas pruebas, MDGen incluso indicó una capacidad de difundir sobre péptidos que no había trillado ayer.
Las capacidades de MDGen incluso incluyen la simulación de cuadros interiormente de cuadros, «aumentando el muestreo» de los pasos entre cada nanosegundo para capturar fenómenos moleculares más rápidos de guisa más adecuada. Incluso puede “pintar” estructuras de moléculas, restaurando información sobre ellas que se eliminó. Con el tiempo, los investigadores podrían utilizar estas características para diseñar proteínas basándose en una delimitación de cómo deben moverse las diferentes partes de la molécula.
Jugando con la dinámica de las proteínas
Jing y el coautor principal Hannes Stärk dicen que MDGen es una señal temprana de progreso alrededor de la gestación de dinámica molecular de guisa más eficaz. Aún así, carecen de datos para que estos modelos tengan un impacto inmediato en el diseño de fármacos o moléculas que induzcan los movimientos que los químicos querrán ver en una estructura objetivo.
Los investigadores pretenden ampliar MDGen desde el modelado de moléculas hasta la predicción de cómo cambiarán las proteínas con el tiempo. “Actualmente utilizamos sistemas de juguetes”, afirma Stärk, incluso estudiante de doctorado en CSAIL. “Para mejorar las capacidades predictivas de MDGen para modelar proteínas, necesitaremos emplear la edificación flagrante y los datos disponibles. Todavía no tenemos un repositorio a escalera de YouTube para ese tipo de simulaciones, por lo que esperamos desarrollar un método de enseñanza forzoso independiente que pueda acelerar el proceso de compendio de datos para nuestro maniquí”.
Por ahora, MDGen presenta un camino confortante alrededor de el modelado de cambios moleculares invisibles a simple horizonte. Los químicos incluso podrían utilizar estas simulaciones para profundizar en el comportamiento de prototipos de medicamentos para enfermedades como el cáncer o la tuberculosis.
«Los métodos de enseñanza forzoso que aprenden de la simulación física representan una nueva y floreciente frontera en la IA para la ciencia», dice Bonnie Berger, profesora de Matemáticas Simons del MIT, investigadora principal de CSAIL y autora principal del artículo. «MDGen es un entorno de modelado versátil y multipropósito que conecta estos dos dominios, y estamos muy entusiasmados de compartir nuestros primeros modelos en esta dirección».
«Muestrear rutas de transición realistas entre estados moleculares es un desafío importante», dice el autor principal Tommi Jaakkola, profesor de ingeniería eléctrica e informática Thomas Siebel del MIT y del Instituto de Datos, Sistemas y Sociedad, e investigador principal de CSAIL. . «Este trabajo auténtico muestra cómo podríamos comenzar a enfrentarse estos desafíos cambiando el modelado generativo a ejecuciones de simulación completa».
Investigadores del campo de la bioinformática han anunciado este sistema por su capacidad para disimular transformaciones moleculares. «MDGen modela simulaciones de dinámica molecular como una distribución conjunta de incrustaciones estructurales, capturando movimientos moleculares entre pasos de tiempo discretos», dice el profesor asociado de la Universidad Tecnológica de Chalmers, Simon Olsson, que no participó en la investigación. «Aprovechando un objetivo de enseñanza tapado, MDGen permite casos de uso innovadores, como el muestreo de rutas de transición, estableciendo analogías con trayectorias de pintura que conectan fases metaestables».
El trabajo de los investigadores sobre MDGen fue apoyado, en parte, por el Instituto Franquista de Ciencias Médicas Generales, el Área de Energía de EE. UU., la Fundación Franquista de Ciencias, el Consorcio de Educación Inevitable para el Descubrimiento y Síntesis Farmacéuticos, la Clínica Abdul Latif Jameel para el Educación Inevitable en Lozanía, la Agencia de Reducción de Amenazas de Defensa y la Agencia de Proyectos de Investigación Destacamento de Defensa.