Athrun Data Intelligence



Estudiar la expresión genética en las células de un paciente con cáncer puede ayudar a los biólogos clínicos a comprender el origen del cáncer y predecir el éxito de diferentes tratamientos. Pero las células son complejas y contienen muchas capas, por lo que la forma en que el biólogo realiza las mediciones afecta los datos que puede obtener. Por ejemplo, contar las proteínas en una célula podría arrojar información diferente sobre los artículos del cáncer que contar la expresión genética o la morfología celular.

Importa de dónde proviene la información en la celda. Pero para capturar información completa sobre el estado de la célula, los científicos a menudo deben realizar muchas mediciones utilizando diferentes técnicas y analizarlas una a la vez. Los métodos de estudios inevitable pueden acelerar el proceso, pero los métodos existentes agrupan toda la información de cada modalidad de medición, lo que dificulta determinar qué datos provienen de qué parte de la celda.

Para exceder este problema, investigadores del Broad Institute del MIT y Harvard y ETH Zurich/Paul Scherrer Institute (PSI) desarrollaron un situación impulsado por inteligencia químico que aprende qué información sobre el estado de una célula se comparte entre diferentes modalidades de medición y qué información es monopolio de un tipo de medición particular.

Al identificar qué información proviene de qué partes de la célula, el enfoque proporciona una visión más holística del estado de la célula, lo que facilita que un biólogo vea la imagen completa de las interacciones celulares. Esto podría ayudar a los científicos a comprender los mecanismos de las enfermedades y rastrear la progresión del cáncer, los trastornos neurodegenerativos como el Alzheimer y las enfermedades metabólicas como la diabetes.

«Cuando estudiamos células, una medición a menudo no es suficiente, por lo que los científicos desarrollan nuevas tecnologías para contar diferentes aspectos de las células. Si aceptablemente tenemos muchas formas de observar una célula, al final del día solo tenemos un estado celular subyacente. Al reunir la información de todas estas modalidades de medición de una guisa más inteligente, podríamos tener una imagen más completa del estado de la célula», dice el autor principal Xinyi Zhang SM ’22, PhD ’25, ex estudiante de posgrado en el Unidad de Ingeniería Eléctrica y Ciencias de la Computación del MIT. (EECS) y afiliado del Centro Eric y Wendy Schmidt del Broad Institute del MIT y Harvard, que ahora es líder de orden en AITHYRA en Viena, Austria.

A Zhang se le une en un artículo sobre el trabajo GV Shivashankar, profesor del Unidad de Ciencias y Tecnología de la Vigor de ETH Zurich y dirigente del Laboratorio de Bioimagen Multiescala de PSI; y la autora principal Caroline Uhler, profesora de EECS y del Instituto de Datos, Sistemas y Sociedad (IDSS) del MIT, miembro del Laboratorio de Sistemas de Información y Intrepidez (LIDS) del MIT y directora del Centro Eric y Wendy Schmidt del Broad Institute. la investigacion aparece hoy en Ciencia Computacional de la Naturaleza.

Manipulación de múltiples mediciones

Hay muchas herramientas que los científicos pueden utilizar para capturar información sobre el estado de una célula. Por ejemplo, pueden contar el ARN para ver si la célula está creciendo, o pueden contar la morfología de la cromatina para ver si la célula está lidiando con señales físicas o químicas externas.

«Cuando los científicos realizan estudio multimodales, recopilan información utilizando múltiples modalidades de medición y la integran para comprender mejor el estado subyacente de la célula. Parte de la información se captura solo mediante una modalidad, mientras que otra información se comparte entre modalidades. Para comprender completamente lo que sucede internamente de la célula, es importante retener de dónde proviene la información», dice Shivashankar.

A menudo, para los científicos, la única guisa de resolver esto es realizar múltiples experimentos individuales y comparar los resultados. Este proceso tranquilo y engorroso limita la cantidad de información que pueden compilar.

En el nuevo trabajo, los investigadores construyeron un situación de estudios inevitable que comprende específicamente qué información se superpone entre diferentes modalidades y qué información es monopolio de una modalidad particular pero no capturada por otras.

«Como adjudicatario, simplemente puede ingresar los datos de su celular y automáticamente le indicará qué datos se comparten y qué datos son específicos de la modalidad», dice Zhang.

Para construir este situación, los investigadores repensaron la forma típica en que se diseñan los modelos de estudios inevitable para capturar e interpretar mediciones celulares multimodales.

Por lo universal, estos métodos, conocidos como codificadores automáticos, tienen un maniquí para cada modalidad de medición y cada maniquí codifica una representación separada de los datos capturados por esa modalidad. La representación es una lectura comprimida de los datos de entrada que descarta cualquier detalle irrelevante.

El método MIT tiene un espacio de representación compartido donde se codifican los datos que se superponen entre múltiples modalidades, así como espacios separados donde se codifican datos únicos de cada modalidad.

En esencia, podemos considerarlo como un diagrama de Venn de datos móviles.

Los investigadores todavía utilizaron un procedimiento de entrenamiento específico de dos pasos que ayuda a su maniquí a manejar la complejidad involucrada en arriesgarse qué datos se comparten entre múltiples modalidades de datos. A posteriori del entrenamiento, el maniquí puede identificar qué datos se comparten y cuáles son únicos cuando se alimenta con datos celulares que nunca antiguamente había conocido.

Datos distintivos

En pruebas sobre conjuntos de datos sintéticos, el situación capturó correctamente información conocida compartida y específica de la modalidad. Cuando aplicaron su método a conjuntos de datos unicelulares del mundo vivo, distinguieron de guisa integral y cibernética entre la actividad genética capturada conjuntamente por dos modalidades de medición, como la transcriptómica y la accesibilidad a la cromatina, al mismo tiempo que identificaron correctamente qué información provenía de solo una de esas modalidades.

Por otra parte, los investigadores utilizaron su método para identificar qué modalidad de medición capturaba un determinado tanteador proteico que indica daño en el ADN en pacientes con cáncer. Asimilar de dónde proviene esta información ayudaría al estudiado clínico a determinar qué técnica debería utilizar para contar ese tanteador.

«Hay demasiadas modalidades en una celda y no podemos medirlas todas, por lo que necesitamos una aparejo de predicción. Pero entonces la pregunta es: ¿qué modalidades deberíamos contar y qué modalidades deberíamos predecir? Nuestro método puede objetar a esa pregunta», dice Uhler.

En el futuro, los investigadores quieren que el maniquí proporcione información más interpretable sobre el estado de la célula. Igualmente quieren realizar experimentos adicionales para certificar que desentrañe correctamente la información celular y aplique el maniquí a una tonalidad más amplia de preguntas clínicas.

«No hilván con integrar la información de todas estas modalidades», afirma Uhler. «Podemos instruirse mucho sobre el estado de una célula si comparamos cuidadosamente las diferentes modalidades para comprender cómo los diferentes componentes de las células se regulan entre sí».

Esta investigación está financiada, en parte, por el Centro Eric y Wendy Schmidt del Broad Institute, la Fundación Franquista Suiza para la Ciencia, los Institutos Nacionales de Vigor de EE. UU., la Oficina de Investigación Naval de EE. UU., AstraZeneca, el MIT-IBM Watson AI Lab, la MIT J-Clinic for Machine Learning and Health y un premio Simons Investigator.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *