Los modelos de enseñanza obligatorio pueden acelerar el descubrimiento de nuevos materiales haciendo predicciones y sugiriendo experimentos. Pero la mayoría de los modelos hoy solo consideran algunos tipos específicos de datos o variables. Compare eso con los científicos humanos, que trabajan en un entorno colaborativo y consideran los resultados experimentales, la letras científica más amplia, las imágenes y el disección estructural, la experiencia o la intuición personal, y los aportes de colegas y revisores de pares.
Ahora, los investigadores del MIT han desarrollado un método para optimizar las recetas de materiales y los experimentos de planificación que incorporan información de diversas fuentes como ideas de la letras, composiciones químicas, imágenes microestructurales y más. El enfoque es parte de una nueva plataforma, convocatoria Copilot para científicos experimentales del mundo auténtico (CREST), que igualmente utiliza equipos robóticos para pruebas de materiales de suspensión rendimiento, cuyos resultados se vuelven a admitir grandes modelos multimodales para optimizar aún más las recetas de materiales.
Los investigadores humanos pueden conversar con el sistema en lengua natural, sin requerido la codificación, y el sistema hace sus propias observaciones e hipótesis en el camino. Las cámaras y los modelos de lengua visual igualmente permiten al sistema monitorear los experimentos, detectar problemas y sugerir correcciones.
«En el campo de la IA para la ciencia, la secreto es diseñar nuevos experimentos», dice Ju Li, profesor de ingeniería de energía de la Escuela de Ingeniería Carl Richard Soderberg. «Utilizamos la feedback multimodal, por ejemplo, información de la letras previa sobre cómo el paladio se comportó en las celdas de combustible a esta temperatura y la feedback humana, para complementar los datos experimentales y diseñar nuevos experimentos. Todavía usamos robots para sintetizar y caracterizar la estructura del material y probar el rendimiento».
El sistema se describe en un artículo publicado en Naturaleza. Los investigadores usaron Crest para explorar más de 900 químicas y realizar 3.500 pruebas electroquímicas, lo que llevó al descubrimiento de un material catalizador que entregó una densidad de potencia récord en una celda de combustible que funciona con sal de formato para producir electricidad.
Unirse a Li en el documento como los primeros autores son el estudiante de doctorado Zhen Zhang, Zhichu Ren PhD ’24, el estudiante de doctorado Chia-Wei Hsu y Postdoc Weibin Chen. Sus coautores son el profesor asistente del MIT IWNetim Abate; Profesor Asociado Pulkit Agrawal; Jr Profesor de Ingeniería Yang Shao-Horn; MIT.Nano investigador Aubrey Penn; Zhang-Wei Hong PhD ’25, Hongbin Xu PhD ’25; Daniel Zheng PhD ’25; Estudiantes graduados del MIT Shuhan Miao y Hugh Smith; MIT Postdocs Yimeng Huang, Weiyin Chen, Yungsheng Tian, Yifan Gao y Yaoshen Niu; ex MIT Postdoc Sipei Li; y colaboradores como Chi-Feng Lee, Yu-Cheng Shao, Hsiao-Tsu Wang y Ying-Rui Lu.
Un sistema más inteligente
Los experimentos de ciencias de los materiales pueden padecer mucho tiempo y costosos. Requieren que los investigadores diseñen flujos de trabajo cuidadosamente, hagan nuevos materiales y ejecuten una serie de pruebas y disección para comprender lo que sucedió. Esos resultados se utilizan para osar cómo mejorar el material.
Para mejorar el proceso, algunos investigadores han recurrido a una logística de enseñanza obligatorio conocido como enseñanza activo para hacer un uso valioso de puntos de datos experimentales anteriores y explorar o explotar esos datos. Cuando se combina con una técnica estadística conocida como optimización bayesiana (BO), el enseñanza activo ha ayudado a los investigadores a identificar nuevos materiales para cosas como baterías y semiconductores avanzados.
«La optimización bayesiana es como Netflix recomendando la próxima película para ver en función de su historial de visualización, excepto que recomienda el próximo intento que haga», explica Li. «Pero la optimización bayesiana básica es demasiado simplista. Utiliza un espacio de diseño en caja, por lo que si digo que voy a usar platino, paladio y hierro, solo cambia la relación de esos principios en este pequeño espacio. Pero los materiales reales tienen muchas más dependencias y Bo a menudo se pierde».
La mayoría de los enfoques de enseñanza activo igualmente se basan en flujos de datos individuales que no capturan todo lo que sucede en un intento. Para equipar los sistemas computacionales con más conocimiento humano, al tiempo que aprovecha la velocidad y el control de los sistemas automatizados, Li y sus colaboradores construyeron la cresta.
El equipo robótico de Crest incluye un androide de manejo de líquidos, un sistema de choque carbotérmico para sintetizar rápidamente los materiales, una tiempo de trabajo electroquímica automatizada para la prueba, equipos de caracterización que incluyen microscopía electrónica automatizada y microscopía óptica, y dispositivos auxiliares, como bombas y válvulas de gas, que igualmente pueden controlarse remotamente. Muchos parámetros de procesamiento igualmente se pueden ajustar.
Con la interfaz de usufructuario, los investigadores pueden chatear con Crest y decirle que use el enseñanza activo para encontrar recetas prometedoras de materiales para diferentes proyectos. La cresta puede incluir hasta 20 moléculas y sustratos precursores en su récipe. Para ejemplarizar los diseños de materiales, los modelos de Crest buscan a través de documentos científicos para descripciones de principios o moléculas precursoras que puedan ser aperos. Cuando los investigadores humanos le dicen a Crest que busque nuevas recetas, inicia una sinfonía robótica de preparación, caracterización y pruebas de muestras. El investigador igualmente puede pedirle a Crest que realice un disección de imágenes a partir de imágenes de microscopía electrónica de barredura, difracción de rayos X y otras fuentes.
La información de esos procesos se utiliza para capacitar a los modelos de enseñanza activo, que utilizan tanto el conocimiento de la letras como los resultados experimentales actuales para sugerir más experimentos y acelerar el descubrimiento de materiales.
«Para cada récipe utilizamos texto o bases de datos de letras previa, y crea estas enormes representaciones de cada récipe basada en la almohadilla de conocimiento precedente ayer de hacer el intento», dice Li. «Realizamos el disección de componentes principales en este conocimiento de incrustación de conocimiento para obtener un espacio de búsqueda limitado que capture la decano parte de la variabilidad del rendimiento. Luego utilizamos la optimización bayesiana en este espacio limitado para diseñar el nuevo intento. Luego del nuevo intento, alimentamos el recién adquirido multimodal empírico y la feedback humana en un maniquí de lengua amplio para aumentar la almohadilla de conocimiento y redefinir el espacio de búsqueda limitado, lo que nos brinda un gran boost en un gran boost en el eficiencia de enseñanza activo».
Los experimentos de ciencias de los materiales igualmente pueden malquistar desafíos de reproducibilidad. Para tocar el problema, Crest monitorea sus experimentos con cámaras, buscando problemas potenciales y sugiriendo soluciones a través de texto y voz a los investigadores humanos.
Los investigadores utilizaron la cresta para desarrollar un material de electrodo para un tipo progresista de celda de combustible de reincorporación densidad conocida como una celda de combustible de formato directo. Luego de explorar más de 900 químicas durante tres meses, Crest descubrió un material de catalizador hecho de ocho principios que lograron una progreso de 9.3 veces en la densidad de potencia por dólar sobre paladio puro, un metal precioso costoso. En pruebas adicionales, el material de Crests se usó para entregar una densidad de potencia récord a una celda de combustible de formato directo de trabajo a pesar de que la celda contenía solo un cuarto de los metales preciosos de dispositivos anteriores.
Los resultados muestran el potencial de Crest para encontrar soluciones a los problemas de energía del mundo auténtico que han afectado a la comunidad de ciencia e ingeniería de materiales durante décadas.
«Un desafío importante para los catalizadores de células de combustible es el uso de metales preciosos», dice Zhang. «Para las celdas de combustible, los investigadores han utilizado varios metales preciosos como Palladium y Platinum. Utilizamos un catalizador múltiple que igualmente incorpora muchos otros principios baratos para crear el entorno de coordinación espléndido para la actividad catalítica y la resistor a las especies de envenenamiento, como el monóxido de carbono y el átomo de hidrógeno adsorbido. Las personas han estado buscando opciones de bajo costo durante muchos primaveras. Este sistema aceleró en nuestra búsqueda en nuestra búsqueda de estos catalizs».
Un asistente útil
Al principio, la mala reproducibilidad surgió como un problema importante que limitó la capacidad de los investigadores para realizar su nueva técnica de enseñanza activo en conjuntos de datos experimentales. Las propiedades del material pueden estar influenciadas por la forma en que los precursores se mezclan y procesan, y cualquier cantidad de problemas puede alterar sutilmente las condiciones experimentales, lo que requiere una inspección cuidadosa para corregir.
Para automatizar parcialmente el proceso, los investigadores acoplaron modelos de lengua de visión y visión por computadora con conocimiento de dominio de la letras científica, lo que permitió al sistema idear la hipótesis de fuentes de irreproducibilidad y proponer soluciones. Por ejemplo, los modelos pueden notar cuándo hay una desviación del tamaño de un milímetro en forma de una muestra o cuando una pipeta se mueve fuera de emplazamiento. Los investigadores incorporaron algunas de las sugerencias del maniquí, lo que llevó a una mejor consistencia, lo que sugiere que los modelos ya son buenos asistentes experimentales.
Los investigadores señalaron que los humanos aún realizaban la decano parte de la depuración en sus experimentos.
«Crest es un asistente, no un reemplazo, para los investigadores humanos», dice Li. «Los investigadores humanos siguen siendo indispensables. De hecho, usamos el lengua natural para que el sistema pueda explicar lo que está haciendo y presentar observaciones e hipótesis. Pero este es un paso en dirección a laboratorios más flexibles y autónomos».