Athrun Data Intelligence



Varios investigadores han tenido una visión amplia del progreso verificado en los últimos 50 primaveras y llegan a la misma conclusión preocupante: la productividad científica está disminuyendo. Está tomando más tiempo, más fondos y equipos más grandes para hacer descubrimientos que una vez fueron más rápidos y más baratos. Aunque se han ofrecido una variedad de explicaciones para la desaceleración, una es que, a medida que la investigación se vuelve más compleja y especializada, los científicos deben tener lugar más tiempo revisando publicaciones, diseñando experimentos sofisticados y analizando datos.

Ahora, el Lab Futurehouse de la investigación de financiación filantrópica está buscando acelerar la investigación científica con una plataforma de IA diseñada para automatizar muchos de los pasos críticos en el camino cerca de el progreso verificado. La plataforma está compuesta por una serie de agentes de IA especializados para tareas que incluyen recuperación de información, síntesis de información, diseño de síntesis química y investigación de datos.

Los fundadores de Futurehouse Sam Rodriques PhD ’19 y Andrew White creen que al dar camino a todos los científicos a sus agentes de IA, pueden romper los cuellos de botella más grandes de la ciencia y ayudar a resolver algunos de los problemas más apremiantes de la humanidad.

«El lengua natural es el efectivo lengua de la ciencia», dice Rodriques. «Otras personas están construyendo modelos básicos para la biología, donde los modelos de enseñanza instintivo hablan el lengua del ADN o las proteínas, y eso es poderoso. Pero los descubrimientos no están representados en ADN o proteínas. La única forma en que sabemos cómo representar los descubrimientos, la hipótesis y la razón es con el lengua natural».

Encontrar grandes problemas

Para su investigación de doctorado en el MIT, Rodriques buscó comprender el funcionamiento interno del cerebro en el laboratorio del profesor Ed Boyden.

«Toda la idea detrás de Futurehouse se inspiró en esta impresión que tuve durante mi doctorado en el MIT de que incluso si tuviéramos toda la información que necesitábamos entender sobre cómo funciona el cerebro, no lo sabríamos porque nadie tiene tiempo para observar toda la letras», explica Rodriques. «Incluso si pudieran leerlo todo, no podrían armarlo en una teoría integral. Esa fue una habitación fundamental del rompecabezas de Futurehouse».

Rodriques escribió sobre la condición de Nuevos tipos de grandes colaboraciones de investigación Como el posterior capítulo de su argumento doctoral en 2019, y aunque pasó algún tiempo dirigiendo un laboratorio en el Instituto Francis Crick en Londres posteriormente de la grado, se encontró gravitando cerca de problemas amplios en la ciencia que ningún laboratorio solo podría responsabilizarse.

«Estaba interesado en cómo automatizar o ampliar la ciencia y qué tipos de nuevas estructuras o tecnologías organizacionales desbloquearían una viejo productividad científica», dice Rodriques.

Cuando Chat-GPT 3.5 se lanzó en noviembre de 2022, Rodriques vio un camino cerca de modelos más poderosos que podrían producir ideas científicas por su cuenta. Más o menos de ese tiempo, todavía conoció a Andrew White, un químico computacional de la Universidad de Rochester a quien se le había otorgado camino temprano a Chat-GPT 4. White había construido el primer gran agente de idiomas para la ciencia, y los investigadores se unieron a las fuerzas para comenzar Futurehouse.

Los fundadores comenzaron con ganas de crear herramientas de IA distintas para tareas como búsquedas de letras, investigación de datos y reproducción de hipótesis. Comenzaron con la colección de datos, eventualmente lanzando Paperqa en septiembre de 2024, que Rodriques lumbre el mejor agente de IA del mundo para recuperar y resumir la información en la letras científica. Casi al mismo tiempo, lanzaron cualquier persona, una aparejo que permite a los científicos determinar si algún ha realizado experimentos específicos o explorado hipótesis específicas.

«Estábamos sentados preguntando: ‘¿Cuáles son los tipos de preguntas que nosotros, como científicos, hacemos todo el tiempo?'», Recuerda Rodriques.

Cuando Futurehouse lanzó oficialmente su plataforma el 1 de mayo de este año, renombró algunas de sus herramientas. Paper QA ahora es Crow, y tiene que algún ahora se lumbre Owl. Falcon es un agente capaz de reunir y revisar más fuentes que Crow. Otro nuevo agente, Phoenix, puede usar herramientas especializadas para ayudar a los investigadores a planificar experimentos de química. Y Finch es un agente diseñado para automatizar el descubrimiento de datos en biología.

El 20 de mayo, la compañía demostró un flujo de trabajo de descubrimiento verificado de múltiples agentes para automatizar los pasos secreto del proceso verificado e identificar un nuevo candidato terapéutico para la degeneración macular sequía relacionada con la momento (DAMD), una causa principal de ceguera irreversible en todo el mundo. En junio, Futurehouse lanzó Ether0, un maniquí de razonamiento de peso libre 24B para la química.

«Positivamente tienes que pensar en estos agentes como parte de un sistema más noble», dice Rodriques. «Pronto, los agentes de búsqueda de letras se integrarán con el agente de investigación de datos, el agente de reproducción de hipótesis, un agente de planificación de experimentos, y todos serán diseñados para trabajar juntos sin problemas».

Agentes para todos

Hoy cualquiera puede alcanzar a los agentes de Futurehouse en Platform.futurehouse.org. El extensión de la plataforma de la compañía generó emoción en la industria, y las historias han comenzado a conmover a científicos que usan los agentes para acelerar la investigación.

Uno de los científicos de Futurehouse usó a los agentes para identificar un gen que podría estar asociado con el síndrome de ovario poliquístico y crear una nueva hipótesis de tratamiento para la enfermedad. Otro investigador del Laboratorio Doméstico de Lawrence Berkeley usó a Crow para crear un asistente de IA capaz de inquirir en la cojín de datos de investigación de PubMed para obtener información relacionada con la enfermedad de Alzheimer.

Los científicos de otra institución de investigación han utilizado los agentes para realizar revisiones sistemáticas de genes relevantes para la enfermedad de Parkinson, encontrando que los agentes de Futurehouse se desempeñaron mejor que los agentes generales.

Rodriques dice que los científicos que piensan en los agentes menos como Google Scholar y más como un verificado asistente inteligente aprovechan al mayor la plataforma.

«Las personas que buscan especulaciones tienden a obtener más kilometraje de la investigación profunda de chat-gpt o3, mientras que las personas que buscan revisiones de letras en realidad fieles tienden a sacar más de nuestros agentes», explica Rodriques.

Rodriques todavía cree que Futurehouse pronto llegará a un punto en el que sus agentes puedan usar los datos sin procesar de los trabajos de investigación para probar la reproducibilidad de sus resultados y comprobar las conclusiones.

A más larga, para perseverar el progreso verificado avanzando cerca de delante, Rodriques dice que Futurehouse está trabajando en la incrustación de sus agentes con conocimiento tácito para poder realizar investigación más sofisticados, al tiempo que brinda a los agentes la capacidad de usar herramientas computacionales para explorar hipótesis.

«Ha habido tantos avances en torno a los modelos de cojín para la ciencia y los modelos de idiomas para las proteínas y el ADN, que ahora necesitamos darles a nuestros agentes camino a esos modelos y todas las otras herramientas que las personas usan comúnmente para hacer ciencia», dice Rodriques. «Construir la infraestructura para permitir que los agentes utilicen herramientas más especializadas para la ciencia serán críticos».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *