AiChemy: agente de próxima reproducción con MCP, habilidades y datos personalizados para el descubrimiento de fármacos

Los sistemas multiagente aceleran la investigación interdisciplinaria

Imagine sistemas de IA de múltiples agentes colaborando como un equipo de expertos interdisciplinarios, examinando de forma autónoma conjuntos de datos masivos para descubrir patrones e hipótesis novedosos. Esto ahora se puede conseguir cómodamente con Model Context Protocol (MCP), un nuevo típico para integrar fácilmente diversas fuentes de datos y herramientas. El creciente ecosistema de servidores MCP, desde bases de conocimiento hasta generadores de informes, ofrece capacidades infinitas.

Qué hace AiChemy

Encontrarse AiChemy, un asistente multiagente que combina servidores MCP externos como OpenTargets, PubChem y PubMed con sus propias bibliotecas químicas en Databricks, de modo que las bases de conocimiento combinadas se puedan analizar e interpretar mejor en conjunto. Igualmente tiene Habilidades que se puede cargar opcionalmente para proporcionar instrucciones detalladas para producir informes de tareas específicas, formateados de guisa consistente para deyección de investigación, regulatorias o comerciales.

Figura 1. AiChemy es un supervisor de múltiples agentes que comprende servidores MCP externos PubChem, PubMed y OpenTargets, y servidores MCP administrados por Databricks de Genie Space (texto a SQL para datos estructurados de DrugBank) y de Vector Search (para datos no estructurados como incrustaciones moleculares de ZINC). Igualmente se pueden cargar habilidades para especificar la secuencia de tareas y el formato y estilo de los informes para asegurar resultados consistentes.

Sus capacidades secreto incluyen identificar objetivos de enfermedades y candidatos a fármacos, recuperar sus propiedades químicas y farmacocinéticas detalladas y proporcionar evaluaciones de seguridad y toxicidad. Fundamentalmente, AiChemy respalda sus hallazgos con evidencia de respaldo rastreable hasta fuentes de datos verificables, lo que lo hace ideal para la investigación.

Caso de uso 1: comprender los mecanismos de la enfermedad, encontrar objetivos farmacológicos y gestar oportunidades de cesión

El panel de Tareas guiadas proporciona las indicaciones y las habilidades del agente necesarias para realizar los pasos secreto en un flujo de trabajo de descubrimiento de fármacos de enfermedad -> objetivo -> fármaco -> nervio de la humanidades.

Identificar objetivos terapéuticos: Comenzando con un subtipo de enfermedad específico, como Cáncer de mama con receptor de estrógeno positivo (ER+)/HER2 cenizo (HER2-) (donde ER y HER2 son biomarcadores proteicos secreto), encontrar objetivos terapéuticos asociados (p. ej., ESR1).
Encuentre medicamentos asociados: Utilice el objetivo identificado (por ejemplo, ESR1) para encontrar posibles candidatos a fármacos.
Validar con humanidades: Para un fármaco candidato determinado (p. ej., camizestrant), consulte la humanidades científica para obtener evidencia que lo respalde.

Caso de uso 2: reproducción de leads por similitud química

Para identificar un seguimiento del modulador selectivo del receptor de estrógeno (SERM) vocal suficiente en 2023, Elacestrantepodemos emplear la similitud química. Buscamos en los grandes ZINC15 Biblioteca química para moléculas similares a fármacos estructuralmente similares al Elacestrant, ya que los principios de la relación cuantitativa estructura-actividad (QSAR) sugieren que compartirán propiedades similares. Esto se logra consultando Databricks Vector Search, que utiliza el formato de 1024 bits. Huella digital de conectividad extendida (ECFP) incrustación molecular de Elacestrant (como vector de consulta) para encontrar las incrustaciones más similares internamente del índice de 250.000 moléculas de ZINC.

Figura 2. AiChemy incluye la búsqueda vectorial de la pulvínulo de datos ZINC de 250.000 moléculas disponibles comercialmente. Esto nos permite gestar compuestos de plomo por similitud química. En esta captura de pantalla, le pedimos a AiChemy que encontrara en la búsqueda de vectores ZINC los compuestos más similares a Elacestrant basados en la incrustación molecular ECFP4.

Cree su propio supervisor de investigación multiagente

Personalizaremos un supervisor multiagente en Databricks integrando servidores MCP públicos con datos propietarios en Databricks. Para conseguir esto, tiene la opción de usar sin código Ladrillos de agente u opciones de codificación como Notebooks. El Zona de juegos de ladrillos de datos permite la creación rápida de prototipos y la iteración de sus agentes.

Paso 1: preparar los componentes necesarios para el supervisor multiagente

El sistema multiagente cuenta con 5 trabajadores:

Objetivos abiertos: Servidor MCP forastero de un manifiesto de conocimiento de enfermedad, fármaco objetivo
PubMed: Servidor MCP forastero de humanidades biomédica.
PubChem: Servidor MCP forastero de compuestos químicos.
Biblioteca de medicamentos (Temperamento): Una biblioteca química con propiedades farmacológicas estructuradas, convertida en un espacio talante para proporcionar capacidades de texto a SQL.
Biblioteca química (búsqueda vectorial): Una biblioteca patentada de datos químicos no estructurados con incrustaciones de huellas dactilares moleculares, preparada como un índice vectorial para favorecer la búsqueda de similitudes mediante incrustaciones.

Paso 1a: Conéctese de forma segura a servidores MCP públicos a través de Conexiones del catálogo de Unity (UC) en el interfaz de usufructuario o en un Databricks Notebook (p. ej. 4_connect_ext_mcp_opentarget.py).

Paso 1b: Asegúrese de que su(s) tabla(s) estructurada(s) (por ejemplo, DrugBank) se transforme en una espacio talante con funcionalidad de texto a SQL utilizando el interfaz de usufructuario. Ver 1_load_drugbank y descriptores.py

Paso 1c: Asegúrese de que su biblioteca química no estructurada se cree como una índice vectorial en el interfaz de usufructuario o en un Notebook para habilitar la búsqueda de similitudes. Ver 2_create VS zinc15.py

Paso 2 (opción practicable): cree el supervisor multiagente sin código Agente supervisor en 2 minutos

Para ensamblarlos, prueba el no-code Ladrillos de agente que crea un agente supervisor con los componentes anteriores a través de la interfaz de usufructuario y lo implementa en un punto final de API REST, todo en unos minutos.

Paso 2 (opción descubierta): cree el supervisor multiagente mediante Databricks Notebooks

Para capacidades más avanzadas como memoria agente y habilidades, desarrolle un Supervisor de Langgraph en Databricks Notebooks para integrarse con pulvínulo del marismaSaco de datos Postgres sin servidor de Databricks. Mira esto repositorio de código donde puede simplemente concretar los componentes multiagente (consulte el Paso 1) en el configuración.yml.

Una vez configuración.yml está definido, puede implementar el supervisor multiagente como Servidor de agentes de MLflow (Contenedor FastAPI) con una interfaz de usufructuario web (UI) de React. Desplegar entreambos a Aplicaciones de ladrillos de datos a través del interfaz de usufructuario o CLI de ladrillos de datos. Establecer el apropiado permisos para que los usuarios usen la aplicación Databricks y para que la entidad de servicio de la aplicación acceda a los posibles subyacentes (por ejemplo, prueba para registrar seguimientos, valor secreto, si corresponde).

Paso 3: Evalúe y monitoree a su agente

Cada invocación al agente se registra automáticamente y rastreado a un prueba de Databricks MLflow mediante estándares OpenTelemetry. Esto permite una practicable evaluación de las respuestas offline u online para mejorar el agente con el tiempo. Encima, su agente múltiple implementado utiliza el LLM detrás Puerta de enlace de IA para que pueda disfrutar de los beneficios de la gobernanza centralizada, las salvaguardias integradas y la total observabilidad de la preparación para la producción.

Figura 3. Todas las invocaciones al multiagente, ya sea a través de React UI o REST API, se registrarán en Seguimientos de MLflowcompatible con los estándares OpenTelemetry, para una observabilidad de un extremo a otro.

Figura 4. Los seguimientos de MLflow capturan el manifiesto de ejecución completo, incluidos los pasos de razonamiento, llamadas a herramientas, documentos recuperados, latencia y uso de tokens para favorecer la depuración y optimización.

Próximos pasos

Te invitamos a explorar el AiChemy aplicación web y repositorio de github. Comience a construir su sistema multiagente personalizado con la aparejo intuitiva y sin código Ladrillos de agente framework en Databricks para que puedas dejar de examinar y originarse a descubrir.

Etiquetado agente, AiChemy, con, datos, Descubrimiento, fármacos, generación, habilidades, MCP, para, personalizados, próxima