Agente ingeniero de clasificación (REA): el agente autónomo de IA que acelera la innovación en la clasificación de anuncios de Meta

El agente de ingeniería de clasificación (REA) de Meta ejecuta de forma autónoma pasos secreto a lo amplio del ciclo de vida del educación mecánico (ML) de extremo a extremo para los modelos de clasificación de anuncios.
Esta publicación cubre las capacidades de experimentación de ML de REA: ocasionar hipótesis de forma autónoma, difundir trabajos de capacitación, depurar fallas e iterar resultados. Las publicaciones futuras cubrirán capacidades REA adicionales.
REA reduce la obligación de intervención manual. Gestiona flujos de trabajo asincrónicos que abarcan días o semanas a través de un mecanismo de hibernación y activación, con supervisión humana en puntos de valor estratégicos secreto.
En su primer dispersión de producción, REA entregó:
- Precisión del maniquí 2x: Las iteraciones impulsadas por REA duplicaron la precisión promedio del maniquí con respecto a la vírgula de pulvínulo en seis modelos.
- Salida de ingeniería 5x: Con la iteración impulsada por REA, tres ingenieros entregaron propuestas para difundir mejoras para ocho modelos, trabajo que históricamente requería dos ingenieros por maniquí.

El cuello de botella en la experimentación tradicional de educación mecánico

El sistema de publicidad de Meta ofrece experiencias personalizadas a miles de millones de personas en Facebook, Instagram, Messenger y WhatsApp. Estas interacciones se impulsan con modelos de educación mecánico (ML) en gran medida sofisticados, complejos y distribuidos masivamente que evolucionan continuamente para servir tanto a los anunciantes como a las personas que utilizan las plataformas.

La optimización de estos modelos de ML tradicionalmente ha llevado mucho tiempo. Los ingenieros elaboran hipótesis, diseñan experimentos, lanzan ejecuciones de capacitación, depuran fallas en bases de código complejas, analizan resultados e iteran. Cada ciclo completo puede ocupar días o semanas. A medida que los modelos de Meta han ido madurando a lo amplio de los primaveras, encontrar mejoras significativas se ha vuelto cada vez más difícil. La naturaleza manual y secuencial de la experimentación tradicional de ML se ha convertido en un cuello de botella para la innovación.

Para topar esto, Meta creó Ranking Engineer Agent, un agente de IA autónomo diseñado para impulsar el ciclo de vida de ML de extremo a extremo y hacer progresar iterativamente los modelos de clasificación de anuncios de Meta a escalera.

Presentamos REA: un nuevo tipo de agente autónomo

Muchas herramientas de IA utilizadas en los flujos de trabajo de ML hoy en día funcionan como asistentes: son reactivas, tienen un envergadura de tareas y están vinculadas a sesiones. Pueden ayudar con pasos individuales (por ejemplo, redactar una hipótesis, escribir archivos de configuración, interpretar registros), pero normalmente no pueden ejecutar un experiencia de principio a fin. Un ingeniero todavía tiene que animarse qué hacer a continuación, restablecer el contexto e impulsar el progreso en trabajos de larga duración y depurar fallas inevitables.

REA es diferente: un agente autónomo creado para impulsar el ciclo de vida de ML de un extremo a otro, coordinando y avanzando experimentos de ML en flujos de trabajo de varios días con una mínima intervención humana.

REA aborda tres desafíos centrales en la experimentación de ML autónomo:

Autonomía de flujo de trabajo asincrónico a amplio plazo: Los trabajos de capacitación en educación mecánico duran horas o días, mucho más de lo que cualquier asistente vinculado a una sesión puede manejar. REA mantiene un estado y una memoria persistentes en flujos de trabajo de múltiples ciclos que abarcan días o semanas, y permanece coordinado sin supervisión humana continua.
Vivientes de hipótesis diversas y de suscripción calidad: La calidad del experiencia es tan buena como la hipótesis que lo impulsa. REA sintetiza los resultados de experimentos históricos y la investigación de ML de vanguardia para mostrar configuraciones que es poco probable que surjan de un solo enfoque, y progreso con cada iteración.
Operación resiliente internamente de las limitaciones del mundo existente: Las fallas de infraestructura, los errores inesperados y los presupuestos informáticos no pueden detener a un agente autónomo. REA se adapta internamente de barreras de seguridad predefinidas, manteniendo los flujos de trabajo en movimiento sin derivar fallas rutinarias a los humanos.

REA aborda estos desafíos a través de un Mecanismo de hibernación y activación para operación continua de varias semanas, un Motor de hipótesis de fuente dual que combina una pulvínulo de datos de conocimientos históricos con un agente de investigación de ML profundo y un Ámbito de planificación de tres fases (Brío → Combinación → Explotación) que opera internamente de presupuestos informáticos aprobados por ingenieros.

Cómo gestiona REA los flujos de trabajo de educación mecánico de varios días de forma autónoma

REA se podio en una idea central: la optimización compleja del educación mecánico no es una tarea única. Es un proceso de varias etapas que se desarrolla durante días o semanas. El agente debe razonar, planificar, adaptarse y persistir en todo este horizonte.

Autonomía del flujo de trabajo a amplio plazo

Los asistentes de IA tradicionales operan en ráfagas cortas, respondiendo a indicaciones y luego esperando la venidero consulta. La experimentación con ML no funciona de esa guisa. Los trabajos de capacitación duran horas o días y el agente debe permanecer coordinado a lo amplio de estos cronogramas extendidos.

REA utiliza un mecanismo de hibernación y activación. Cuando el agente inicia un trabajo de capacitación, delega la calma a un sistema en segundo plano, se apaga para conservar bienes y automáticamente continúa donde lo dejó cuando se completa el trabajo. Esto permite un funcionamiento valioso y continuo durante períodos de tiempo prolongados sin obligación de supervisión humana constante.

Para respaldar esto, Meta creó REA en un situación de agente interno de IA, Confuciodiseñado para tareas complejas de razonamiento de varios pasos. Proporciona sólidas capacidades de coexistentes de código y un SDK flexible para integrarse con los sistemas de herramientas internos de Meta, incluidos programadores de trabajos, infraestructura de seguimiento de experimentos y herramientas de navegación de pulvínulo de código.

Vivientes de hipótesis diversas y de suscripción calidad

La calidad de la hipótesis determina directamente la calidad de un experiencia de ML. REA consulta dos sistemas especializados para ocasionar ideas diversas y de suscripción calidad:

Cojín de datos de conocimientos históricos: Un repositorio curado de experimentos pasados que permite el educación en contexto y el gratitud de patrones a través de éxitos y fracasos anteriores.
Agente de investigación de ML: Un componente de investigación profunda que investiga las configuraciones del maniquí de relato y propone estrategias de optimización novedosas, utilizando la pulvínulo de datos de conocimientos históricos de Meta.

Al sintetizar conocimientos de ambas fuentes, REA muestra configuraciones que es poco probable que surjan de un solo enfoque de forma aislada. Las mejoras más impactantes de REA han combinado optimizaciones arquitectónicas con técnicas de capacitación valioso, un resultado de esta metodología entre sistemas.

Ejecución resiliente internamente de las limitaciones del mundo existente

La experimentación en el mundo existente opera bajo restricciones informáticas y fallas inevitables. REA aborda los dos a través de una planificación estructurada y una ajuste autónoma.

Antiguamente de ejecutar cualquier plan, REA propone una logística de exploración detallada, estima el costo total de enumeración de la GPU y confirma el enfoque con un ingeniero. Un plan multifase peculiar pasa por tres etapas:

Brío: Se prueban en paralelo hipótesis individuales de diferentes fuentes para establecer líneas de pulvínulo de calidad.
Combinación: Se combinan hipótesis prometedoras para despabilarse mejoras sinérgicas.
Explotación (Optimización Intensiva): Los candidatos más prometedores se exploran agresivamente para maximizar los resultados internamente del presupuesto informático suficiente.

Cuando REA encuentra fallas, como problemas de infraestructura, errores inesperados o resultados subóptimos, ajusta el plan internamente de límites predefinidos en emplazamiento de esperar la intervención humana. Consulta un runbook de patrones de fallas comunes, toma decisiones de priorización (como excluir trabajos con errores claros de desatiendo de memoria o señales de inestabilidad de entrenamiento como explosiones de pérdidas) y depura fallas preliminares de infraestructura desde los primeros principios. Esta resiliencia es fundamental para suministrar la autonomía en tareas de amplio plazo, donde los ingenieros brindan supervisión periódica en emplazamiento de monitoreo continuo.

REA opera con rigurosas salvaguardias. Funciona exclusivamente en la pulvínulo de código del maniquí de clasificación de anuncios de Meta. Los ingenieros otorgan controles de golpe explícitos a través de revisiones de listas de demostración previas, y REA confirma los presupuestos de computación por aventajado, deteniendo o pausando las ejecuciones cuando se alcanzan los umbrales.

La cimentación del sistema REA

El Ranking Engineer Agent se podio en dos componentes interconectados, Planificador REA y Ejecutor de la REAapoyado por un compartido Sistema de habilidades, conocimientos y herramientas que proporciona capacidades de educación mecánico, datos de experimentos históricos e integraciones con la infraestructura interna de Meta. Juntos, habilitan directamente las tres capacidades principales del agente.

Autonomía a amplio plazo funciona con el flujo de ejecución: un ingeniero colabora con el creador de hipótesis para crear un plan de experiencia detallado a través del REA Planner. Ese plan se exporta a REA Executor, que gestiona la ejecución asincrónica del trabajo a través de un caracolillo de agente y un estado de calma, entrando en un estado de calma durante las ejecuciones de entrenamiento y reanudándolo con resultados al finalizar en emplazamiento de requerir un monitoreo humano continuo a lo amplio de flujos de trabajo de varias semanas.

Vivientes de hipótesis diversas y de suscripción calidad está impulsado por el flujo de conocimiento: a medida que el ejecutor completa los experimentos, un registrador de experimentos dedicado registra los resultados, las métricas secreto y las configuraciones en una pulvínulo de datos centralizada de información sobre experimentos de hipótesis. Esta memoria persistente acumula conocimiento a lo amplio de la historia completa de la operación del agente. El creador de hipótesis se podio en estos conocimientos para identificar patrones, estudiar de éxitos y fracasos anteriores y proponer hipótesis cada vez más sofisticadas para cada ronda posterior, cerrando el círculo y agravando la inteligencia del sistema con el tiempo.

Ejecución resiliente se mantiene en los dos flujos: cuando el ejecutor encuentra fallas, errores de infraestructura, señales de desatiendo de memoria o inestabilidad de entrenamiento, consulta un runbook de patrones de fallas comunes y aplica razonamiento de priorización para adaptarse de forma autónoma internamente de barreras de seguridad predefinidas. Luego reanuda el planificador con resultados procesables en emplazamiento de exponer a los ingenieros las interrupciones de rutina.

Impacto: Precisión del maniquí y productividad de la ingeniería

Precisión del maniquí 2 veces superior a los enfoques de relato

En la primera subsistencia de producción en un conjunto de seis modelos, las iteraciones impulsadas por REA duplicaron la precisión promedio del maniquí con respecto a los enfoques de relato. Esto se traduce directamente en resultados más sólidos para los anunciantes y mejores experiencias en las metaplataformas.

Aumentos de productividad en ingeniería 5x

REA amplifica el impacto al automatizar la mecánica de la experimentación de ML, lo que permite a los ingenieros centrarse en la resolución creativa de problemas y el pensamiento importante. Las mejoras arquitectónicas complejas que antiguamente requerían varios ingenieros durante varias semanas ahora pueden ser completadas por equipos más pequeños en días.

Los primeros usuarios que utilizaron REA aumentaron sus propuestas de progreso del maniquí de una a cinco en el mismo período de tiempo. El trabajo que antiguamente requería dos ingenieros por maniquí ahora requiere tres ingenieros en ocho modelos.

El futuro de la colaboración entre humanos y IA en la ingeniería de educación mecánico

REA representa un cambio en la forma en que Meta aborda la ingeniería de ML. Al crear agentes que pueden dirigir de forma autónoma todo el ciclo de vida de la experimentación, el equipo está cambiando la estructura del explicación de ML, haciendo que los ingenieros pasen de la ejecución praxis de experimentos a la supervisión estratégica, la dirección de hipótesis y la toma de decisiones arquitectónicas.

Este nuevo canon, donde los agentes manejan mecánicas iterativas mientras los humanos toman decisiones estratégicas y aprobaciones finales, es solo el eclosión. La privacidad, la seguridad y la gobernanza siguen siendo prioridades secreto para el agente. Meta continúa mejorando las capacidades de REA ajustando modelos especializados para la coexistentes de hipótesis, ampliando las herramientas de exploración y extendiendo el enfoque a nuevos dominios.

Expresiones de obligación

Ashwin Kumar, Harpal Bassali, Shashank Ankit, Deepak Chandra, Chaorong Chen, Wenlin Chen, Vitor Cid, Peter Chu, Xiaoyu Deng, Jingyi Guan, Junhua Gu, Liquan Huang, Qinjin Jia, Santanu Kolay, Jakob Moberg, Shweta Memane, Jp Owed, Sandeep Pandey, Vijay Pappu, Shyam Rajaram, Ben Schulte, Jags Somadder, Matt Steiner, Ritwik Tewari, Hangjun Xu, Zhaodong Wang, Fan Yang, Xin Zhao, Zoe Zu