- Andromeda es el diseño de sistema de educación obligatorio (ML) patentado de Meta para la recuperación en la recomendación de anuncios centrado en ofrecer una prosperidad paulatino del valencia para nuestros anunciantes y personas.
- Este sistema traspasa los límites de la IA de vanguardia para la recuperación con NVIDIA Belleza Hopper superchip y Acelerador de metaentrenamiento e inferencia (MTIA) hardware a través de innovaciones en la cimentación del maniquí ML, representación de características, cálculo de educación, indexación y dechado de inferencia.
- Compartimos cómo Andrómeda establece una ley de escalamiento válido para la recuperación aprovechando el poder de las redes neuronales profundas de última vivientes, beneficiándose del codiseño de ML, sistema y hardware (chips NVIDIA y MTIA) que prosperidad rendimiento y retorno de la inversión.
La IA juega un papel importante en la publicidad de Meta sistema aprovechando el poder del educación obligatorio (ML) para predecir qué anuncios una persona encontrará más interesantes. Esto ayuda a las personas a conocer una empresa o producto que les interesa y, al mismo tiempo, ayuda al anunciante a alcanzar sus objetivos, como aumentar el conocimiento de la marca, lograr nuevos clientes e impulsar las ventas.
La recuperación es el primer paso en nuestro sistema de recomendación de anuncios de varias etapas. Esta etapa tiene la tarea de optar anuncios de decenas de millones de candidatos publicitarios para convertirlos en unos pocos miles de candidatos publicitarios relevantes. En la ulterior etapa, modelos de clasificación más grandes y sofisticados predicen el valencia de las personas y del anunciante para determinar el conjunto final de anuncios que se mostrarán a la persona.
Retos y oportunidades en esta nueva era de automatización de anunciantes con IA generativa
La etapa de recuperación es desafiante principalmente oportuno a las limitaciones de escalabilidad en dos ejes: grosor de anuncios candidatos y estrictas limitaciones de latencia.
Tamaño de anuncios candidatos: La recuperación procesa tres órdenes de magnitud más anuncios que las etapas posteriores. Funciones como la orientación predictiva, que mejoran drásticamente los resultados de los anunciantes, son computacionalmente costosas. El continuo impulso positivo de Meta Delantera+ suite aumenta aún más la cantidad de anuncios elegibles a través de automatización de creación de audiencia, asignación óptima del presupuesto, ubicación dinámica en las superficies Meta y vivientes creativa. Finalmente, con la acogida de nuevas y poderosas herramientas basadas en IA generativa Para crear y optimizar contenido creativo publicitario, se prórroga que la cantidad de creatividades publicitarias en los sistemas de recomendación de Meta crezca significativamente.
Restricciones estrictas de latencia: Aspirar anuncios rápidamente es esencial para ofrecer anuncios oportunos y relevantes, ya que cualquier retraso puede alterar la experiencia de los espectadores al no proporcionar el contenido más flagrante. A medida que la publicidad se vuelve cada vez más dinámica, las actualizaciones frecuentes tanto de la entrega como de los intereses de cada persona exigen una longevo complejidad del maniquí casi en tiempo actual.
Procesar una cantidad tan sobresaliente de anuncios en tan poco tiempo requiere mucha capacidad, lo que requiere una optimización e innovación sustanciales para aumentar la complejidad del maniquí y alcanzar una mejor personalización y, al mismo tiempo, amparar un detención retorno de la inversión (ROI) de las inversiones en infraestructura requeridas.
Liberar el valencia del anunciante a través de la innovación de educación obligatorio líder en la industria
Meta Andromeda es un motor de recuperación de anuncios personalizado que aprovecha el superchip NVIDIA Grace Hopper para permitir la innovación de educación obligatorio de vanguardia en la etapa de recuperación de anuncios para impulsar la eficiencia y el rendimiento de los anunciantes. Los avances secreto de la IA incluyen:
Redes neuronales profundas diseñadas a medida para el superchip NVIDIA Grace Hopper para ofrecer un rendimiento superior
Andromeda prosperidad el rendimiento del sistema de meta anuncios al ofrecer anuncios más personalizados a los espectadores y maximizar el retorno de la inversión publicitaria para los anunciantes. El equipo de Meta’s Ads ha creado una red neuronal profunda con longevo complejidad informática y paralelismo masivo en el superchip NVIDIA Grace Hopper para cultivarse mejor las interacciones de orden superior de las personas y los datos publicitarios. Su implementación en las aplicaciones de Instagram y Facebook ha conseguido una prosperidad del +6 % en la recuperación del sistema de recuperación, lo que supone un +8 %. calidad de los anuncios prosperidad en segmentos seleccionados.
Indexación jerárquica para respaldar el crecimiento exponencial de creatividades publicitarias a partir de creatividades Advantage+
Advantage+ automatiza la asignación de presupuesto, la segmentación por audiencia y los ajustes de ofertas, optimizando la trámite de campañas y mejorando el rendimiento a través de más anuncios en el sistema para diferentes audiencias.
Por ejemplo, cuando los anunciantes que no utilizaban previamente la creatividad Advantage+ activaron sus funciones de orientación impulsadas por IA, experimentaron un aumento del 22 % en el ROAS de nuestros anuncios. Estimamos que las empresas que utilizan la vivientes de imágenes están experimentando un aumento del +7 % en las conversiones. Incluso en esta etapa original, más de un millón de anunciantes utilizaron nuestras herramientas de IA generativa (GenAI) para crear más de 15 millones de anuncios en un mes. Andromeda está diseñado para maximizar el rendimiento de los anuncios utilizando el crecimiento exponencial en el grosor de anuncios elegibles disponibles en la etapa de recuperación. Introduce un índice jerárquico válido para ascender a un gran grosor de creatividades publicitarias, lo que permite al Asimilación de tecnologías GenAI por parte de los anunciantes.
Eficiencia del explicación de IA
Andromeda reduce la complejidad del sistema al minimizar los componentes y la dialéctica basada en reglas, lo que permite la optimización del rendimiento de un extremo a otro. Este sistema optimizado prosperidad el ritmo de acogida de futuras innovaciones de IA en el espacio de recuperación.
El nuevo dechado de recuperación de anuncios personalizados de Meta
Antiguamente de Andrómeda, los sistemas de recuperación de Meta solo podían aplicar una personalización limitada, basándose en un proceso con etapas de maniquí aisladas y numerosas heurísticas basadas en reglas para encargar la gran cantidad de anuncios. Este enfoque obstaculizó la optimización de un extremo a otro y la asignación válido de medios globales para maximizar el rendimiento. Manejar un grosor tan enorme de anuncios por solicitud era arduo, consumía mucho ufano de facción de memoria y era difícil de ascender, lo que resultaba en un bajo paralelismo a nivel de hardware en los modelos de recuperación convencionales. Esto a menudo condujo a un rendimiento subóptimo y a una acogida más lenta de las innovaciones en IA.

Andromeda representa un brinco tecnológico significativo en la recuperación: aborda los desafíos anteriores con innovaciones secreto en sistemas y educación obligatorio.
Una red neuronal profunda de última vivientes para la recuperación
Andromeda puede ascender de forma válido los modelos de recuperación mediante el diseño de una red neuronal profunda mucho personalizada con un costo de inferencia sublineal, lo que permite un aumento significativo de la capacidad del maniquí (10,000x) para una longevo personalización. Las relaciones latentes complejas entre los intereses, productos y servicios de las personas ofrecidos a través de anuncios se capturan mediante funciones de interacción avanzadas y nuevos algoritmos, lo que prosperidad aún más la relevancia y precisión de las recomendaciones.
El diseño está optimizado para hardware de IA, lo que minimiza los cuellos de botella en el ufano de facción de la memoria y permite modelos de recuperación mucho paralelos y con un uso intensivo de computación con detención rendimiento. El preprocesamiento de GPU se utiliza para la procedencia de funciones, y todas las funciones y la incorporación de anuncios precalculados se almacenan en la memoria almacén del Grace Hopper Superchip. Este enfoque aborda las limitaciones de escalera tradicionales de ufano de facción pequeño de interconexión de CPU a GPU, gran sobrecarga de E/S de memoria y descenso utilización de GPU, y permite el manejo válido de un conjunto más sobresaliente de entradas de funciones diversas.
Indexación jerárquica para eficiencia y recuperación escalable
Andromeda organiza los anuncios en un índice jerárquico con múltiples capas, lo que reduce la cantidad de pasos de inferencia al centrarse solo en los nodos más relevantes. El índice jerárquico y los modelos de recuperación se entrenan conjuntamente, lo que alinea las representaciones del índice con las redes neuronales; esto prosperidad tanto la precisión como la recuperación en comparación con las redes neuronales de dos torres comúnmente utilizadas o la búsqueda aproximada del vecino más cercano.
La red neuronal estructurada jerárquica proporciona costos de inferencia sublineales, lo que permite que los modelos de recuperación escale a una capacidad mucho longevo, permitiendo el manejo válido de un longevo grosor de anuncios con una inscripción precisión de recuperación y al mismo tiempo logrando un longevo rendimiento.
Elasticidad del maniquí
Andromeda prosperidad el retorno de la inversión genérico del sistema al permitir una asignación de medios ágil y válido. Un diseño consciente de los segmentos aprovecha modelos de longevo complejidad para ofrecer segmentos de anuncios de detención valencia para maximizar el retorno de la inversión. Ajusta automáticamente la complejidad del maniquí y los pasos de inferencia en tiempo actual en función de los medios disponibles, lo que permite un sistema de recuperación más escalable. Yuxtapuesto con una red neuronal estructurada jerárquica, la elasticidad del maniquí aumenta aún más la eficiencia de la inferencia del maniquí hasta 10 veces.
Un maniquí de recuperación optimizado
Andromeda prosperidad significativamente la instrucción del maniquí de recuperación y el paralelismo a nivel de subprocesos a través de innovaciones en la cimentación del maniquí, características, algoritmos de educación y el dechado de inferencia. Este maniquí está construido con operadores de GPU de descenso latencia, detención rendimiento y memoria-IO, que utilizan una fusión profunda del kernel y técnicas avanzadas de canalización de software. Esto minimiza la sobrecarga de distribución del kernel, evita cuellos de botella en las E/S repetidas de la memoria HBM-SRAM y reduce la dependencia de módulos de descenso intensidad aritmética.
A diferencia de los modelos de recuperación convencionales que se basan en funciones diseñadas por expertos, Andromeda aprovecha las enormes capacidades de computación paralela de la GPU NVIDIA Hopper para reparar dinámicamente señales latentes de interacción usuario-anuncio sobre la marcha, logrando una prosperidad de más de 100 veces tanto en la latencia de procedencia de funciones como en el rendimiento de los modelos anteriores. Componentes basados en CPU. Encima, la interconexión CPU-GPU de gran ufano de facción del chip potencia la inferencia de recuperación de anuncios para procesar una enorme cantidad de anuncios por solicitud, lo que permite una entrega más rápida y válido de anuncios relevantes y personalizados. El esfuerzo ha mejorado las consultas de inferencia de modelos por segundo (QPS) de un extremo a otro en más de 3 veces.
Avanzando en el estado del arte en la recuperación de anuncios
Andromeda prosperidad significativamente el sistema de anuncios de Meta al permitir la integración de IA que optimiza y prosperidad las capacidades de personalización en la etapa de recuperación y prosperidad el retorno de la inversión publicitaria. Una decisión de indexación jerárquica que aprovecha las redes neuronales profundas codiseñadas con NVIDIA Grace Hopper Superchip ayuda a topar los desafíos de escalabilidad presentados por el crecimiento exponencial de los creativos y, al mismo tiempo, ofrece la mejor experiencia dada la estricta latencia y los presupuestos de ROI de capacidad. Andromeda capitaliza la rápida acogida industrial de la automatización Advantage+ y GenAI para ofrecer valencia a nuestros anunciantes y personas. que utilizan nuestro conjunto de productosy Meta.
De cara al futuro, se prórroga que la cimentación del maniquí de Andrómeda haga la transición para asilar una función de pérdida autorregresiva, lo que conducirá a una decisión de inferencia más válido y rápida que ofrezca un conjunto más diverso de candidatos publicitarios. Una longevo variedad de anuncios puede mejorar la experiencia de las personas con los anuncios y gestar mejores resultados para los anunciantes.
La integración de Andromeda con MTIA y las generaciones futuras de GPU disponibles comercialmente seguirán superando los límites de la recuperación escalable, mejorando aún más el rendimiento de los anunciantes y logrando lo que estimamos será otro aumento de 1000 veces en la complejidad del maniquí.
Expresiones de devolución
Nos gustaría pagar a Habiya Beg, Zain Brohi y Wenlin Chen. Chunli Fu, Golnaz Ghasemiesfeh, Xingfeng He, Akshay Hegde, Liquan Huang, Liuhan Huang, Kamran Izadi, Santosh Janardhan, Karthik Jayaraman, Changkyu Kim, Santanu Kolay, Ilia Lewis, Wenqian Li, Xiaotian Li, Rocky Liu, Paolo Massimi, Kexin Nie , Sandeep Pandey, Uladzimir Pashkevich, Varna Puvvada, Hang Qu, Melanie Roe, Yan Shi, Matt Steiner, Alisha Swinteck, Bangsheng Tang, Jim Tao, Sunay Vaishnav, Arunprasad Venkatraman, Vidhoon Viswanathan, Sasha Vorontsov, Minghui Wanghan, Fangzhou Xu, Nathan Yan, Tak Yan, Yang Yang, Qing Zhang, Fangyu Zou y a todos los que contribuyeron al éxito de Meta Andrómeda.