Athrun Data Intelligence


Amazon ha aprehendido un hito importante al desplegar su autómata de un millón en los centros globales de cumplimiento y clasificación, solidificando su posición como el cámara más extenso del mundo de robótica industrial. Este logro coincide con el tiro de Profundoun conjunto renovador de modelos de cojín diseñados para mejorar la coordinación entre vastas flotas de robots móviles. Entrenados en miles de millones de horas de datos operativos del mundo positivo, estos modelos prometen optimizar los movimientos de los robots, dominar la congestión y aumentar la eficiencia genérico hasta en un 10%.

El medra de los modelos de cojín en robótica

Los modelos de cojín, popularizados en Language and Vision AI, dependen de conjuntos de datos masivos para ilustrarse patrones generales que pueden adaptarse a varias tareas. Amazon está aplicando este enfoque de la robótica, donde la coordinación de miles de robots en entornos de almacén dinámicos exige inteligencia predictiva más allá de las simulaciones tradicionales.

En los centros de realización, los robots transportan estantes de inventario a trabajadores humanos, mientras que en las instalaciones de clasificación, manejan paquetes para la entrega. Con las flotas que numeran en los cientos de miles, los desafíos como los atascos y los puntos muertos pueden detener las operaciones. Deepfleet aborda estos pronosticando trayectorias e interacciones de robots, lo que permite la planificación proactiva.

Los modelos se basan en diversos datos en diseños de almacén, generaciones de robots y ciclos operativos, capturando comportamientos emergentes como las ondas de congestión. Esta riqueza de datos, que zapatilla millones de horas de autómata, permite que Deepfleet generalice en todos los escenarios, al igual que cómo los modelos de idiomas grandes se adaptan a las nuevas consultas.

Explorando las arquitecturas Deepfleet

Deepfleet comprende cuatro arquitecturas/modelos distintos, cada uno con sesgos inductivos únicos para modelar la dinámica multi-robot:

  • Maniquí centrado en el autómata (RC): Este transformador autorregresivo se centra en los robots individuales, utilizando datos locales del vecindario (por ejemplo, robots, objetos y marcadores cercanos) para predecir las siguientes acciones. Procesa actualizaciones y pares asincrónicos con un simulador de entorno determinista para la desarrollo del estado. Con 97 millones de parámetros, se destacó en las evaluaciones, logrando los errores más bajos en la posición y las predicciones estatales.
https://www.amazon.science/blog/amazon-builds-first-foundation-model-for-multirobot-coordination?utm_campaign=amazon-builds-first-foundation-model-for-multirobot-coordination&ut m_medium = Amazon-Fullment-Technologies-Robotics & utm_source = LinkedIn & utm_content = 2025-08-11-amazon-builds-first-fundation-model-for-multirobot-coordination & utm_term = 2025-august
  • Maniquí de calle de autómata (RF): Empleando la atención cruzada, este maniquí integra estados de autómata con características de calle integral como vértices y bordes. Decodifica las acciones sincrónicamente, equilibrando las interacciones locales y el contexto de todo el almacén. Con 840 millones de parámetros, se desempeñó fuertemente en las predicciones de tiempo.
https://www.amazon.science/blog/amazon-builds-first-foundation-model-for-multirobot-coordination?utm_campaign=amazon-builds-first-foundation-model-for-multirobot-coordination&ut m_medium = Amazon-Fullment-Technologies-Robotics & utm_source = LinkedIn & utm_content = 2025-08-11-amazon-builds-first-fundation-model-for-multirobot-coordination & utm_term = 2025-august
  • Maniquí de calle de imagen (IF): Tratando el almacén como una imagen multicanal, esto utiliza codificación convolucional para características espaciales y transformadores para secuencias temporales. Sin requisa, tuvo un rendimiento inferior, probablemente adecuado a los desafíos para capturar las interacciones de autómata a nivel de píxel a escalera.
  • Maniquí de calle representación (GF): Combinando redes neuronales gráficas con transformadores, esto representa el calle como un representación espacio -temporal. Maneja las relaciones globales de modo válido, prediciendo acciones y estados con solo 13 millones de parámetros, lo que lo hace computacionalmente delgado pero competitivo.
https://www.amazon.science/blog/amazon-builds-first-foundation-model-for-multirobot-coordination?utm_campaign=amazon-builds-first-foundation-model-for-multirobot-coordination&ut m_medium = Amazon-Fullment-Technologies-Robotics & utm_source = LinkedIn & utm_content = 2025-08-11-amazon-builds-first-fundation-model-for-multirobot-coordination & utm_term = 2025-august

Estos diseños varían en enfoques temporales (sincrónicos contra basados en eventos) y espaciales (locales contra globales), lo que permite a Amazon probar lo que mejor se adapta a los pronósticos a gran escalera.

Información de rendimiento y potencial de escalera

Las evaluaciones sobre los datos de almacenamiento mantenidos utilizaron métricas como la deformación de tiempo dinámico (DTW) para la precisión trayectoria y el error de retraso de congestión (CDE) para el realismo operante. El maniquí RC lideró en genérico, con puntajes DTW de 8.68 para la posición y 0.11% de CDE, mientras que GF ofreció fuertes resultados a una complejidad más quebranto.

Los experimentos de escalera confirmaron que los modelos y conjuntos de datos más grandes reducen las pérdidas de predicción, siguiendo patrones vistos en otros modelos de cojín. Para GF, las extrapolaciones sugieren que una interpretación de 1 mil millones de parámetros capacitados en 6.6 millones de episodios podría optimizar el cálculo de modo efectiva.

Esta escalabilidad es secreto, ya que la vasta flota de robots de Amazon proporciona una delantera de datos inigualable. Las primeras aplicaciones incluyen el pronóstico de congestión y el enrutamiento adaptativo, con potencial para la asignación de tareas y la prevención de punto muerto.

Impacto del mundo positivo en las operaciones

Deepfleet ya está mejorando la red de Amazon, que zapatilla más de 300 instalaciones en todo el mundo, incluida una implementación nuevo en Japón. Al mejorar la eficiencia de alucinación de los robots, permite un procesamiento de paquetes más rápido y menores costos, beneficiando directamente a los clientes.

Más allá de la eficiencia, Amazon enfatiza el crecimiento de la fuerza gremial, habiendo subido sobre 700,000 empleados desde 2019 en robótica y roles relacionados con la IA. Esta integración crea trabajos más seguros al descargar tareas pesadas a las máquinas.

Mirando con destino a el futuro

A medida que Amazon continúa refinando Deepfleet, enfocando las variantes de RC, RF y GF, la tecnología podría redefinir sistemas múltiples de robots en abastecimiento. Al exprimir la IA para anticipar los comportamientos de la flota, va más allá del control reactivo, allanando el camino para operaciones más autónomas y escalables. Esta innovación subraya cómo se extienden los modelos de cojín desde los reinos digitales hasta la automatización física, lo que potencialmente transforman las industrias que dependen de la robótica coordinada.


Mira el Papel y Blog técnico. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Encima, siéntete libertado de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.


Asif Razzaq es el CEO de MarktechPost Media Inc .. Como patrón e ingeniero fantaseador, ASIF se compromete a exprimir el potencial de la inteligencia industrial para el correctamente social. Su esfuerzo más nuevo es el tiro de una plataforma de medios de inteligencia industrial, MarktechPost, que se destaca por su cobertura profunda de noticiario de enseñanza mecánico y de enseñanza profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el notorio.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *