Athrun Data Intelligence



En el interior de un almacén autónomo superhombre, cientos de robots recorren los pasillos mientras recolectan y distribuyen artículos para cumplir con un flujo constante de pedidos de los clientes. En este entorno tan agitado, incluso los pequeños atascos de tráfico o las colisiones menores pueden provocar desaceleraciones masivas.

Para evitar tal avalancha de ineficiencias, investigadores del MIT y la empresa tecnológica Symbotic desarrollaron un nuevo método que mantiene automáticamente una flota de robots en movimiento sin problemas. Su método aprende qué robots deben ir primero en cada momento, en función de cómo se está formando la congestión, y se adapta para priorizar a los robots que están a punto de quedarse atascados. De esta forma, el sistema puede redirigir los robots con adelanto para evitar cuellos de botella.

El sistema híbrido utiliza enseñanza por refuerzo profundo, un poderoso método de inteligencia sintético para resolver problemas complejos, para determinar qué robots deben tener prioridad. Luego, un cálculo de planificación rápido y confiable envía instrucciones a los robots, permitiéndoles objetar rápidamente en condiciones en constante cambio.

En simulaciones inspiradas en diseños reales de almacenes de comercio electrónico, este nuevo enfoque logró aproximadamente un aumento del 25 por ciento en el rendimiento con respecto a otros métodos. Es importante destacar que el sistema puede adaptarse rápidamente a nuevos entornos con diferentes cantidades de robots o diseños de almacén variados.

«Hay muchos problemas de toma de decisiones en la fabricación y la abastecimiento, donde las empresas dependen de algoritmos diseñados por expertos humanos. Pero hemos demostrado que, con el poder del enseñanza por refuerzo profundo, podemos alcanzar un rendimiento sobrehumano. Este es un enfoque muy prometedor, porque en estos almacenes gigantes incluso un aumento del 2 o 3 por ciento en el rendimiento puede tener un enorme impacto», dice Han Zheng, estudiante de posgrado en el Laboratorio de Sistemas de Información y Audacia (LIDS) del MIT y autor principal de un artículo sobre este nuevo enfoque.

A Zheng se unen en el artículo Yining Ma, un postdoctorado de LIDS; Brandon Araki y Jingkai Chen de Symbotic; y la autora principal Cathy Wu, profesora asociada de expansión profesional de la promoción de 1954 en Ingeniería Civil y Ambiental (CEE) y del Instituto de Datos, Sistemas y Sociedad (IDSS) del MIT, y miembro de LIDS. la investigacion aparece hoy en el Revista de investigación en inteligencia sintético.

Redirigir robots

Coordinar simultáneamente cientos de robots en un almacén de comercio electrónico no es una tarea obvio.

El problema es especialmente complicado porque el almacén es un entorno dinámico y los robots reciben continuamente nuevas tareas a posteriori de alcanzar sus objetivos. Es necesario redirigirlos rápidamente cuando salen y entran al almacén.

Las empresas suelen utilizar algoritmos escritos por expertos humanos para determinar dónde y cuándo deben moverse los robots para maximizar la cantidad de paquetes que pueden manejar.

Pero si hay congestión o una colisión, es posible que una empresa no tenga más remedio que cerrar todo el almacén durante horas para solucionar el problema manualmente.

«En este contexto, no tenemos una predicción exacta del futuro. Sólo sabemos lo que nos deparará el futuro, en términos de los paquetes que llegan o la distribución de pedidos futuros. El sistema de planificación debe adaptarse a estos cambios a medida que avanzan las operaciones del almacén», afirma Zheng.

Los investigadores del MIT lograron esta adaptabilidad mediante el enseñanza involuntario. Comenzaron diseñando un maniquí de red neuronal para realizar observaciones del entorno del almacén y lanzarse cómo priorizar los robots. Entrenan este maniquí mediante enseñanza por refuerzo profundo, un método de prueba y error en el que el maniquí aprende a controlar robots en simulaciones que imitan almacenes reales. El maniquí es recompensado por tomar decisiones que aumentan el rendimiento común y al mismo tiempo evitan conflictos.

Con el tiempo, la red neuronal aprende a coordinar muchos robots de guisa capaz.

«Al interactuar con simulaciones inspiradas en diseños de almacenes reales, nuestro sistema recibe feedback que utilizamos para hacer que su toma de decisiones sea más inteligente. La red neuronal entrenada puede adaptarse a almacenes con diferentes diseños», explica Zheng.

Está diseñado para capturar las limitaciones y obstáculos a generoso plazo en el camino de cada androide, al mismo tiempo que considera las interacciones dinámicas entre los robots a medida que se mueven por el almacén.

Al predecir las interacciones actuales y futuras de los robots, el maniquí planea evitar la congestión antiguamente de que suceda.

Posteriormente de que la red neuronal decide qué robots deben cobrar prioridad, el sistema emplea un cálculo de planificación probado y efectivo para decirle a cada androide cómo moverse de un punto a otro. Este capaz cálculo ayuda a los robots a reaccionar rápidamente en el entorno cambiante del almacén.

Esta combinación de métodos es esencia.

«Este enfoque híbrido se base en el trabajo de mi liga sobre cómo alcanzar lo mejor de uno y otro mundos entre el enseñanza involuntario y los métodos de optimización clásicos. Los métodos puros de enseñanza involuntario todavía luchan por resolver problemas de optimización complejos y, sin bloqueo, requiere mucho tiempo y trabajo para los expertos humanos diseñar métodos efectivos. Pero en conjunto, usar métodos diseñados por expertos de la guisa correcta puede simplificar enormemente la tarea de enseñanza involuntario», dice Wu.

Exceder la complejidad

Una vez que los investigadores entrenaron la red neuronal, probaron el sistema en almacenes simulados que eran diferentes a los que habían manido durante el entrenamiento. Cedido que las simulaciones industriales eran demasiado ineficientes para este confuso problema, los investigadores diseñaron sus propios entornos para imitar lo que sucede en los almacenes reales.

En promedio, su enfoque híbrido basado en el enseñanza logró un rendimiento un 25 por ciento anciano que los algoritmos tradicionales, así como un método de búsqueda aleatoria, en términos de cantidad de paquetes entregados por androide. Su enfoque todavía podría crear planes viables de rutas de robots que superen la congestión causada por los métodos tradicionales.

«Especialmente cuando aumenta la densidad de robots en el almacén, la complejidad aumenta exponencialmente y estos métodos tradicionales rápidamente comienzan a fracasar. En estos entornos, nuestro método es mucho más capaz», afirma Zheng.

Si perfectamente su sistema aún está remotamente de implementarse en el mundo vivo, estas demostraciones resaltan la viabilidad y los beneficios de utilizar un enfoque guiado por enseñanza involuntario en la automatización de almacenes.

En el futuro, los investigadores quieren incluir asignaciones de tareas en la formulación del problema, ya que determinar qué androide completará cada tarea afecta la congestión. Igualmente planean ampliar su sistema a almacenes más grandes con miles de robots.

Esta investigación fue financiada por Symbotic.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *