Athrun Data Intelligence



Un dron autónomo que transporta agua para ayudar a extinguir un incendio forestal en la Sierra Cellisca podría encontrarse con los giratorios de Santa Ana que amenazan con empujarlo fuera del curso. Adaptarse rápidamente a estas perturbaciones desconocidas a costado presenta un enorme desafío para el sistema de control de planeo de los drones.

Para ayudar a que un dron a mantenerse en el objetivo, los investigadores del MIT desarrollaron un nuevo cálculo de control adaptativo basado en el educación obligatorio que podría minimizar su desviación de su trayectoria prevista frente a fuerzas impredecibles como vientos raciosos.

A diferencia de los enfoques típico, la nueva técnica no requiere que la persona que programara el dron autónomo sepa de antemano sobre la estructura de estas perturbaciones inciertas. En cambio, el maniquí de inteligencia fabricado del sistema de control aprende todo lo que necesita enterarse de una pequeña cantidad de datos de observación recopilados de 15 minutos de tiempo de planeo.

Es importante destacar que la técnica determina automáticamente qué cálculo de optimización debe usar para adaptarse a las perturbaciones, lo que alivio el rendimiento del seguimiento. Elige el cálculo que mejor se adapta a la geometría de perturbaciones específicas que enfrenta este dron.

Los investigadores capacitan a su sistema de control para hacer ambas cosas simultáneamente utilizando una técnica citación meta-learning, que enseña al sistema cómo adaptarse a diferentes tipos de perturbaciones.

Tomados en conjunto, estos ingredientes permiten que su sistema de control adaptativo logre un error de seguimiento de trayectoria 50 por ciento menos que los métodos de remisión en simulaciones y funcionan mejor con nuevas velocidades del rumbo que no vio durante el entrenamiento.

En el futuro, este sistema de control adaptativo podría ayudar a los drones autónomos de modo más apto a entregar parcelas pesadas a pesar de los fuertes vientos o monitorear áreas propensas a incendios de un parque doméstico.

“The concurrent learning of these components is what gives our method its strength. By leveraging meta-learning, our controller can automatically make choices that will be best for quick adaptation,” says Navid Azizan, who is the Esther and Harold E. Edgerton Assistant Professor in the MIT Department of Mechanical Engineering and the Institute for Data, Systems, and Society (IDSS), a principal investigator of the Laboratory for Information and Decision Systems (LIDS), and el autor principal de un papel en este sistema de control.

Azizan se une al documento por el autor principal Sunbochen Tang, un estudiante reconocido en el Área de Aeronáutica y Astronáutica, y Haoyuan Sun, un estudiante reconocido en el Área de Ingeniería Eléctrica y Ciencias de la Computación. La investigación se presentó recientemente en la Conferencia de Learning for Dynamics and Control.

Encontrar el cálculo correcto

Por lo normal, un sistema de control incorpora una función que modela el dron y su entorno, e incluye información existente sobre la estructura de perturbaciones potenciales. Pero en un mundo auténtico harto de condiciones inciertas, a menudo es difícil diseñar esta estructura de antemano.

Muchos sistemas de control utilizan un método de habilitación basado en un cálculo de optimización popular, conocido como descenso de gradiente, para estimar las partes desconocidas del problema y determinar cómo perseverar el dron lo más cerca posible de su trayectoria objetivo durante el planeo. Sin incautación, el descenso de gradiente es solo un cálculo en una grupo más prócer de algoritmos disponibles para nominar, conocido como descenso de espejo.

«El descenso de espejo es una grupo normal de algoritmos, y para cualquier problema cedido, uno de estos algoritmos puede ser más adecuado que otros. El nombre del mecanismo es cómo nominar el cálculo particular que es adecuado para su problema. En nuestro método, automatizamos esta dilema», dice Azizan.

En su sistema de control, los investigadores reemplazaron la función que contiene alguna estructura de perturbaciones potenciales con un maniquí de red neuronal que aprende a aproximarlos de los datos. De esta modo, no necesitan tener una estructura antes de las velocidades del rumbo que este dron podría encontrar de antemano.

Su método asimismo utiliza un cálculo para clasificar automáticamente la función de descenso de espejo correcto mientras aprende el maniquí de red neuronal de los datos, en ocasión de contraer que un agraciado ya tiene la función ideal seleccionada. Los investigadores le dan a este cálculo una variedad de funciones para nominar, y encuentra el que mejor se ajusta al problema en cuestión.

«Nominar una buena función de coexistentes de distancia para construir la habilitación de descenso de espejo derecho es importante para obtener el cálculo correcto para acortar el error de seguimiento», agrega Tang.

Aprendiendo a adaptarse

Si proporcionadamente las velocidades del rumbo que puede encontrar el dron podría cambiar cada vez que tome el planeo, la red neuronal y la función del espejo del compensador deben permanecer igual para que no necesiten ser recomputados cada vez.

Para hacer que su compensador sea más flexible, los investigadores usan meta-aprendizaje, enseñándolo a adaptarse mostrándole una variedad de familias de velocidad del rumbo durante el entrenamiento.

«Nuestro método puede hacer frente a diferentes objetivos porque, utilizando el meta-aprendizaje, podemos memorizar una representación compartida a través de diferentes escenarios de modo apto de los datos», explica Tang.

Al final, el agraciado alimenta al sistema de control como una trayectoria objetivo y se recalcula continuamente, en tiempo auténtico, cómo el dron debe producir empuje para mantenerlo lo más cerca posible de esa trayectoria mientras acomoda la perturbación incierta que encuentra.

Tanto en simulaciones como en experimentos del mundo auténtico, los investigadores mostraron que su método condujo a un error de seguimiento de trayectoria significativamente menos que los enfoques de término de saco con cada velocidad del rumbo que probaron.

«Incluso si las perturbaciones del rumbo son mucho más fuertes de lo que habíamos gastado durante el entrenamiento, nuestra técnica muestra que aún puede manejarlas con éxito», agrega Azizan.

Por otra parte, el beneficio por el cual su método superó las líneas de saco creció a medida que las velocidades del rumbo se intensificaron, lo que demuestra que puede adaptarse a entornos desafiantes.

El equipo ahora está realizando experimentos de hardware para probar su sistema de control en drones reales con diferentes condiciones del rumbo y otras perturbaciones.

Todavía quieren extender su método para que pueda manejar perturbaciones de múltiples fuentes a la vez. Por ejemplo, cambiar las velocidades del rumbo podría causar el peso de un paquete que el dron lleva para cambiar en el planeo, especialmente cuando el dron lleva cargas aperos.

Todavía quieren explorar el educación continuo, por lo que el dron podría adaptarse a las nuevas perturbaciones sin la penuria de ser capacitados en los datos que ha gastado hasta ahora.

«Navid y sus colaboradores han desarrollado un trabajo reformador que combina el meta-aprendizaje con el control adaptativo convencional para memorizar características no lineales y la ley de habilitación adecuada a partir de los datos. La secreto para su enfoque es el uso de técnicas de descenso de espejo de espejo que explotan la geometría subyacente del problema y lo hagan automáticamente. Su trabajo puede contribuir significativamente al diseño de sistemas autónomos que deben tener un entorno difícil y infracciones complejas y lo que lo hace automáticamente., Sea automáticamente. Mose y Lillian S. Bohn Profesor de Ingeniería Eléctrica e Informática y Ciencias Matemáticas en Caltech, que no participó en este trabajo.

Esta investigación fue apoyada, en parte, por MathWorks, el MIT-IBM Watson AI Lab, el MIT-Amazon Science Hub y el software MIT-Google para calcular la innovación.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *