Cuando algunos trenes de cercanías llegan al final de la recta, deben correr a una plataforma de conmutación para ser giradas para que puedan salir de la temporada más tarde, a menudo desde una plataforma diferente a la que llegaron.
Los ingenieros usan programas de software llamados solucionadores algorítmicos para planificar estos movimientos, pero en una temporada con miles de llegadas y expectativas semanales, el problema se vuelve demasiado complicado para que un solucionador tradicional se desentraques de una vez.
Usando el educación inevitable, los investigadores del MIT han desarrollado un sistema de planificación mejorado que reduce el tiempo de resolución hasta en un 50 por ciento y produce una alternativa que cumpla mejor con el objetivo de un legatario, como las expectativas de trenes a tiempo. El nuevo método incluso podría estar de moda para resolver eficientemente otros problemas logísticos complejos, como programar el personal del hospital, asignar equipos de aerolíneas o asignar tareas a máquinas de manufactura.
Los ingenieros a menudo dividen este tipo de problemas en una secuencia de subproblemas superpuestos que se pueden resolver en una cantidad factible de tiempo. Pero las superposiciones hacen que muchas decisiones sean recomputadas innecesariamente, por lo que se necesita el solucionador mucho más tiempo para alcanzar una alternativa óptima.
El nuevo enfoque de inteligencia industrial mejorado aprende qué partes de cada subproblema deben permanecer sin cambios, congelando esas variables para evitar cálculos redundantes. Luego, un solucionador algorítmico tradicional aborda las variables restantes.
«A menudo, un equipo dedicado podría acontecer meses o incluso primaveras diseñando un operación para resolver solo uno de estos problemas combinatorios. El educación profundo reciente nos brinda la oportunidad de usar nuevos avances para ayudar a optimizar el diseño de estos algoritmos. Podemos tomar lo que sabemos correctamente y usar AI para acelerarlo», dice Cathy Wu, el Tomas D. y Virginia W. Cabot Development Associating en el profesor civil en el crecimiento de la carrera. Datos, sistemas y sociedad (IDS) en el MIT, y miembro del Laboratorio para Sistemas de Información y Intrepidez (LIDS).
Ella se une en el papel por el autor principal Sirui Li, un estudiante investido de IDSS; Wenbin Ouyang, un estudiante investido de CEE; y Yining MA, A Postdocs Postdocs. La investigación se presentará en la Conferencia Internacional sobre Representaciones de Formación.
Eliminando la exceso
Una motivación para esta investigación es un problema práctico identificado por el estudiante de ingenio Devin Camille Wilkins en el curso de transporte de nivel de entrada de Wu. El estudiante quería aplicar el educación de refuerzo a un definitivo problema de disputa de tren en la temporada Finalidad de Boston. La estructura de tránsito debe asignar muchos trenes a un número restringido de plataformas donde se pueden dar una envés ayer de su presentación a la temporada.
Este resulta ser un problema de programación combinatoria muy complicado: el tipo exacto de problema en el que el laboratorio de Wu ha pasado en los últimos primaveras trabajando.
Cuando se enfrenta a un problema a dadivoso plazo que implica asignar un conjunto restringido de posibles, como tareas de manufactura, a un conjunto de máquinas, los planificadores a menudo enmarcan el problema como una programación flexible de la tienda de empleo.
En la programación flexible de la tienda de empleo, cada tarea necesita una cantidad diferente de tiempo para completar, pero las tareas se pueden asignar a cualquier máquina. Al mismo tiempo, cada tarea se compone de operaciones que deben realizarse en el orden correcto.
Tales problemas se vuelven demasiado grandes y difíciles de manejar para los solucionadores tradicionales, por lo que los usuarios pueden consumir optimización de horizonte rodante (Rho) para dividir el problema en fragmentos manejables que se pueden resolver más rápido.
Con Rho, un legatario asigna algunas tareas iniciales a las máquinas en un horizonte de planificación fijo, tal vez una ventana de tiempo de cuatro horas. Luego, ejecutan la primera tarea en esa secuencia y cambian el horizonte de planificación de cuatro horas en torno a delante para asociar la ulterior tarea, repitiendo el proceso hasta que se resuelva todo el problema y se cree el cronograma final de tareas de las tareas.
Un horizonte de planificación debe ser más dadivoso que la duración de cualquier tarea, ya que la alternativa será mejor si el operación incluso considera tareas que surgirán.
Pero cuando el horizonte de planificación avanza, esto crea cierta superposición con las operaciones en el horizonte de planificación mencionado. El operación ya se le ocurrió soluciones preliminares a estas operaciones superpuestas.
«Tal vez estas soluciones preliminares son buenas y no necesitan calcularse nuevamente, pero tal vez no son buenas. Aquí es donde entra el educación inevitable», explica Wu.
Para su técnica, que llaman optimización de horizonte de rodillo guiado por el educación (L-RHO), los investigadores enseñan un maniquí de educación inevitable para predecir qué operaciones o variables deben ser recomputadas cuando el horizonte de planificación se alabarda en torno a delante.
L-RHO requiere datos para capacitar al maniquí, por lo que los investigadores resuelven un conjunto de subproblemas utilizando un solucionador algorítmico clásico. Tomaron las mejores soluciones, las que tienen la viejo cantidad de operaciones que no necesitan ser recomputadas, y las usaron como datos de capacitación.
Una vez entrenado, el maniquí de educación inevitable recibe un nuevo subproblema que no ha trillado ayer y predice qué operaciones no deben ser recomputadas. Las operaciones restantes se devuelven al solucionador algorítmico, que ejecuta la tarea, recomputa estas operaciones y mueve el horizonte de planificación en torno a delante. Entonces el tirabuzón comienza de nuevo.
«Si, en retrospectiva, no necesitábamos reoptimizarlas, entonces podemos eliminar esas variables del problema. Oportuno a que estos problemas crecen exponencialmente en tamaño, puede ser conveniente provechoso si podemos eliminar algunas de esas variables», agrega.
Un enfoque adaptable y escalable
Para probar su enfoque, los investigadores compararon L-RHO con varios solucionadores algorítmicos colchoneta, solucionadores especializados y enfoques que solo usan el educación inevitable. Los superó a todos, reduciendo el tiempo de resolución en un 54 por ciento y mejorando la calidad de la alternativa hasta en un 21 por ciento.
Adicionalmente, su método continuó superando a todas las líneas de colchoneta cuando lo probaron en variantes más complejas del problema, como cuando las máquinas de manufactura se descomponen o cuando hay una congestión adicional del tren. Incluso superó a las líneas de colchoneta adicionales que los investigadores crearon para desafiar su solucionador.
«Nuestro enfoque se puede aplicar sin modificar a todas estas diferentes variantes, que es verdaderamente lo que nos propusimos hacer con esta recta de investigación», dice ella.
L-Rho incluso puede adaptarse si los objetivos cambian, generando automáticamente un nuevo operación para resolver el problema: todo lo que necesita es un nuevo conjunto de datos de capacitación.
En el futuro, los investigadores quieren comprender mejor la razonamiento detrás de la atrevimiento de su maniquí de congelar algunas variables, pero no otras. Incluso quieren integrar su enfoque en otros tipos de problemas de optimización complejos como la mandato de inventario o el enrutamiento de vehículos.
Este trabajo fue apoyado, en parte, por la National Science Foundation, el Comité de Apoyo a la Investigación del MIT, una insignia de doctorado de Robotics de Amazon y MathWorks.