Cómo los agentes de exploración como Q-Learning, UCB y MCTS aprenden de forma colaborativa estrategias inteligentes de resolución de problemas en entornos de cuadrícula dinámica

En este tutorial, exploramos cómo las estrategias de exploración dan forma a la toma de decisiones inteligente a través de la resolución de problemas basada en agentes. Creamos y entrenamos a tres agentes, Q-Learning con exploración épsilon, Upper Confidence Bound (UCB) y Monte Carlo Tree Search (MCTS), para navegar en un mundo en red y […]
Los robots domésticos de precisión aprenden con la simulación y la sinceridad | Telediario del MIT

En lo más suspensión de muchas listas de deseos de automatización se encuentra una tarea que consume especialmente tiempo: las tareas domésticas. El objetivo de muchos expertos en robótica es crear la combinación adecuada de hardware y software para que una máquina pueda asimilar políticas “generalistas” (las reglas y estrategias que guían el comportamiento del […]