Athrun Data Intelligence

Cómo construir un sistema de estudios por refuerzo profundo agente con progresión curricular, exploración adaptativa y planificación UCB de metanivel

En este tutorial, construimos un sistema agente liberal de estudios por refuerzo profundo que agenda a un agente para que aprenda no solo acciones interiormente de un entorno sino igualmente cómo designar sus propias estrategias de entrenamiento. Diseñamos un discípulo de Dueling Double DQN, presentamos un plan de estudios con dificultad creciente e integramos múltiples […]

Cómo los agentes de exploración como Q-Learning, UCB y MCTS aprenden de forma colaborativa estrategias inteligentes de resolución de problemas en entornos de cuadrícula dinámica

En este tutorial, exploramos cómo las estrategias de exploración dan forma a la toma de decisiones inteligente a través de la resolución de problemas basada en agentes. Creamos y entrenamos a tres agentes, Q-Learning con exploración épsilon, Upper Confidence Bound (UCB) y Monte Carlo Tree Search (MCTS), para navegar en un mundo en red y […]