Athrun Data Intelligence

Cómo construir un sistema de estudios por refuerzo profundo agente con progresión curricular, exploración adaptativa y planificación UCB de metanivel

En este tutorial, construimos un sistema agente liberal de estudios por refuerzo profundo que agenda a un agente para que aprenda no solo acciones interiormente de un entorno sino igualmente cómo designar sus propias estrategias de entrenamiento. Diseñamos un discípulo de Dueling Double DQN, presentamos un plan de estudios con dificultad creciente e integramos múltiples […]