Athrun Data Intelligence

Nous Research garrocha NousCoder-14B: un maniquí de programación de olimpíadas competitivas entrenado seguidamente en Qwen3-14B mediante educación por refuerzo

Nous Research ha presentado NousCoder-14B, un maniquí de programación de olimpiadas competitivas que se entrena seguidamente en Qwen3-14B mediante educación por refuerzo (RL) con recompensas verificables. En el punto de relato LiveCodeBench v6, que cubre problemas del 01/08/2024 al 01/05/2025, el maniquí alcanza una precisión Pass@1 del 67,87 por ciento. Esto es 7,08 puntos porcentuales […]