El equipo Qwen de Alibaba lanceta la serie de modelos medianos Qwen 3.5: una potencia de producción que demuestra que los modelos de IA más pequeños son más inteligentes

El expansión de grandes modelos lingüísticos (LLM) se ha definido por la búsqueda de una escalera bruta. Si aceptablemente el aumento del número de parámetros en billones inicialmente impulsó ganancias de rendimiento, incluso introdujo importantes gastos generales de infraestructura y una utilidad insignificante decreciente. La exención del Serie de modelos medianos Qwen 3.5 señala un […]
Los investigadores de Microsoft combinan modelos de habla pequeños y grandes para una detección de alucinaciones más rápida y precisa

Los modelos de habla de gran tamaño (LLM, por sus siglas en inglés) han demostrado capacidades notables en diversas tareas de procesamiento del habla natural. Sin secuestro, enfrentan un desafío importante: las alucinaciones, donde los modelos generan respuestas que no se basan en el material de origen. Este problema socava la confiabilidad de los LLM […]