Athrun Data Intelligence

Moonshot AI libera Kimi K2: Un maniquí MOE de billones de parámetros centrado en el contexto amplio, el código, el razonamiento y el comportamiento de la agente

Kimi K2osado por Moonshot Ai en julio de 2025, es un código amplio especialmente diseñado Mezcla de expertos (MOE) Maniquí: 1 billón de parámetros totales, con 32 mil millones de parámetros activos por token. Está entrenado usando la personalización Muijar optimizador en 15.5 billones de tokens, logrando un entrenamiento estable a esta escalera sin precedentes […]

Kyutai libera 2B de parámetros de transmisión de texto a voz TTS con latencia de 220 ms y 2.5m horas de entrenamiento

Kyutai, un laboratorio de investigación de IA destapado, ha publicado un maniquí renovador de transmisión de texto a voz (TTS) con ~ 2 mil millones de parámetros. Diseñado para la capacidad de respuesta en tiempo existente, este maniquí ofrece una engendramiento de audio de latencia exaltado disminución (220 milisegundos) mientras mantiene una adhesión fidelidad. Está […]

AI multimodal en GPU de desarrollador: Alibaba libera QWEN2.5-OMNI-3B con un uso de VRAM 50% más bajo y un rendimiento del maniquí casi 7B

Los modelos de cimientos multimodales han mostrado una promesa sustancial en los sistemas habilitadores que pueden razonar a través de texto, imágenes, audio y video. Sin secuestro, la implementación maña de tales modelos se ve afectada con frecuencia por limitaciones de hardware. El detención consumo de memoria, los grandes recuentos de parámetros y la dependencia […]

Bytedance Research libera DAPO: un sistema de enseñanza de refuerzo LLM de origen completo a escalera

El enseñanza de refuerzo (RL) se ha vuelto central para avanzar en los modelos de idiomas grandes (LLM), empoderándolos con capacidades de razonamiento mejoradas necesarias para tareas complejas. Sin incautación, la comunidad de investigación enfrenta desafíos considerables en la reproducción de técnicas RL de última procreación conveniente a la divulgación incompleta de los detalles secreto […]

Microsoft AI libera omniparser v2: una útil de IA que convierte cualquier LLM en un agente de uso de una computadora

En el ámbito de la inteligencia fabricado, permitir que los modelos de idiomas grandes (LLM) naveguen e interactúen con las interfaces gráficas de legatario (GUI) ha sido un desafío importante. Si adecuadamente los LLM son expertos en procesar datos textuales, a menudo encuentran dificultades al interpretar medios visuales como íconos, ordenanza y menús. Esta inconveniente […]