Microsoft bichero VibeVoice-ASR: un maniquí unificado de voz a texto diseñado para manejar audio de formato abundante de 60 minutos en una sola pasada

Microsoft ha animado VibeVoice-ASR como parte de la tribu VibeVoice de modelos de inteligencia químico de voz de frontera de código libre. VibeVoice-ASR se describe como un maniquí unificado de voz a texto que puede manejar audio de formato abundante de 60 minutos en una sola pasada y producir transcripciones estructuradas que codifican quién, cuándo […]
Microsoft AI alabarda VibeVoice-Realtime: un maniquí informal de conversión de texto a voz en tiempo actual que admite la entrada de texto en streaming y una sólida coexistentes de voz de formato dilatado

Microsoft ha agresivo VibeVoice-Realtime-0.5Bun maniquí de texto a voz en tiempo actual que funciona con entrada de texto en tiempo actual y salida de voz en formato dilatado, dirigido a aplicaciones de estilo agente y narración de datos en vivo. El maniquí puede despuntar a producir voz audible en unos 300 ms, lo cual es […]
El maniquí predice los enseres a grande plazo de los desechos nucleares en los sistemas de matanza subterránea | MIT News

A medida que los países de todo el mundo experimentan un resurgimiento en proyectos de energía nuclear, las cuestiones de dónde y cómo deshacerse de los desechos nucleares siguen siendo tan políticamente tensos como siempre. Estados Unidos, por ejemplo, ha estancado indefinidamente su único repositorio de desechos nucleares subterráneos a grande plazo. Los científicos están […]
Moonshot AI libera Kimi K2: Un maniquí MOE de billones de parámetros centrado en el contexto amplio, el código, el razonamiento y el comportamiento de la agente

Kimi K2osado por Moonshot Ai en julio de 2025, es un código amplio especialmente diseñado Mezcla de expertos (MOE) Maniquí: 1 billón de parámetros totales, con 32 mil millones de parámetros activos por token. Está entrenado usando la personalización Muijar optimizador en 15.5 billones de tokens, logrando un entrenamiento estable a esta escalera sin precedentes […]
Sugerging Face se comunica SMOLLM3: un maniquí de razonamiento multilingüe de contexto dilatado 3B

Cara abrazada recién atrevido Smollm3la última interpretación de sus modelos de idioma «SMOL», diseñada para ofrecer un razonamiento multilingüe resistente en contextos largos utilizando una edificio compacta de parámetros 3B. Mientras que la mayoría de los modelos con capacidad de stop contexto generalmente empujan más allá de los parámetros de 7B, SMOLLM3 logra ofrecer el […]