Athrun Data Intelligence

Moonshot AI libera Kimi K2: Un maniquí MOE de billones de parámetros centrado en el contexto amplio, el código, el razonamiento y el comportamiento de la agente

Kimi K2osado por Moonshot Ai en julio de 2025, es un código amplio especialmente diseñado Mezcla de expertos (MOE) Maniquí: 1 billón de parámetros totales, con 32 mil millones de parámetros activos por token. Está entrenado usando la personalización Muijar optimizador en 15.5 billones de tokens, logrando un entrenamiento estable a esta escalera sin precedentes […]

Los investigadores de Tencent AI introducen Hunyuan-T1: un maniquí de estilo reaccionario magnate alimentado por mamba que redefine un razonamiento profundo, eficiencia contextual y estudios de refuerzo centrado en el ser humano

Los modelos de idiomas grandes luchan para procesar y razonar sobre textos largos y complejos sin perder un contexto esencial. Los modelos tradicionales a menudo sufren pérdida de contexto, manejo ineficiente de dependencias de grande importancia y dificultades para alinearse con las preferencias humanas, afectando la precisión y la eficiencia de sus respuestas. Hunyuan-T1 de […]

Stability AI vara modelos colchoneta y de chat LM 1.6B estable en árabe: un LLM de última vivientes centrado en árabe

Los modelos de jerigonza ínclito (LLM) han influido profundamente en el procesamiento del jerigonza natural (PLN), sobresaliendo en tareas como la vivientes de texto y la comprensión del jerigonza. Sin confiscación, la habla árabe, con su intrincada morfología, variados dialectos y riqueza cultural, sigue estando subrepresentada. Muchos LLM avanzados están diseñados con el inglés como […]