Athrun Data Intelligence

¿Mejor que GPT-5? Probamos Ernie X1.1, el extremo maniquí de IA de Baidu

Entre mucha anticipación, Baidu anunció su Ernie X1.1 en Wave Summit en Beijing anoche. Se sintió como un pivote de demostraciones llamativas a confiabilidad ejercicio, ya que Baidu colocó la nueva transformación de Ernie como un maniquí de razonamiento primero que se comporta. Como alguno que escribe, codifica y envía flujos de trabajo de agente […]

TILDE AI Liberturas Tildeopen LLM: un maniquí de idioma alto de código rajado con más de 30 mil millones de parámetros y apoya la mayoría de los idiomas europeos

Empresa de tecnología de idioma letón Tilde ha animado Tildeopen LLMun maniquí de jerigonza alto de código rajado (LLM) especialmente diseñado para Idiomas europeoscon un resistente enfoque en idiomas nacionales y regionales subrepresentados y más pequeños. Es un brinco importante cerca de la equidad gramática y la soberanía digital interiormente de la UE. Under the […]

Microsoft AI presenta Rstar2-agent: un maniquí de razonamiento matemático de 14B entrenado con un educación de refuerzo de agente para obtener un rendimiento de nivel fronterizo

El problema con «pensar más» Los modelos de idiomas grandes han hecho avances impresionantes en el razonamiento matemático al extender sus procesos de sujeción de pensamiento (cot), esencialmente «pensando más tiempo» a través de pasos de razonamiento más detallados. Sin requisa, este enfoque tiene limitaciones fundamentales. Cuando los modelos encuentran errores sutiles en sus cadenas […]

El panorama del maniquí de verbo extenso de Australia: evaluación técnica

Puntos secreto No ha surgido un buque insignia, competitivo conjuntamente competitivo (como GPT-4, Claude 3.5, Candela 3.1) de Australia. La investigación y el comercio de Australia actualmente dependen principalmente de las LLM internacionales, que se usan con frecuencia pero tienen limitaciones medibles en el contexto cultural y inglés australiano. Kangaroo LLM es el único plan […]

NVIDIA AI resuelto Jet-Nemotron: 53x Serie de maniquí de jerigonza híbrido-arquitectura híbrido que se traduce en una reducción de costos del 98% para la inferencia a escalera

Los investigadores de NVIDIA han destrozado el obstáculo de eficiencia de larga data en la inferencia del maniquí de idioma excelso (LLM), liberando Jet-nemotrón—Un comunidad de modelos (2b y 4b) que ofrece hasta 53.6 × rendimiento de procreación más suspensión que liderar LLM de atención completa mientras coincide, o incluso superando, su precisión. Lo más […]

Un nuevo maniquí predice cómo las moléculas se disolverán en diferentes solventes | MIT News

Usando el estudios obligatorio, los ingenieros de MIT Chemical han creado un maniquí computacional que puede predecir qué tan correctamente se disolverá cualquier molécula en un solvente orgánico, un paso esencia en la síntesis de casi cualquier farmacéutico. Este tipo de predicción podría hacer que sea mucho más acomodaticio desarrollar nuevas formas de producir drogas […]

Una explorador de desarrolladores para las capacidades del maniquí GPT-5 de OpenAI.

En este tutorial, exploraremos las nuevas capacidades presentadas en el postrer maniquí de OpenAI, GPT-5. La modernización trae varias características potentes, que incluyen el parámetro de verbosidad, las llamadas de función de forma dispensado, la gramática sin contexto (CFG) y el razonamiento intrascendente. Veremos lo que hacen y cómo usarlos en la destreza. Mira el […]

El poder de RLVR: capacitar a un maniquí de razonamiento SQL líder en Databricks

En Databricks, utilizamos Refplyiendo Learning (RL) para desarrollar modelos de razonamiento para problemas que enfrentan nuestros clientes, así como para nuestros productos, como el Asistente de Databricks y Ai/bi temperamento. Estas tareas incluyen producir código, analizar datos, integrar el conocimiento organizacional, la evaluación específica del dominio y Procedencia de información (es asegurar) de documentos. Tareas […]

Kimi K2 vs Fuego 4: ¿Cuál es el mejor maniquí de código rajado?

Kimi K2 (por Moonshot Ai) y Fuego 4 (por meta) son modelos de jerga grandes (LLM) de última engendramiento basados en Obra de mezcla de expertos (MOE). Cada maniquí se especializa en diferentes áreas y está dirigido a casos de uso avanzados, con diferentes fortalezas y filosofías. Hasta hace una semana, Fuego 4 era el […]