El panorama del maniquí de verbo extenso de Australia: evaluación técnica

Puntos secreto No ha surgido un buque insignia, competitivo conjuntamente competitivo (como GPT-4, Claude 3.5, Candela 3.1) de Australia. La investigación y el comercio de Australia actualmente dependen principalmente de las LLM internacionales, que se usan con frecuencia pero tienen limitaciones medibles en el contexto cultural y inglés australiano. Kangaroo LLM es el único plan […]
NVIDIA AI resuelto Jet-Nemotron: 53x Serie de maniquí de jerigonza híbrido-arquitectura híbrido que se traduce en una reducción de costos del 98% para la inferencia a escalera

Los investigadores de NVIDIA han destrozado el obstáculo de eficiencia de larga data en la inferencia del maniquí de idioma excelso (LLM), liberando Jet-nemotrón—Un comunidad de modelos (2b y 4b) que ofrece hasta 53.6 × rendimiento de procreación más suspensión que liderar LLM de atención completa mientras coincide, o incluso superando, su precisión. Lo más […]
Los investigadores vislumbran el funcionamiento interno de los modelos de estilo de proteínas | MIT News

En los últimos abriles, los modelos que pueden predecir la estructura o función de las proteínas se han utilizado ampliamente para una variedad de aplicaciones biológicas, como identificar objetivos fármacos y diseñar nuevos anticuerpos terapéuticos. Estos modelos, que se basan en modelos de idiomas grandes (LLM), pueden hacer predicciones muy precisas de la idoneidad de […]
Los modelos de estilo de atajos matemáticos únicos que utilizan para predecir escenarios dinámicos | MIT News

Digamos que estás leyendo una historia o jugando un surtido de ajedrez. Es posible que no haya notado, pero en cada paso del camino, su mente realizó un seguimiento de cómo estaba cambiando la situación (o «estado del mundo»). Puede imaginar esto como una especie de secuencia de la relación de eventos, que utilizamos para […]
Cortex AISQL: reinventar SQL en el idioma de consulta AI para datos multimodales

Hoy, estamos entusiasmados de anunciar la corteza de cocaína Cortex AISQL en una panorámica previa pública, trayendo poderosas capacidades de IA directamente al motor SQL de Snowflake. Cortex AISQL permite a los clientes construir tuberías de IA escalables a través de datos empresariales multimodales con comandos SQL familiares. Texto de proceso (panorámica previa pública), imágenes […]
Microsoft publica NLWEB: un plan hendido que permite a los desarrolladores convertir fácilmente cualquier sitio web en una aplicación con IA con interfaces de habla natural

Muchos sitios web carecen de formas accesibles y rentables para integrar las interfaces del habla natural, lo que dificulta que los usuarios interactúen con el contenido del sitio a través de IA conversacional. Las soluciones existentes a menudo dependen de servicios centralizados y patentados o requieren una experiencia técnica significativa, limitando la escalabilidad y la […]
Un año de Phi: modelos de idioma pequeño que hacen grandes saltos en AI

Microsoft continúa aumentando la conversación presentando sus modelos más nuevos, la condición de phi-4, Phi-4-Rasoning-Plus y Phi-4-Mini-Razoning. Una nueva era de AI Hace un año, Microsoft introdujo modelos de idioma pequeño (SLM) a los clientes con el emanación de Phi-3 en Azure ai fundiciónAprovechando la investigación en SLM para expandir la matiz de modelos y […]
Google AI introduce el explorador de inteligencia médico articulado (AMIE): un maniquí de verbo amplio optimizado para el razonamiento dictamen y evalúa su capacidad para suscitar un dictamen diferencial

El expansión de un dictamen diferencial preciso (DDX) es una parte fundamental de la atención médica, típicamente lograda a través de un proceso paso a paso que integra el historial del paciente, los exámenes físicos y las pruebas de dictamen. Con el auge de las LLM, existe un potencial de creciente para apoyar y automatizar […]
Los investigadores de Tencent AI introducen Hunyuan-T1: un maniquí de estilo reaccionario magnate alimentado por mamba que redefine un razonamiento profundo, eficiencia contextual y estudios de refuerzo centrado en el ser humano

Los modelos de idiomas grandes luchan para procesar y razonar sobre textos largos y complejos sin perder un contexto esencial. Los modelos tradicionales a menudo sufren pérdida de contexto, manejo ineficiente de dependencias de grande importancia y dificultades para alinearse con las preferencias humanas, afectando la precisión y la eficiencia de sus respuestas. Hunyuan-T1 de […]
Los investigadores de Alibaba introducen R1-AMNI: una aplicación de educación de refuerzo con remuneración verificable (RLVR) a un maniquí de verbo alto omni-multimodal

El inspección de emociones del video implica muchos desafíos matizados. Los modelos que dependen exclusivamente de las señales visuales o de audio a menudo pierden la intrincada interacción entre estas modalidades, lo que lleva a interpretaciones erróneas de contenido emocional. Una dificultad secreto es combinar de guisa confiable las señales visuales, como las expresiones faciales […]