Los investigadores de Tiktok introducen SWE-Perf: el primer punto de relato para la optimización del rendimiento del código de nivel de repositorio

Comienzo A medida que avanzan los modelos de jerigonza holgado (LLMS) en tareas de ingeniería de software, que se extienden desde la concepción de códigos hasta la corrección de errores, la optimización de rendimiento sigue siendo una frontera evasiva, especialmente a nivel de repositorio. Para cerrar esta brecha, los investigadores de Tiktok y las instituciones […]
El nuevo maniquí predice un punto de reacción química sin retorno | MIT News

Cuando los químicos diseñan nuevas reacciones químicas, una información útil implica el estado de transición de la reacción, el punto de no retorno del que debe proceder una reacción. Esta información permite a los químicos tratar de producir las condiciones correctas que permitirán que ocurra la reacción deseada. Sin secuestro, los métodos actuales para predecir […]
Meta AI presenta MLGYM: un nuevo entorno de IA y un punto de remisión para avanzar en los agentes de investigación de IA

La deseo de acelerar el descubrimiento sabio a través de IA ha sido de larga data, con esfuerzos tempranos como el tesina de IA aplicada de Oak Ridge que data de 1979. Los avances más recientes en los modelos fundamentales han demostrado la viabilidad de las tuberías de investigación totalmente automatizadas, permitiendo que los sistemas […]
El punto de inflexión de IA: lo que los líderes minoristas necesitan memorizar para 2025

AI está aquí para quedarse. Mientras que 2023 trajo asombro y 2024 marcó el eclosión de una experimentación generalizada, 2025 marcará el año en que los minoristas se toman en serio las aplicaciones del mundo verdadero de la IA. Pero es complicado: las pruebas de concepto de IA se están graduando de la caja de […]
Cómo los socios están a punto de dar vida a la coexistentes de la coexistentes en todas las industrias

Gen AI ya está entregando resultados transformadores en todas las industrias. Su capacidad para procesar e interpretar datos estructurados y no estructurados es una saco para resolver problemas complejos en varios campos. En cuidado de la vitalidadGen AI restablecimiento el diagnosis mediante el estudio de datos de imágenes médicas, permitiendo la detección de afecciones como […]
El punto de inflexión de IA: lo que los líderes del sector sabido necesitan conocer para 2025

AI está demostrando que está aquí para quedarse. Mientras que 2023 trajo Wonder y 2024 vio una experimentación generalizada, 2025 será el año en que el sector sabido se tome en serio las aplicaciones de IA. Pero es complicado: las pruebas de concepto de IA se están graduando de la caja de arena para la […]
El punto de pivote de POC a producción

La pinta. En la matriz preliminar, el eje y muestra la columna con los objetivos comerciales estratégicos, en términos generales. Aquí es donde estimarías la “pinta” potencial. ¿Está la iniciativa alineada con los objetivos comerciales? Se debe dar prioridad a proyectos o productos que tengan un vínculo directo con objetivos comerciales específicos. ¿Existe […]
¿Está su agente de LLM preparado para empresas? Salesforce AI Research presenta CRMArena: un novedoso punto de remisión de IA diseñado para evaluar agentes de IA en tareas realistas basadas en entornos de trabajo profesionales

La diligencia de relaciones con el cliente (CRM) se ha convertido en una parte integral de las operaciones comerciales como centro para administrar las interacciones, los datos y los procesos de los clientes. La integración de IA avanzadilla en CRM puede metamorfosear estos sistemas al automatizar procesos rutinarios, ofrecer experiencias personalizadas y optimizar los esfuerzos […]
OpenAI lanceta SimpleQA: un nuevo punto de remisión de IA que mide la factualidad de los modelos de verbo

El surgimiento de grandes modelos lingüísticos ha ido acompañado de importantes desafíos, particularmente en lo que respecta a avalar la factibilidad de las respuestas generadas. Un problema persistente es que estos modelos pueden producir resultados que son objetivamente incorrectos o incluso engañosos, un engendro a menudo llamado «quimera». Estas alucinaciones ocurren cuando los modelos generan […]
MEGA-Bench: un punto de narración integral de IA que escalera la evaluación multimodal a más de 500 tareas del mundo efectivo a un costo de inferencia manejable

Un desafío importante en la evaluación de modelos de visión y jerga (VLM) radica en comprender sus diversas capacidades en una amplia matiz de tareas del mundo efectivo. Los puntos de narración existentes a menudo se quedan cortos, centrándose en conjuntos reducidos de tareas o formatos de resultados limitados, lo que da oportunidad a una […]