Athrun Data Intelligence

Los investigadores de Tiktok introducen SWE-Perf: el primer punto de relato para la optimización del rendimiento del código de nivel de repositorio

Comienzo A medida que avanzan los modelos de jerigonza holgado (LLMS) en tareas de ingeniería de software, que se extienden desde la concepción de códigos hasta la corrección de errores, la optimización de rendimiento sigue siendo una frontera evasiva, especialmente a nivel de repositorio. Para cerrar esta brecha, los investigadores de Tiktok y las instituciones […]

El nuevo maniquí predice un punto de reacción química sin retorno | MIT News

Cuando los químicos diseñan nuevas reacciones químicas, una información útil implica el estado de transición de la reacción, el punto de no retorno del que debe proceder una reacción. Esta información permite a los químicos tratar de producir las condiciones correctas que permitirán que ocurra la reacción deseada. Sin secuestro, los métodos actuales para predecir […]

El punto de pivote de POC a producción

La pinta. En la matriz preliminar, el eje y muestra la columna con los objetivos comerciales estratégicos, en términos generales. Aquí es donde estimarías la “pinta” potencial. ¿Está la iniciativa alineada con los objetivos comerciales? Se debe dar prioridad a proyectos o productos que tengan un vínculo directo con objetivos comerciales específicos. ¿Existe […]

¿Está su agente de LLM preparado para empresas? Salesforce AI Research presenta CRMArena: un novedoso punto de remisión de IA diseñado para evaluar agentes de IA en tareas realistas basadas en entornos de trabajo profesionales

La diligencia de relaciones con el cliente (CRM) se ha convertido en una parte integral de las operaciones comerciales como centro para administrar las interacciones, los datos y los procesos de los clientes. La integración de IA avanzadilla en CRM puede metamorfosear estos sistemas al automatizar procesos rutinarios, ofrecer experiencias personalizadas y optimizar los esfuerzos […]

OpenAI lanceta SimpleQA: un nuevo punto de remisión de IA que mide la factualidad de los modelos de verbo

El surgimiento de grandes modelos lingüísticos ha ido acompañado de importantes desafíos, particularmente en lo que respecta a avalar la factibilidad de las respuestas generadas. Un problema persistente es que estos modelos pueden producir resultados que son objetivamente incorrectos o incluso engañosos, un engendro a menudo llamado «quimera». Estas alucinaciones ocurren cuando los modelos generan […]

MEGA-Bench: un punto de narración integral de IA que escalera la evaluación multimodal a más de 500 tareas del mundo efectivo a un costo de inferencia manejable

Un desafío importante en la evaluación de modelos de visión y jerga (VLM) radica en comprender sus diversas capacidades en una amplia matiz de tareas del mundo efectivo. Los puntos de narración existentes a menudo se quedan cortos, centrándose en conjuntos reducidos de tareas o formatos de resultados limitados, lo que da oportunidad a una […]