ReliabilityBench: medición del rendimiento impredecible de modelos de verbo grandes configurados en cinco dominios esencia de la cognición humana

La investigación evalúa la confiabilidad de grandes modelos de verbo (LLM) como GPT, LLaMA y BLOOM, ampliamente utilizados en diversos dominios, incluidos la educación, la medicina, la ciencia y la dependencia. A medida que el uso de estos modelos se vuelve más frecuente, es fundamental comprender sus limitaciones y peligros potenciales. La investigación destaca que […]
Anuncio de GA de intercambio de modelos de IA

Un agradecimiento peculiar a Daniel Benito (CTO, Bitext), Antonio Valderrabanos (CEO, Bitext), Chen Wang (Arquitecto líder de soluciones, AI21 Labs), Robbin Jang (Regente de alianza, AI21 Labs) y Alex Godfrey (Socio líder de marketing, AI21 Labs) por sus valiosos conocimientos y contribuciones a este blog. Nos complace compartir la disponibilidad común de AI Model Sharing […]
Google AI bichero dos modelos Gemini actualizados y listos para producción: Gemini-1.5-Pro-002 y Gemini-1.5-Flash-002 con rendimiento mejorado y costos más bajos

Google acaba de difundir una interesante modernización de sus modelos Gemini con el impulso Gemini-1.5-Pro-002 y Gemini-1.5-Flash-002que ofrece versiones listas para producción, precios reducidos y mayores límites de velocidad. Los modelos mejorados ofrecen un mejor rendimiento en una amplia tonalidad de tareas, lo que marca un paso importante para hacer que la IA sea más […]
Cómo regir modelos de Machine Learning en Databricks

El Machine Learning se ha convertido en una utensilio esencial para los negocios de todos los tamaños. Sin secuestro, el despliegue y establecimiento de modelos de ML puede ser confuso y consumir mucho tiempo. MLOps es un conjunto de prácticas que ayudan a automatizar y optimizar el ciclo de vida de un maniquí de ML, […]
Presentamos o1: la nueva serie de modelos de razonamiento de OpenAI para desarrolladores y empresas en Azure

Nos complace pegar los modelos más nuevos de OpenAI, o1-preview y o1-mini, a Azure OpenAI Service, Azure AI Studio y GitHub Models. Nos complace incorporar los modelos más nuevos de OpenAI, o1-preview y o1-mini, a Microsoft Azure OpenAI Service, Azure AI Studio y GitHub Models. La serie o1 permite capacidades complejas de codificación, razonamiento matemático, […]
Detección de textos escritos por otros modelos de estilo de gran tamaño – El blog de investigación en inteligencia químico de Berkeley

La estructura de Ghostbuster, nuestro nuevo método de última engendramiento para detectar texto generado por IA. Los modelos de estilo grandes como ChatGPT escriben de forma impresionante, tan proporcionadamente, de hecho, que se han convertido en un problema. Los estudiantes han comenzado a usar estos modelos para escribir trabajos de forma anónima, lo que ha […]
Los investigadores del MIT utilizan modelos de habla de gran tamaño para detectar problemas en sistemas complejos | Noticiario del MIT

Identificar una turbina defectuosa en un parque eólico, lo que puede implicar examinar cientos de señales y millones de puntos de datos, es como encontrar una alfiler en un pajar. Los ingenieros a menudo simplifican este arduo problema utilizando modelos de estudios profundo que pueden detectar anomalías en las mediciones tomadas repetidamente a lo grande […]
Modelos, LoRA y posibilidades creativas

Ingreso ¿Qué tan formidable sería si existiera una plataforma donde tus visiones creativas cobraran vida con solo unos pocos clics, un mundo donde pudieras ajustar modelos de IA de vanguardia para crear imágenes impresionantes exclusivamente tuyas? Bienvenido a Civitai, una plataforma resonante dedicada a empoderar a los creadores al aplaudir acercamiento a una biblioteca amplia […]
SynDL: una colección de pruebas sintéticas que utiliza modelos de idioma de gran tamaño para revolucionar la evaluación de la recuperación de información y la evaluación de la relevancia a gran escalera

La recuperación de información (IR) es un aspecto fundamental de la informática, que se centra en la sede eficaz de información relevante interiormente de grandes conjuntos de datos. A medida que los datos crecen exponencialmente, la carencia de sistemas de recuperación avanzados se vuelve cada vez más crítica. Estos sistemas utilizan algoritmos sofisticados para hacer […]
Los investigadores de Microsoft combinan modelos de habla pequeños y grandes para una detección de alucinaciones más rápida y precisa

Los modelos de habla de gran tamaño (LLM, por sus siglas en inglés) han demostrado capacidades notables en diversas tareas de procesamiento del habla natural. Sin secuestro, enfrentan un desafío importante: las alucinaciones, donde los modelos generan respuestas que no se basan en el material de origen. Este problema socava la confiabilidad de los LLM […]