Athrun Data Intelligence

Meta AI publica ‘razonamiento natural’: un conjunto de datos de dominios múltiples con 2.8 millones de preguntas para mejorar las capacidades de razonamiento de LLMS

Los modelos de idiomas grandes (LLM) han mostrado avances notables en las capacidades de razonamiento para resolver tareas complejas. Mientras que modelos como Openi’s O1 y Deepseek’s R1 han mejorado significativamente los puntos de narración de razonamiento desafiantes, como las matemáticas de competencia, la codificación competitiva y el GPQA, las limitaciones críticas siguen siendo evaluando […]

Domino’s ofrece innovación: exprimir el poder de Genai para mejorar la experiencia del cliente

En Domino’s, siempre estamos buscando formas innovadoras de mejorar nuestra experiencia del cliente y ofrecer la pizza perfecta. Nuestro extremo esquema, llamado «Voice of the Pizza», muestra cómo estamos aprovechando la tecnología de vanguardia para escuchar a nuestros clientes y hacer mejoras significativas en nuestro servicio. Dar voz a los comentarios de los clientes El […]

Los investigadores de Google DeepMind proponen cuantización de Matryoshka: una técnica para mejorar la eficiencia del enseñanza profundo al optimizar los modelos de precisión múltiple sin inmolar la precisión

La cuantización es una técnica crucial en enseñanza profundo para disminuir los costos computacionales y mejorar la eficiencia del maniquí. Los modelos de verbo a gran escalera exigen una potencia de procesamiento significativa, lo que hace que la cuantización sea esencial para minimizar el uso de la memoria y mejorar la velocidad de inferencia. Al […]

Meta AI propone LIGER: un nuevo método de IA que combina sinérgicamente las fortalezas de la recuperación densa y generativa para mejorar significativamente el rendimiento de la recuperación generativa

Los sistemas de recomendación son esenciales para conectar a los usuarios con contenidos, productos o servicios relevantes. Los métodos de recuperación densos han sido un pilar en este campo, utilizando modelos de secuencia para calcular representaciones de medios y usuarios. Sin confiscación, estos métodos exigen importantes fortuna computacionales y almacenamiento, ya que requieren incorporaciones para […]

Este documento de IA presenta XMODE: un sistema de exploración de datos multimodal explicable impulsado por LLM para mejorar la precisión y la eficiencia

Los investigadores se centran cada vez más en la creación de sistemas que puedan manejar la exploración de datos multimodal, que combina datos estructurados y no estructurados. Esto implica analizar texto, imágenes, videos y bases de datos para objetar consultas complejas. Estas capacidades son cruciales en la atención médica, donde los profesionales médicos interactúan con […]

FineWeb-C: un conjunto de datos creado por la comunidad para mejorar los modelos lingüísticos en TODOS los idiomas

FineWeb2 avanza significativamente los conjuntos de datos de preentrenamiento multilingües, cubriendo más de 1000 idiomas con datos de adhesión calidad. El conjunto de datos utiliza aproximadamente 8 terabytes de datos de texto comprimido y contiene casi 3 billones de palabras, obtenidas de 96 instantáneas de CommonCrawl entre 2013 y 2024. Procesado utilizando la biblioteca datatrove, […]

Presentamos la automatización de AWS Glue Data Catalog para la colección de estadísticas de tablas para mejorar el rendimiento de las consultas en Amazon Redshift y Amazon Athena.

El Catálogo de datos de AWS Glue ahora automatiza la vivientes de estadísticas para nuevas tablas. Estas estadísticas están integradas con el optimizador basado en costos (CBO) de Espectro de desplazamiento al rojo de Amazon y Atenea amazónicalo que resulta en un mejor rendimiento de las consultas y posibles ahorros de costos. Las consultas sobre […]