Athrun Data Intelligence

Cortex AISQL: reinventar SQL en el idioma de consulta AI para datos multimodales

Hoy, estamos entusiasmados de anunciar la corteza de cocaína Cortex AISQL en una panorámica previa pública, trayendo poderosas capacidades de IA directamente al motor SQL de Snowflake. Cortex AISQL permite a los clientes construir tuberías de IA escalables a través de datos empresariales multimodales con comandos SQL familiares. Texto de proceso (panorámica previa pública), imágenes […]

Simplificar el observación de datos multimodales con Snowflake Cortex AI

Claude 3.5 Sonnet sobresale en la comprensión del documento con un impresionante 90.3% en Docvqa Benchmark, por lo que es una opción óptima para extraer información de estados financieros, contratos legales y documentación de cumplimiento. Pixtral sobresaliente se destaca con un observación de expresivo extra (88.1% CACHQA) y razonamiento matemático (69.4% Mathvista), consumado para informes […]

Tormenta (reducción de tokens espacio -temporal para LLM multimodales): una nueva construcción de IA que incorpora un codificador temporal dedicado entre el codificador de imagen y el LLM

Comprensión Videos con AI requiere manejo de secuencias de imágenes de forma valioso. Un desafío importante en los modelos de IA basados ​​en video actuales es su incapacidad para procesar videos como un flujo continuo, agraviar importantes detalles de movimiento e interrumpir la continuidad. Esta equivocación de modelado temporal evita los cambios en el rastreo; […]

7 modelos multimodales populares y sus usos

El rápido avance de la inteligencia industrial (IA) ha legado circunstancia a una nueva era de modelos diseñados para procesar y crear datos en múltiples modalidades. Estos incluyen texto, imágenes, audio y video. Estos modelos multimodales se utilizan cada vez más en diversas aplicaciones, desde la creación de contenidos hasta el estudio renovador. Este artículo […]

Apple AI Research presenta MM1.5: una nueva grupo de modelos de jerga ancho multimodales generalistas (MLLM) de suspensión rendimiento

Los modelos multimodales de lenguajes grandes (MLLM) representan un radio de vanguardia en inteligencia sintético, ya que combinan diversas modalidades de datos como texto, imágenes e incluso video para construir una comprensión unificada en todos los dominios. Estos modelos se están desarrollando para atracar tareas cada vez más complejas, como la respuesta visual a preguntas, […]