Athrun Data Intelligence

Google AI Research presenta Titans: una nueva edificación de educación instintivo con atención y una metamemoria en contexto que aprende a memorizar en el momento de la prueba

Los modelos de estilo espacioso (LLM) basados ​​en arquitecturas Transformer han revolucionado el modelado de secuencias a través de sus notables capacidades de educación en contexto y su capacidad de progresar de forma efectiva. Estos modelos dependen de módulos de atención que funcionan como bloques de memoria asociativa, almacenando y recuperando asociaciones clave-valor. Sin confiscación, […]

Salesforce AI presenta TACO: una nueva comunidad de modelos de movimiento multimodal que combinan el razonamiento con acciones del mundo existente para resolver tareas visuales complejas

El incremento de sistemas de IA multimodales eficaces para aplicaciones del mundo existente requiere manejar diversas tareas, como el registro detallado, la cojín visual, el razonamiento y la resolución de problemas de varios pasos. Los modelos de jerga multimodal de código hendido existentes son deficientes en estas áreas, especialmente para tareas que involucran herramientas externas […]

ByteDance Research presenta FLUX de 1,58 bits: un nuevo enfoque de IA que cuantifica el 99,5% de los parámetros del transformador a 1,58 bits

Los Vision Transformers (ViT) se han convertido en la piedra angular de la visión por computadora y ofrecen un gran rendimiento y adaptabilidad. Sin secuestro, su gran tamaño y sus demandas computacionales crean desafíos, particularmente para la implementación en dispositivos con posibles limitados. Modelos como FLUX Vision Transformers, con miles de millones de parámetros, requieren […]

Este documento de IA presenta XMODE: un sistema de exploración de datos multimodal explicable impulsado por LLM para mejorar la precisión y la eficiencia

Los investigadores se centran cada vez más en la creación de sistemas que puedan manejar la exploración de datos multimodal, que combina datos estructurados y no estructurados. Esto implica analizar texto, imágenes, videos y bases de datos para objetar consultas complejas. Estas capacidades son cruciales en la atención médica, donde los profesionales médicos interactúan con […]

Este artículo sobre IA de Microsoft y Novartis presenta Chimera: un entorno de educación inconsciente para una predicción de retrosíntesis precisa y escalable

La síntesis química es esencial en el explicación de nuevas moléculas para aplicaciones médicas, ciencia de materiales y química fina. Este proceso, que implica planificar reacciones químicas para crear las moléculas objetivo deseadas, ha dependido tradicionalmente de la experiencia humana. Los avances recientes han recurrido a métodos computacionales para mejorar la eficiencia de la retrosíntesis: […]

Este documento de IA presenta SRDF: un volante de datos autorrefinado para conjuntos de datos de navegación de visión y lengua de ingreso calidad

La navegación por visión y lengua (VLN) combina la percepción visual con la comprensión del lengua natural para indicar a los agentes a través de entornos 3D. El objetivo es permitir que los agentes sigan instrucciones similares a las humanas y naveguen por espacios complejos de forma eficaz. Estos avances tienen potencial en la robótica, […]

Microsoft Research presenta el método de presupuestación de carbono impulsado por IA: un enfoque en tiempo actual para rastrear las emisiones y los sumideros de carbono globales

Desde la Revolución Industrial, la calcinación de combustibles fósiles y los cambios en el uso de la tierra, especialmente la deforestación, han impulsado el aumento del dióxido de carbono (CO2) atmosférico. Si perfectamente la manto vegetal terreno y los océanos sirven como sumideros naturales de carbono, absorbiendo parte de este CO2, las emisiones han superado […]

Este documento de inteligencia industrial de Amazon presenta DF-GNN: un ámbito dinámico de fusión de kernel para acelerar redes neuronales de gráficos de atención en GPU

Las redes neuronales gráficas (GNN) son un campo que avanza rápidamente en el formación maquinal, diseñado específicamente para analizar datos estructurados gráficamente que representan entidades y sus relaciones. Estas redes se han utilizado ampliamente en observación de redes sociales, sistemas de recomendación y aplicaciones de interpretación de datos moleculares. Un subconjunto de GNN, las redes […]

Este artículo de IA presenta DyCoke: compresión dinámica de tokens para modelos de verbo egregio de video eficientes y de parada rendimiento

Los modelos de verbo egregio de vídeo (VLLM) han surgido como herramientas transformadoras para analizar el contenido de vídeo. Estos modelos destacan en el razonamiento multimodal, integrando datos visuales y textuales para interpretar y replicar a escenarios de vídeo complejos. Sus aplicaciones van desde preguntas y respuestas sobre vídeos hasta resúmenes y descripciones de vídeos. […]

Salesforce AI Research presenta Moirai-MoE: un maniquí principal de series temporales de MoE que logra la especialización del maniquí a nivel de token de forma autónoma

Los pronósticos de series temporales han sido durante mucho tiempo parte integral de las finanzas, la atención médica, la meteorología y la trámite de la sujeción de suministro. Su principal objetivo es predecir puntos de datos futuros basados ​​en observaciones históricas, lo que puede resultar desafiante conveniente a la naturaleza compleja y variable de los […]