Athrun Data Intelligence

AI multimodal en GPU de desarrollador: Alibaba libera QWEN2.5-OMNI-3B con un uso de VRAM 50% más bajo y un rendimiento del maniquí casi 7B

Los modelos de cimientos multimodales han mostrado una promesa sustancial en los sistemas habilitadores que pueden razonar a través de texto, imágenes, audio y video. Sin secuestro, la implementación maña de tales modelos se ve afectada con frecuencia por limitaciones de hardware. El detención consumo de memoria, los grandes recuentos de parámetros y la dependencia […]

Los investigadores de Microsoft AI introducen técnicas avanzadas de cuantificación de bajo bits para permitir la implementación de LLM efectivo en dispositivos de borde sin altos costos computacionales

Los dispositivos de borde como los teléfonos inteligentes, los dispositivos IoT y los sistemas integrados procesan datos localmente, mejorando la privacidad, la reducción de la latencia y la progreso de la capacidad de respuesta, y la IA se está integrando rápidamente en estos dispositivos. Pero, implementar modelos de idiomas grandes (LLM) en estos dispositivos es […]