Athrun Data Intelligence

Los investigadores de Alibaba proponen Videollama 3: Un maniquí de almohadilla multimodal progresista para la comprensión de imágenes y videos

Avances en inteligencia multimodal Depende del procesamiento y la comprensión de imágenes y videos. Las imágenes pueden revelar escenas estáticas proporcionando información sobre detalles como objetos, texto y relaciones espaciales. Sin confiscación, esto tiene el costo de ser extremadamente desafiante. La comprensión de video implica el seguimiento de los cambios a lo amplio del tiempo, […]

Investigadores de Stanford proponen un entorno de formación forzoso basado en regresión unificada para modelos de secuencia con memoria asociativa

Las secuencias son una idealización universal para representar y procesar información, lo que hace que el modelado de secuencias sea fundamental para la modernidad. formación profundo. Al enmarcar las tareas computacionales como transformaciones entre secuencias, esta perspectiva se ha extendido a diversos campos como la PNL, la visión por computadora, el descomposición de series temporales […]

Investigadores de la Universidad de Princeton introducen el condicionamiento de metadatos y luego el refrigeración (MeCo) para simplificar y optimizar el entrenamiento previo del maniquí de jerigonza

El entrenamiento previo de los modelos de jerigonza (LM) juega un papel crucial a la hora de permitir su capacidad para comprender y suscitar texto. Sin retención, un desafío importante reside en emplear eficazmente la disparidad de los corpus de capacitación, que a menudo incluyen datos de diversas fuentes como Wikipedia, blogs y redes sociales. […]

Investigadores de NVIDIA, CMU y la Universidad de Washington lanzaron ‘FlashInfer’: una biblioteca de kernel que proporciona implementaciones de kernel de última reproducción para inferencia y servicio de LLM

Los modelos de estilo grandes (LLM) se han convertido en una parte integral de las aplicaciones modernas de inteligencia fabricado, impulsando herramientas como chatbots y generadores de código. Sin requisa, la longevo dependencia de estos modelos ha revelado ineficiencias críticas en los procesos de inferencia. Los mecanismos de atención, como FlashAttention y SparseAttention, a menudo […]

Investigadores de la Universidad del Sur de Florida proponen la función de activación TeLU para un estudios profundo rápido y estable

Inspirado por el cerebro, redes neuronales Son esenciales para aceptar imágenes y procesar el jerigonza. Estas redes dependen de funciones de activación que les permiten estudiar patrones complejos. Sin incautación, muchas funciones de activación enfrentan desafíos. Algunos luchan con gradientes de fugalo que ralentiza el estudios en redes profundas, mientras que otros sufren «muerto neuronas”, […]

La IA en la salubridad debería regularse, pero no olvidarse de los algoritmos, dicen los investigadores | Parte del MIT

Se podría argumentar que uno de los deberes principales de un médico es evaluar y reevaluar constantemente las probabilidades: ¿Cuáles son las posibilidades de éxito de un procedimiento médico? ¿El paciente corre peligro de desarrollar síntomas graves? ¿Cuándo debe regresar el paciente para realizar más pruebas? En medio de estas deliberaciones críticas, el auge de […]

Investigadores del MIT presentan Boltz-1, un maniquí de código totalmente libre para predecir estructuras biomoleculares | Telediario del MIT

Los científicos del MIT han libertino un potente maniquí de IA de código libre, llamado Boltz-1, que podría acelerar significativamente la investigación biomédica y el avance de fármacos. Desarrollado por un equipo de investigadores de la Clínica Jameel del MIT para el Estudios Inevitable en Lozanía, Boltz-1 es el primer maniquí de código libre que […]

Los investigadores reducen el sesgo en los modelos de IA al tiempo que preservan o mejoran la precisión | Parte del MIT

Los modelos de estudios obligatorio pueden abortar cuando intentan hacer predicciones para personas que estaban subrepresentadas en los conjuntos de datos en los que fueron entrenados. Por ejemplo, un maniquí que predice la mejor opción de tratamiento para cualquiera con una enfermedad crónica puede entrenarse utilizando un conjunto de datos que contenga principalmente pacientes masculinos. […]

Investigadores del MIT desarrollan una forma capaz de entrenar agentes de IA más confiables | Noticiario del MIT

Campos que van desde la robótica hasta la medicina y las ciencias políticas están intentando entrenar sistemas de inteligencia fabricado para tomar decisiones significativas de todo tipo. Por ejemplo, utilizar un sistema de inteligencia fabricado para controlar de forma inteligente el tráfico en una ciudad congestionada podría ayudar a los conductores a aparecer más rápido […]

Investigadores de John Hopkins presentan Genex: el maniquí de IA que imagina su camino a través de mundos 3D

La planificación y la toma de decisiones en entornos complejos y parcialmente observados es un desafío importante en la IA incorporada. Tradicionalmente, los agentes incorporados dependen de la exploración física para compendiar más información, lo que puede transigir mucho tiempo y ser poco práctico, especialmente en entornos dinámicos a gran escalera. Por ejemplo, la conducción […]