Los investigadores vislumbran el funcionamiento interno de los modelos de estilo de proteínas | MIT News

En los últimos abriles, los modelos que pueden predecir la estructura o función de las proteínas se han utilizado ampliamente para una variedad de aplicaciones biológicas, como identificar objetivos fármacos y diseñar nuevos anticuerpos terapéuticos. Estos modelos, que se basan en modelos de idiomas grandes (LLM), pueden hacer predicciones muy precisas de la idoneidad de […]
Conoce a Deepfleet: la nueva suite de modelos AI de Amazon que puede predecir los patrones de tráfico futuros para las flotas de robots móviles

Amazon ha aprehendido un hito importante al desplegar su autómata de un millón en los centros globales de cumplimiento y clasificación, solidificando su posición como el cámara más extenso del mundo de robótica industrial. Este logro coincide con el tiro de Profundoun conjunto renovador de modelos de cojín diseñados para mejorar la coordinación entre vastas […]
Los principales modelos de IA de Europa de 2025: multilingües, abiertos y preparados para la empresa

El ecosistema de IA de Europa en 2025 es una arena robusta de innovación abierta, capacidades multilingües y razonamiento de límite empresarial. A continuación, presentamos una revisión en profundidad y verificada de hechos de los modelos de IA más avanzados de la región, con especificaciones técnicas, licencias y fortalezas destacadas. Cada entrada incluye enlaces a […]
Modelos de IA de trenes y implementación a escalera de billones de parámetros con el soporte de HyperPod de Amazon Sagemaker para ultraservadores P6E-GB200

Imagine servirse el poder de 72 GPU Nvidia Blackwell de vanguardia en un solo sistema para la próxima ola de innovación de IA, desbloqueando 360 petaflops de punto flotante denso de 8 bits (FP8) y 1.4 exafultos de punto de flotación de 4 bits de 4 bits (FP4). Hoy, eso es exactamente lo que Amazon […]
Los modelos de estilo de atajos matemáticos únicos que utilizan para predecir escenarios dinámicos | MIT News

Digamos que estás leyendo una historia o jugando un surtido de ajedrez. Es posible que no haya notado, pero en cada paso del camino, su mente realizó un seguimiento de cómo estaba cambiando la situación (o «estado del mundo»). Puede imaginar esto como una especie de secuencia de la relación de eventos, que utilizamos para […]
MDM-PRIME: un situación de modelos de difusión enmascarados generalizado (MDMS) que permite tokens parcialmente desenmascarados durante el muestreo

Inmersión a MDMS y sus ineficiencias Los modelos de difusión enmascarados (MDM) son herramientas poderosas para difundir datos discretos, como texto o secuencias simbólicas, al desenmascarar gradualmente los tokens con el tiempo. En cada paso, las fichas están enmascaradas o desenmascaradas. Sin requisa, se ha observado que muchos pasos en el proceso inverso no cambian […]
Entrenamiento de 10,000 modelos de detección de anomalías en mil millones de registros con predicciones explicables

El poder de la detección de anomalías en toda la industria Detección de anomalías es una técnica crucial para identificar patrones inusuales que podrían indicar posibles problemas u oportunidades. Algunos usos tempranos de la técnica incluyen ciberseguridad para detectar intrusiones y en finanzas para identificar fraude potencial, pero hoy sus aplicaciones ahora abarcan monitoreo de […]
Desempacando el sesgo de los modelos de idiomas grandes | MIT News

La investigación ha demostrado que los modelos de idiomas grandes (LLM) tienden a resaltar demasiado la información al principio y al final de un documento o conversación, al tiempo que descuidan el medio. Este «sesgo de posición» significa que, si un abogado está utilizando un asistente potencial con motor LLM para recuperar una cierta frase […]
Implementar modelos QWEN con la importación del maniquí personalizado de Amazon Bedrock

Estamos emocionados de anunciar que Importación de modelos personalizados de Amazon Bedrock ahora es compatible Qwen modelos. Ahora puede importar pesos personalizados para arquitecturas QWEN2, QWEN2_VL y QWEN2_5_VL, incluidos modelos como Qwen 2, 2.5 Coder, Qwen 2.5 VL y QWQ 32B. Puede transigir sus propios modelos QWEN personalizados a Amazon Bedrock e implementarlos en un […]
Meta AI Lanzamientos V-JEPA 2: Modelos mundiales auto-supervisados de código hendido para la comprensión, la predicción y la planificación

Meta AI ha introducido V-Jepa 2, un maniquí de mundo hendido escalable diseñado para educarse de video a escalera de Internet y permitir una comprensión visual robusta, predicción estatal futura y planificación de disparos cero. Sobre la almohadilla de la cimentación predictiva de incrustación conjunta (JEPA), V-JEPA 2 demuestra cómo el estudios auto-supervisado del video […]