Enseñando a los modelos de IA los golpes amplios para esbozar más como lo hacen los humanos | MIT News

Cuando intentas comunicar o entender ideas, las palabras no siempre hacen el truco. A veces, el enfoque más competente es hacer un programa simple de ese concepto, por ejemplo, diagramarse de un circuito podría ayudar a dar sentido a cómo funciona el sistema. Pero, ¿qué pasaría si la inteligencia químico pudiera ayudarnos a explorar estas […]
Enseñar modelos de IA lo que no saben | MIT News

Los sistemas de inteligencia sintético como ChatGPT proporcionan respuestas de sonido plausible a cualquier pregunta que pueda hacer. Pero no siempre revelan las brechas en sus conocimientos o áreas donde están inciertos. Ese problema puede tener enormes consecuencias ya que los sistemas de IA se usan cada vez más para hacer cosas como desarrollar drogas, […]
8 plataformas gratuitas para encajar modelos de educación maquinal

Implementar un maniquí de educación maquinal es uno de los pasos más críticos para configurar un tesina de IA. Ya sea que se trate de un prototipo o lo está escando para la producción, la implementación del maniquí en ML asegura que los modelos sean accesibles y se puedan usar en entornos prácticos. En este […]
¿Los LLM efectivamente pueden fallar con razonamiento? Los investigadores de Microsoft y Tsinghua introducen modelos de razonamiento de recompensas para subir dinámicamente el calculador de tiempo de prueba para una mejor columna

El educación de refuerzo (RL) ha surgido como un enfoque fundamental en la capacitación de LLM, utilizando señales de supervisión de la feedback humana (RLHF) o las recompensas verificables (RLVR). Si admisiblemente RLVR se muestra prometedor en el razonamiento matemático, enfrenta limitaciones significativas adecuado a la dependencia de las consultas de capacitación con respuestas verificables. […]
Presentación de los nuevos modelos Claude Opus 4 y Sonnet 4 en Databricks

Razón sobre sus datos. Automatizar flujos de trabajo complejos. Escalera con confianza, todo en Databricks. Dos meses a posteriori de propalar nuestra asociación con Anthrope, estamos encantados de anunciar que Claude Opus 4 y soneto 4 Ahora están disponibles de forma nativa para los clientes de Databricks en AWS, Azure y GCP. Opus 4 ofrece […]
El estudio muestra que los modelos en idioma de visión no pueden manejar consultas con palabras de abjuración | MIT News

Imagine un radiólogo que examina una radiografía de tórax de un nuevo paciente. Ella se da cuenta de que el paciente tiene hinchazón en el tejido pero no tiene un corazón agrandado. Buscando acelerar el diagnosis, podría usar un maniquí de estudios espontáneo en idioma visión para apañarse informes de pacientes similares. Pero si el […]
Anunciando nuevos modelos y técnicas de ajuste fino en Azure Ai Foundry

Hoy, estamos emocionados de anunciar dos mejoras principales para modelar el ajuste fino en la fundición de AI AI: el ajuste de refuerzo (RFT) con O4-Mini, próximamente, y ajuste fino supervisado (SFT) para el maniquí 4.1-Nano, arreglado ahora. Hoy, estamos entusiasmados de anunciar tres mejoras principales para modelar el ajuste fino en la fundición de […]
La IA multimodal necesita más que soporte de modalidad: los investigadores proponen a nivel genérico y un cárcel genérico para evaluar la verdadera sinergia en modelos generalistas

La inteligencia químico ha crecido más allá de los sistemas centrados en el jerga, evolucionando en modelos capaces de procesar múltiples tipos de entrada, como texto, imágenes, audio y video. Esta ámbito, conocida como estudios multimodal, tiene como objetivo replicar la capacidad humana natural para integrar e interpretar datos sensoriales variados. A diferencia de los […]
Cómo Deutsche Bahn redefine el pronóstico utilizando modelos Chronos, ahora disponibles en Amazon Bedrock Marketplace

Esta publicación está coescrita con Kilian Zimmerer y Daniel Ringler de Deutsche Bahn. Todos los días, Deutsche Bahn (DB) pasa a más de 6.6 millones de pasajeros en Alemania, lo que requiere un pronóstico preciso de series temporales para una amplia grado de propósitos. Sin requisa, la construcción de modelos de pronóstico precisos tradicionalmente requería […]
Una derrotero de codificación para comparar tres modelos de difusión de AI de estabilidad (V1.5, V2-base y SD3-Medio) Capacidades de difusión de costado a costado en Google Colab usando Gradio

En este tutorial práctico, desbloquearemos el potencial creativo de Estabilidad aiLos modelos de difusión líderes en la industria, Difusión estable V1.5, almohadilla V2 de estabilidad AI y el medio de difusión estable 3 de vanguardiapara difundir imágenes llamativas. Continuando completamente en Google Colab con una interfaz Gradio, experimentaremos comparaciones de costado a costado de tres […]