Un año de Phi: modelos de idioma pequeño que hacen grandes saltos en AI

Microsoft continúa aumentando la conversación presentando sus modelos más nuevos, la condición de phi-4, Phi-4-Rasoning-Plus y Phi-4-Mini-Razoning. Una nueva era de AI Hace un año, Microsoft introdujo modelos de idioma pequeño (SLM) a los clientes con el emanación de Phi-3 en Azure ai fundiciónAprovechando la investigación en SLM para expandir la matiz de modelos y […]
Hacer modelos de IA más confiables para configuraciones de detención peligro | MIT News

La equívoco en las imágenes médicas puede presentar desafíos importantes para los médicos que intentan identificar enfermedades. Por ejemplo, en una radiografía de tórax, el derrame pleural, una acumulación anormal de nítido en los pulmones, puede parecerse mucho a los infiltrados pulmonares, que son acumulaciones de pus o parentesco. Un maniquí de inteligencia fabricado podría […]
Anunciando la serie de modelos GPT-4.1 para los desarrolladores de Azure Ai Foundry y GitHub

Estamos entusiasmados de compartir el tirada de la próxima vivientes de la serie de modelos GPT-4O con GPT-4.1, 4.1-Mini y 4.1-Nano a Microsoft Azure OpenAI Service. Estamos entusiasmados de compartir el tirada de la próxima iteración de la serie Maniquí GPT con GPT-4.1, 4.1-Mini y 4.1-Nano a Servicio Microsoft Azure OpenAI y Github. Los modelos […]
REPULTACIÓN DE MODELOS DE PLOGA DE PROTEINES PARA GENERACIÓN CON DIFUSIÓN LATENTE – BLOG

TARTÁN es un maniquí generativo multimodal que genera simultáneamente la secuencia de proteína 1D y la estructura 3D, al ilustrarse el espacio recóndito de los modelos de plegamiento de proteínas. La adjudicación de la 2024 Premio Nobel Alfafold2 marca un momento importante de examen para el papel de IA en la biología. ¿Qué viene a […]
Vana permite a los usuarios tener una parte de los modelos AI capacitados en sus datos | MIT News

En febrero de 2024, Reddit llegó a un acuerdo de $ 60 millones con Google para permitir que el coloso de la búsqueda use datos en la plataforma para entrenar sus modelos de inteligencia industrial. Notablemente ausentes de las discusiones estaban los usuarios de Reddit, cuyos datos se vendían. El acuerdo reflejó la verdad de […]
Meta’s Apasionamiento 4 Modelos de idiomas grandes ahora disponibles en Snowflake Cortex AI

Snowflake es la única plataforma de datos en la nubarrón con integración nativa a modelos principales de OpenAI y antrópico, así como de otros. Al integrar LLAMA 4 en Snowflake Cortex AI, estamos proporcionando a nuestros clientes acercamiento a modelos de IA de vanguardia para que puedan construir aplicaciones inteligentes y agentes de datos, todo […]
Este artículo de IA presenta FastCurl: un situación de estudios de refuerzo curricular con extensión de contexto para una capacitación efectivo de modelos de razonamiento similar a R1

Los modelos de idiomas grandes han transformado cómo las máquinas comprenden y generan texto, especialmente en áreas complejas de resolución de problemas como el razonamiento matemático. Estos sistemas, conocidos como modelos tipo R1, están diseñados para pugnar procesos de pensamiento lentos y deliberados. Su fuerza esencia es manejar tareas complejas que requieren un razonamiento paso […]
Servir modelos QWEN en Databricks

Los modelos QWEN, desarrollados por Alibaba, han mostrado un válido rendimiento tanto en las tareas de finalización como en las tareas de instrucción. En este blog, mostraremos cómo puede registrar e implementar modelos QWEN en Databricks utilizando un enfoque similar al de las arquitecturas basadas en LLAMA. Siguiendo estos pasos, puede usar los puntos finales […]
Los investigadores de Google Deepmind proponen Camel: una defensa robusta que crea una capa del sistema de protección aproximadamente del LLM, asegurándolo incluso cuando los modelos subyacentes pueden ser susceptibles a los ataques

Los modelos de idiomas grandes (LLM) se están volviendo integrales para la tecnología moderna, lo que impulsa sistemas de agente que interactúen dinámicamente con entornos externos. A pesar de sus impresionantes capacidades, los LLM son mucho vulnerables a ataques de inyección inmediatos. Estos ataques ocurren cuando los adversarios inyectan instrucciones maliciosas a través de fuentes […]
Referéndum de herramientas con modelos Amazon Nova

En muchas aplicaciones generativas de IA, un maniquí de jerigonza holgado (LLM) como Amazon Nova se utiliza para contestar a una consulta de legatario basada en el conocimiento o el contexto del maniquí que se proporciona. Sin incautación, a medida que los casos de uso han madurado, la capacidad de un maniquí de tener comunicación […]