Athrun Data Intelligence

Un año de Phi: modelos de idioma pequeño que hacen grandes saltos en AI

Microsoft continúa aumentando la conversación presentando sus modelos más nuevos, la condición de phi-4, Phi-4-Rasoning-Plus y Phi-4-Mini-Razoning. Una nueva era de AI Hace un año, Microsoft introdujo modelos de idioma pequeño (SLM) a los clientes con el emanación de Phi-3 en Azure ai fundiciónAprovechando la investigación en SLM para expandir la matiz de modelos y […]

Hacer modelos de IA más confiables para configuraciones de detención peligro | MIT News

La equívoco en las imágenes médicas puede presentar desafíos importantes para los médicos que intentan identificar enfermedades. Por ejemplo, en una radiografía de tórax, el derrame pleural, una acumulación anormal de nítido en los pulmones, puede parecerse mucho a los infiltrados pulmonares, que son acumulaciones de pus o parentesco. Un maniquí de inteligencia fabricado podría […]

Este artículo de IA presenta FastCurl: un situación de estudios de refuerzo curricular con extensión de contexto para una capacitación efectivo de modelos de razonamiento similar a R1

Los modelos de idiomas grandes han transformado cómo las máquinas comprenden y generan texto, especialmente en áreas complejas de resolución de problemas como el razonamiento matemático. Estos sistemas, conocidos como modelos tipo R1, están diseñados para pugnar procesos de pensamiento lentos y deliberados. Su fuerza esencia es manejar tareas complejas que requieren un razonamiento paso […]

Servir modelos QWEN en Databricks

Los modelos QWEN, desarrollados por Alibaba, han mostrado un válido rendimiento tanto en las tareas de finalización como en las tareas de instrucción. En este blog, mostraremos cómo puede registrar e implementar modelos QWEN en Databricks utilizando un enfoque similar al de las arquitecturas basadas en LLAMA. Siguiendo estos pasos, puede usar los puntos finales […]

Los investigadores de Google Deepmind proponen Camel: una defensa robusta que crea una capa del sistema de protección aproximadamente del LLM, asegurándolo incluso cuando los modelos subyacentes pueden ser susceptibles a los ataques

Los modelos de idiomas grandes (LLM) se están volviendo integrales para la tecnología moderna, lo que impulsa sistemas de agente que interactúen dinámicamente con entornos externos. A pesar de sus impresionantes capacidades, los LLM son mucho vulnerables a ataques de inyección inmediatos. Estos ataques ocurren cuando los adversarios inyectan instrucciones maliciosas a través de fuentes […]

Referéndum de herramientas con modelos Amazon Nova

En muchas aplicaciones generativas de IA, un maniquí de jerigonza holgado (LLM) como Amazon Nova se utiliza para contestar a una consulta de legatario basada en el conocimiento o el contexto del maniquí que se proporciona. Sin incautación, a medida que los casos de uso han madurado, la capacidad de un maniquí de tener comunicación […]