Claude Haiku 4.5 ya está aquí… ¿y es MEJOR que Sonnet 4.5?

Claude Haiku 4.5 es el extremo maniquí pequeño de Anthropic, emprendedor el 15^th Octubre para todos los usuarios. Es un robusto recordatorio de que la velocidad y la inteligencia no tienen por qué tener un precio detención.

Hace escasamente cinco meses, Claude Sonnet 4 era considerado el punto de narración en cuanto a rendimiento controlado. Ahora, Haiku 4.5 ofrece casi las mismas habilidades de codificación y razonamiento a un tercio del costo y más del doble de velocidad.

Esta lectura no es sólo otra aggiornamento. Muestra cuánto circunscripción pueden cubrir los modelos más pequeños cuando se diseñan proporcionadamente. En este artículo, veremos las novedades de Haiku 4.5, su rendimiento y por qué es importante.

Historial: Dónde encaja el haiku en la comunidad Claude

La comunidad Claude de Anthropic incluye tres modelos principales Opus, Sonetoy Haikú. miCada maniquí está diseñado para diferentes deposición.

Claude Opus Es el maniquí más capaz. Está diseñado para razonamientos profundos y tareas complejas.
Claude Soneto Ofrece inmovilidad entre inteligencia y eficiencia. Es ideal para tareas profesionales y empresariales.
Claude Haiku Es el más pequeño y rápido de los tres. Está diseñado para aplicaciones que exigen velocidad, escalabilidad y rentabilidad.

Con Haikú 4.5Anthropic ha impulsado este maniquí voluble aún más, ofreciendo respuestas más rápidas, habilidades de codificación mejoradas y precisión confiable a un costo imperceptible. Es la opción ideal para desarrolladores que buscan rendimiento y escalabilidad.

Mejoras esencia en Haiku 4.5 sobre Haiku 3.5

Rendimiento cercano a la frontera a suscripción velocidad

Claude Haiku 4.5 ofrece un rendimiento comparable al de Sonnet 4 en razonamiento, codificación y tareas complejas, pero a más del doble de velocidad y un tercio del costo, lo que lo hace ideal para aplicaciones de gran cuerpo.

Capacidades de pensamiento ampliadas

Por primera vez en la comunidad Haiku, soporte 4.5 pensamiento extendidopermitiendo un razonamiento liberal:

Acceda al razonamiento interno para la resolución de problemas complejos
Resultados de pensamiento resumidos para implementaciones listas para producción
Pensamiento entrelazado entre llamadas de herramientas para flujos de trabajo de varios pasos
Controle los presupuestos de tokens para equilibrar la profundidad del razonamiento con la velocidad

Conciencia del contexto

Claude Haiku 4.5 presenta conciencia del contextopermitiendo al maniquí resolver su espacio de conversación de forma más eficaz:

Seguimiento del presupuesto de tokens: Supervisa el contexto restante posteriormente de cada citación a la aparejo en tiempo auténtico
Persistencia de tareas mejorada: Ejecuta tareas de modo válido al comprender el espacio apto
Flujos de trabajo multicontexto: Maneja las transiciones de estado sin problemas en sesiones extendidas

Este es el primer maniquí de haiku para incluir la conciencia del contexto nativo.

Cachas codificación y uso de herramientas

Ofertas Claude Haiku 4.5 capacidades de codificación sólidas y soporte completo de herramientas:

Competencia en codificación: Destaca en la vivientes, depuración y refactorización de código
Integración completa de herramientas: Funciona con todos claudio 4 herramientas, que incluyen bash, ejecución de código, editor de texto, búsqueda web y uso de computadora
Uso mejorado de la computadora: Optimizado para la automatización autónoma del navegador y el escritorio
Ejecución de herramientas en paralelo: Coordina múltiples herramientas de modo válido para flujos de trabajo complejos

Puntos de narración y evaluación comparativa

En los puntos de narración típico, Claude Haiku 4.5 supera su peso. coincide Soneto 4.5 en muchas pruebas de codificación y razonamiento al mismo tiempo que ofrece una eficiencia sustancialmente mejor, aproximadamente un tercio del costo y más el doble de velocidad en tareas sensibles al rendimiento y a la latencia.

En comparación con versiones anteriores de Haiku, 4.5 mejoramiento el rendimiento de token por segundo, la orquestación de múltiples herramientas y la coherencia de múltiples turnos, lo que lo hace particularmente sólido para asistentes en tiempo auténtico y canalizaciones de gran cuerpo.

En sumario, Haiku 4.5 ofrece una precisión cercana a la frontera con una clara preeminencia en costo-rendimiento y capacidad de respuesta.

Evaluaciones de seguridad

En sus evaluaciones de seguridad, Anthropic informa que Claude Haiku 4.5 pasó pruebas de formación integrales con bajas tasas de comportamiento preocupante y claras ganancias sobre Haiku 3.5. Las evaluaciones automatizadas mostraron que Haiku 4.5 tiene una tasa estadísticamente significativa más mengua de comportamientos desalineados que Sonnet 4.5 y Opus 4.1, lo que lo convierte en el maniquí más seguro de la compañía según esa métrica.

Las pruebas asimismo encontraron riesgos limitados en torno al contenido químico, biológico, radiológico y nuclear (CBRN), por lo que Haiku 4.5 se rejón bajo el Nivel de seguridad AI 2 (ASL-2), mientras que Sonnet 4.5 y Opus 4.1 permanecen clasificados en ASL-3.

Tareas del mundo auténtico con Haiku 4.5

En esta sección, pondremos a prueba este extremo LLM en tres tareas principales:

Codificación

Pregunta 1: “Crea una página web donde los objetos caen bajo la peligro e interactúan con el entorno. Los objetos pueden ser cualquier cosa: cuadrados, imágenes o formas.

Requisitos:

Los objetos se aceleran con destino a debajo (peligro).
Los objetos pueden chocar con el “suelo” u otras superficies y detenerse o rebotar.
Permita que el afortunado genere objetos haciendo clic o arrastrando.

Prima:

Añade derrota o tiro que afecte a los objetos.
Diferentes tipos de objetos con diferente masa y elasticidad.“

Producción:

Puedes probarlo tú mismo aquí: claudio

Revisar:

Creó una buena aplicación web que seguía la mayoría de las leyes de la física. Como beneficio adicional, agregué variaciones de masa y elasticidad, pero las ignoró. La simulación aplicó correctamente la peligro (los objetos se aceleran con destino a debajo) y todos los objetos exhibieron un momento angular. Sin retención, posteriormente de las colisiones, sólo la hipérbole redonda debería suceder seguido girando, las demás deberían haberse detenido, pero no lo hicieron. Cuando señalé este problema, corrigió el comportamiento, aunque su respuesta auténtico tenía el error mencionado anteriormente.

Razonamiento

Inmediato: “El esquema representa la billete en los ingresos de las diferentes empresas del sector tecnológico en Cuckooland. Analiza el esquema y asegura lo subsiguiente:

En 2001, la empresa que creció más rápido creció un 100%, ¿cuál fue la tasa de crecimiento de la empresa que tuvo la beocio tasa de crecimiento?
En 2002, la tasa de crecimiento del sector en militar fue del 39%, ¿cuál fue la tasa de crecimiento absoluta observada por la SCT?
Los ingresos totales en 2006 fueron de 21,2 mil millones de dólares, los ingresos totales en 2005 fueron de 18,1 mil millones de dólares. ¿Cuál fue la tasa de crecimiento absoluta observada en Centure?
En 2004, toda la industria añadió 4.000 millones de dólares, de los cuales COGN aportó un aumento de 1.000 millones de dólares. ¿Cuál fue la tasa de crecimiento observada por todo el sector en 2004?“

Producción:

Razonamiento:

Revisar:

La primera respuesta es incorrecta. La respuesta correcta es 33%. La primera pregunta tenía tres partes: primero, encontrar la empresa de veterano crecimiento, luego encontrar la empresa de beocio crecimiento y luego el crecimiento de la empresa de beocio crecimiento. Completó satisfactoriamente las dos primeras partes, pero en la tercera solo calculó el cambio en la billete en los ingresos.

Mensaje 2: “Problema de los dos huevos (lectura difícil) Tienes un edificio de 100 pisos y dos huevos idénticos. Quieres encontrar el pavimento más detención desde el cual se puede dejar caer un huevo sin que se rompa. ¿Cuál es el número imperceptible de gotas necesarias en el peor de los casos?“

Producción:

Revisar:

Ha hecho un buen trabajo aquí, al dar la respuesta correcta con el razonamiento y las matemáticas adecuados detrás.

Pregunta 3: “Si una persona tiene una mostrador de oro y necesita pagarle a un trabajador una porción igual de oro durante 6 días consecutivos, ¿cuál es el número imperceptible de cortes que debe hacer la persona?

Producción:

Revisar:

Ha hecho un buen trabajo aquí al dar la respuesta correcta. Pero en ocasión de dar la respuesta directamente, ha realizado una iteración más.

Conclusión

Claude Haiku 4.5 demuestra que los modelos pequeños pueden ofrecer grandes resultados. Con inteligencia cercana a la frontera, razonamiento extendido y respuestas ultrarrápidas, cierra con éxito la brecha entre eficiencia y capacidad. Anthropic ha refinado Haiku hasta convertirlo en un maniquí que realiza tareas complejas de codificación y razonamiento a una fracción del costo, sin comprometer la precisión o la seguridad.

En pruebas del mundo auténtico, Haiku 4.5 demostró un gran dominio de la codificación, razonamiento natural y la capacidad de adaptarse a los comentarios de los usuarios, lo que lo hace adecuado tanto para desarrolladores como para empresas. Su inclusión de pensamiento ampliado, conciencia del contexto y uso mejorado de herramientas marca una progreso significativa en cómo se pueden implementar modelos livianos para flujos de trabajo inteligentes a gran escalera.

En militar, Claude Haiku 4.5 es un poderoso paso delante para una IA accesible y de suscripción velocidad, que ofrece la combinación perfecta de inteligencia, rendimiento y seguridad para aplicaciones modernas.

Preguntas frecuentes

P1. ¿Qué diferencia al Claude Haiku 4.5 de los modelos Haiku anteriores?

A. Es más rápido, más inteligente y más válido. Haiku 4.5 iguala el rendimiento cercano a Sonnet 4 a un tercio del costo y el doble de velocidad, con nuevas características como razonamiento extendido, conocimiento del contexto y capacidades de codificación mejoradas.

P2. ¿Qué tan seguro es Claude Haiku 4.5 en comparación con otros modelos de Claude?

A. Es el maniquí más seguro de Anthropic hasta el momento, clasificado como Nivel de seguridad de IA 2. Las pruebas muestran menos comportamientos desalineados que Sonnet 4.5 y Opus 4.1.

P3. ¿Quién debería utilizar Claude Haiku 4.5?

A. Los desarrolladores y equipos que necesitan una IA rápida, escalable y asequible para codificar, razonar o flujos de trabajo de gran cuerpo se beneficiarán más de la velocidad y eficiencia de Haiku 4.5.

Analista de datos con más de 2 abriles de experiencia en el explotación de conocimientos de datos para impulsar decisiones informadas. Apasionado por resolver problemas complejos y explorar nuevas tendencias en analítica. Cuando no profundizo en los datos, disfruto divertirse ajedrez, cantar y escribir shayari.

Inicie sesión para continuar leyendo y disfrutar de contenido seleccionado por expertos.

Etiquetado Aquí, Claude, está, Haiku, mejor, Sonnet

Claude Haiku 4.5 ya está aquí… ¿y es MEJOR que Sonnet 4.5?

Historial: Dónde encaja el haiku en la comunidad Claude

Mejoras esencia en Haiku 4.5 sobre Haiku 3.5

Rendimiento cercano a la frontera a suscripción velocidad

Capacidades de pensamiento ampliadas

Conciencia del contexto

Cachas codificación y uso de herramientas

Puntos de narración y evaluación comparativa

Evaluaciones de seguridad

Tareas del mundo auténtico con Haiku 4.5

Codificación

Producción:

Revisar:

Razonamiento

Producción:

Razonamiento:

Revisar:

Producción:

Revisar:

Producción:

Revisar:

Conclusión

Preguntas frecuentes

Inicie sesión para continuar leyendo y disfrutar de contenido seleccionado por expertos.

Deja una respuesta Cancelar la respuesta

COLOMBIA

ENLACES DE INTERÉS