GPT-4O es fielmente mi maniquí predilecto para entretenerse. Admite casi todo lo que hago en el día a día. Mientras que el mundo de la IA todavía estaba zumbando sobre su poderoso concepción de imágenes Capacidades, OpenAi decidió hacerlo aún mejor. ¿Escuchaste sobre el maniquí GPT-4O actualizado y cómo supera a GPT-4.5 en el Chatbot Arena tabla de clasificación? Si está confundido y se pregunta cómo supera a su predecesor a un costo 10 veces último, este artículo es para usted. Desglosemos las principales actualizaciones y veamos cómo se acumula GPT-4.5.
¿Qué ofrece el maniquí GPT-4O actualizado?
Esta modernización alivio el rendimiento del maniquí, haciéndolo notar más intuitivo, creativo y colaborativo. Las mejoras esencia incluyen:
- Mejor instrucción siguiendo: Sigue con más precisión las instrucciones del sucesor.
- Codificación mejorada: Maneja las tareas de codificación más suavemente.
- Comunicación natural: Las respuestas son más claras, más concisas y menos abarrotadas (por ejemplo, menos niveles de markdown y emojis), lo que hace que sea más factible de interpretar y más enfocado.
Este GPT-4O actualizado ahora está apto en Chatgpt y a través del API OPERAI.
Rendimiento GPT-4O actualizado

- Clasificación genérico:
- GPT-4O (#2) ahora supera GPT-4.5 (#2–3) En la mayoría de las categorías, vinculando con Gemini 2.5 Pro en indicaciones y codificación difíciles.
- Tanto Trail Gemini-2.5-Pro (clasificado #1 en genérico) pero superan a otros modelos como Grok-3.
- Mejoras importantes en GPT-4O (contra interpretación de enero de 2025):
- Indicaciones duras: Saltó del #7 → #1
- Matemáticas: Mejorado de #14 → #2
- Codificación: Rose de #5 → #1 (ligado con Gemini/GPT-4.5)
- Instrucción sucesivo: #5 → #2
- GPT-4O vs. GPT-4.5:
- Igual en indicaciones difíciles, codificación y múltiples vueltas (entreambos rango #1).
- GPT-4O lidera en matemáticas ( #2 vs. #1 para GPT-4.5) y Escritura creativa ( #2 vs. #2).
- GPT-4.5 tenuemente mejor en consultas más largas ( #2 vs. #1 para GPT-4O).
- Eficiencia de rentabilidad:
- GPT-4O logra un rendimiento comparable (o mejor) a GPT-4.5 a un costo 10 veces último, según las afirmaciones de OpenAI.
Vamos a probarlo
Dadas las afirmaciones de que GPT-4O es mejor que GPT 4.5, intentemos entreambos con el mismo aviso y evaluemos su desempeño:
Tarea 1: codificación
Inmediato: «Cree un ocio HTML5 donde los huevos caen verticalmente desde posiciones aleatorias en la parte superior de la pantalla, comenzando en intervalos de 1 segundo y acelerando gradualmente. El componente controla a un receptor (a almohadilla de cursor) para recoger huevos. Cada captura exitosa agrega +5 puntos al grabador en tiempo actual, mientras que los huevos perdidos deducen -2 puntos. El ocio termina instantáneamente si se pierden 3 huevos, lo que provocó una pantalla de ‘ocio sobre’ con el puntaje final. Implemente esto utilizando HTML/CSS/JavaScript puro con un diseño receptivo.«
Producción:
Observación:
Mientras que entreambos modelos generaron implementaciones de juegos similares, GPT-4O demostró una atención superior al diseño visual. Específicamente:
- GPT-4O utilizó un esquema de color aceptablemente optimizado, asegurando una clara visibilidad de los huevos contra el fondo.
- GPT-4.5mientras que cómodo, produjo un último contraste entre los instrumentos, lo que hace que los huevos sean tenuemente más difíciles de distinguir.
Veredicto:
GPT-4.5 ❌ | GPT-4O actualizado ✅
Tarea 2: Escritura creativa + Instrucción A continuación
Inmediato: «Utilizando la concepción de imágenes de GPT-4O como inspiración, escriba un poema conmovedor de 10 líneas que captura la división entre aquellos que creen que «el arte pertenece solo a los humanos» y aquellos que celebran ‘creatividad democratizada a través de AI’. Teje en emociones de resistor, asombro y la tensión entre la tradición y la posibilidad tecnológica.«

Observación:
Mientras que el poema de GPT-4.5 presenta ambas perspectivas de modo uniforme y concluye con conformidad, la interpretación de GPT-4O crea contrastes emocionales más fuertes pero termina abruptamente. Por lo tanto, si valora el saldo y la resolución, 4.5 funciona mejor. Sin confiscación, si prefiere la intensidad sobre el suspensión, 4O es esforzado.
Veredicto:
GPT-4.5 ❌ | GPT-4O actualizado ✅
Tarea 3: razonamiento metódico
Respuesta GPT 4O actualizada:
-- Truth Table: A = false, B = true is the only valid scenario.
-- Proof:
-- 1. Bob says: ¬A
-- 2. If B is a knight → ¬A is true → A is false
-- 3. Alice says: B → ¬A
-- 4. If Alice is a knave, her statement is false → B ∧ A
-- 5. Contradiction unless A = false, B = true ✅
SELECT name,
CASE WHEN name="Alice" THEN 'knave'
WHEN name="Bob" THEN 'knight' END AS identity
FROM islanders WHERE name IN ('Alice', 'Bob');
GPT 4.5 Respuesta:
SELECT name, type FROM islanders
WHERE (name="Alice" AND type="Knight")
OR (name="Bob" AND type="Knave");
Observación:
- Deducción método correcta
- Los dos modelos identifican correctamente Alice como el bribón y Bob como el caritativo.
- Pero La prueba de GPT-4.5 contradice su propia conclusión (afirma que Alice es un caritativo en el paso 5, a pesar de los pasos correctos anteriores).
- Claridad de prueba
- La prueba de GPT-4O es impecable y conciso (5 líneas, sin contradicciones).
- La prueba de GPT-4.5 termina con un conclusión inconsistente (A = seguro contradice su tabla de verdad).
- Implementación de SQL
- La consulta de GPT-4O es higienizador (usa
CASE
para mapeo directo). - La consulta de GPT-4.5 funciona pero es menos elegante (títulos de códigos duros).
- La consulta de GPT-4O es higienizador (usa
- Mesa de verdad
- GPT-4O omita cajas no válidas (se centra solo en el tablado válido).
- GPT-4.5 enumera todos los casos pero Descallado mal de validez de la testimonio de Alice (La fila 2 debe mostrar el STMT de Alice como FALSO para consistencia).
Veredicto:
GPT-4.5 ❌ | GPT-4O actualizado ✅
Lea asimismo:
Nota final
GPT-4O no es solo una modernización, es el nuevo típico. En toda la codificación, tareas creativas y razonamiento metódico, supera a GPT-4.5 con precisión más nítida, respuestas más claras y costo 10 veces más bajo. Ya sea que sea un desarrollador, escritor o solucionador de problemas, GPT-4O ofrece resultados más rápidos, inteligentes y más confiables.
¿Lo probaste? ¿Qué piensas sobre esto? Déjame retener en la sección de comentarios a continuación.
Estén atentos a Analytics Vidhya Blog ¡Para más contenido de este tipo!
Inicie sesión para continuar leyendo y disfrutando de contenido curado por expertos.