Athrun Data Intelligence


GPT-4O es fielmente mi maniquí predilecto para entretenerse. Admite casi todo lo que hago en el día a día. Mientras que el mundo de la IA todavía estaba zumbando sobre su poderoso concepción de imágenes Capacidades, OpenAi decidió hacerlo aún mejor. ¿Escuchaste sobre el maniquí GPT-4O actualizado y cómo supera a GPT-4.5 en el Chatbot Arena tabla de clasificación? Si está confundido y se pregunta cómo supera a su predecesor a un costo 10 veces último, este artículo es para usted. Desglosemos las principales actualizaciones y veamos cómo se acumula GPT-4.5.

¿Qué ofrece el maniquí GPT-4O actualizado?

Esta modernización alivio el rendimiento del maniquí, haciéndolo notar más intuitivo, creativo y colaborativo. Las mejoras esencia incluyen:

  • Mejor instrucción siguiendo: Sigue con más precisión las instrucciones del sucesor.
  • Codificación mejorada: Maneja las tareas de codificación más suavemente.
  • Comunicación natural: Las respuestas son más claras, más concisas y menos abarrotadas (por ejemplo, menos niveles de markdown y emojis), lo que hace que sea más factible de interpretar y más enfocado.

Este GPT-4O actualizado ahora está apto en Chatgpt y a través del API OPERAI.

Rendimiento GPT-4O actualizado

  1. Clasificación genérico:
    • GPT-4O (#2) ahora supera GPT-4.5 (#2–3) En la mayoría de las categorías, vinculando con Gemini 2.5 Pro en indicaciones y codificación difíciles.
    • Tanto Trail Gemini-2.5-Pro ​​(clasificado #1 en genérico) pero superan a otros modelos como Grok-3.
  2. Mejoras importantes en GPT-4O (contra interpretación de enero de 2025):
    • Indicaciones duras: Saltó del #7 → #1
    • Matemáticas: Mejorado de #14 → #2
    • Codificación: Rose de #5 → #1 (ligado con Gemini/GPT-4.5)
    • Instrucción sucesivo: #5 → #2
  3. GPT-4O vs. GPT-4.5:
    • Igual en indicaciones difíciles, codificación y múltiples vueltas (entreambos rango #1).
    • GPT-4O lidera en matemáticas ( #2 vs. #1 para GPT-4.5) y Escritura creativa ( #2 vs. #2).
    • GPT-4.5 tenuemente mejor en consultas más largas ( #2 vs. #1 para GPT-4O).
  4. Eficiencia de rentabilidad:
    • GPT-4O logra un rendimiento comparable (o mejor) a GPT-4.5 a un costo 10 veces último, según las afirmaciones de OpenAI.

Vamos a probarlo

Dadas las afirmaciones de que GPT-4O es mejor que GPT 4.5, intentemos entreambos con el mismo aviso y evaluemos su desempeño:

Tarea 1: codificación

Inmediato: «Cree un ocio HTML5 donde los huevos caen verticalmente desde posiciones aleatorias en la parte superior de la pantalla, comenzando en intervalos de 1 segundo y acelerando gradualmente. El componente controla a un receptor (a almohadilla de cursor) para recoger huevos. Cada captura exitosa agrega +5 puntos al grabador en tiempo actual, mientras que los huevos perdidos deducen -2 puntos. El ocio termina instantáneamente si se pierden 3 huevos, lo que provocó una pantalla de ‘ocio sobre’ con el puntaje final. Implemente esto utilizando HTML/CSS/JavaScript puro con un diseño receptivo.«

Producción:

Observación:

Mientras que entreambos modelos generaron implementaciones de juegos similares, GPT-4O demostró una atención superior al diseño visual. Específicamente:

  • GPT-4O utilizó un esquema de color aceptablemente optimizado, asegurando una clara visibilidad de los huevos contra el fondo.
  • GPT-4.5mientras que cómodo, produjo un último contraste entre los instrumentos, lo que hace que los huevos sean tenuemente más difíciles de distinguir.

Veredicto:

GPT-4.5 ❌ | GPT-4O actualizado ✅

Tarea 2: Escritura creativa + Instrucción A continuación

Inmediato: «Utilizando la concepción de imágenes de GPT-4O como inspiración, escriba un poema conmovedor de 10 líneas que captura la división entre aquellos que creen que «el arte pertenece solo a los humanos» y aquellos que celebran ‘creatividad democratizada a través de AI’. Teje en emociones de resistor, asombro y la tensión entre la tradición y la posibilidad tecnológica.«

Observación:

Mientras que el poema de GPT-4.5 presenta ambas perspectivas de modo uniforme y concluye con conformidad, la interpretación de GPT-4O crea contrastes emocionales más fuertes pero termina abruptamente. Por lo tanto, si valora el saldo y la resolución, 4.5 funciona mejor. Sin confiscación, si prefiere la intensidad sobre el suspensión, 4O es esforzado.

Veredicto:

GPT-4.5 ❌ | GPT-4O actualizado ✅

Tarea 3: razonamiento metódico

Respuesta GPT 4O actualizada:

-- Truth Table: A = false, B = true is the only valid scenario.
-- Proof:
-- 1. Bob says: ¬A
-- 2. If B is a knight → ¬A is true → A is false
-- 3. Alice says: B → ¬A
-- 4. If Alice is a knave, her statement is false → B ∧ A
-- 5. Contradiction unless A = false, B = true ✅
SELECT name, 
       CASE WHEN name="Alice" THEN 'knave' 
            WHEN name="Bob" THEN 'knight' END AS identity
FROM islanders WHERE name IN ('Alice', 'Bob');

GPT 4.5 Respuesta:

SELECT name, type FROM islanders
WHERE (name="Alice" AND type="Knight")
   OR (name="Bob" AND type="Knave");

Observación:

  • Deducción método correcta
    • Los dos modelos identifican correctamente Alice como el bribón y Bob como el caritativo.
    • Pero La prueba de GPT-4.5 contradice su propia conclusión (afirma que Alice es un caritativo en el paso 5, a pesar de los pasos correctos anteriores).
  • Claridad de prueba
    • La prueba de GPT-4O es impecable y conciso (5 líneas, sin contradicciones).
    • La prueba de GPT-4.5 termina con un conclusión inconsistente (A = seguro contradice su tabla de verdad).
  • Implementación de SQL
    • La consulta de GPT-4O es higienizador (usa CASE para mapeo directo).
    • La consulta de GPT-4.5 funciona pero es menos elegante (títulos de códigos duros).
  • Mesa de verdad
    • GPT-4O omita cajas no válidas (se centra solo en el tablado válido).
    • GPT-4.5 enumera todos los casos pero Descallado mal de validez de la testimonio de Alice (La fila 2 debe mostrar el STMT de Alice como FALSO para consistencia).

Veredicto:

GPT-4.5 ❌ | GPT-4O actualizado ✅

Lea asimismo:

Nota final

GPT-4O no es solo una modernización, es el nuevo típico. En toda la codificación, tareas creativas y razonamiento metódico, supera a GPT-4.5 con precisión más nítida, respuestas más claras y costo 10 veces más bajo. Ya sea que sea un desarrollador, escritor o solucionador de problemas, GPT-4O ofrece resultados más rápidos, inteligentes y más confiables.

¿Lo probaste? ¿Qué piensas sobre esto? Déjame retener en la sección de comentarios a continuación.

Estén atentos a Analytics Vidhya Blog ¡Para más contenido de este tipo!

Hola, soy Nitika, un creador de contenido y mercader de contenido hábil en tecnología. La creatividad y el enseñanza de cosas nuevas me son lógicamente. Tengo experiencia en la creación de estrategias de contenido basadas en resultados. Estoy aceptablemente versado en la suministro de SEO, operaciones de palabras esencia, redacción de contenido web, comunicación, táctica de contenido, estampación y escritura.

Inicie sesión para continuar leyendo y disfrutando de contenido curado por expertos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *