Los agentes de Claude acaban de crear un compilador de C completamente pragmático

Dieciséis agentes autónomos de IA. Dos semanas de ejecución continua. Casi 100.000 líneas de código Rust. Eso es lo que necesitó Anthropic para construir un compilador de C pragmático capaz de coleccionar grandes proyectos del mundo positivo como el kernel de Linux. Sin confiscación, aquí hay un truco. El tesina, denominado internamente “equipos de agentes” de Claude, no fue escrito por un equipo de ingeniería humana. Fue desarrollado por un enjambre coordinado de agentes de Claude que trabajaron en paralelo, casi completamente sin intervención humana.

Pero sepa esto: esto no fue un autocompletado con esteroides ni un chatbot que unía funciones aleatorias. Los agentes de Claude operaron como un real equipo de ingeniería, dividiendo el compilador en módulos, asignando responsabilidades, escribiendo componentes, ejecutando conjuntos de pruebas, corrigiendo errores e iterando continuamente. Y eso es lo que hace que este sea un hito importante en la era del exposición de la IA (aprende IA gratuitamente). Exploremos en este artículo qué sucedió y qué importancia tiene.

TL;DR

Mire este video en su emplazamiento:

Lo que construyó antrópico

En esencia, el tesina de Anthropic se propuso construir un compilador de C completo desde cero pero, *esperen*, utilizando solo agentes de IA. Este no fue un intérprete de trasto ni una demostración en el cátedra. Este era un compilador positivo capaz de manejar cargas de trabajo a nivel de producción. El compilador Claude C fue escrito en Rust y creado para traducir programas C a código de máquina ejecutable en las principales arquitecturas como x86-64 y ARM.

Y esto no se probó en programas simples de “Hola Mundo”. Fue presionado con fuerza. El compilador manejó con éxito bases de código grandes y complejas, como el kernel de Linux y otros proyectos de código rajado ampliamente utilizados. Incluso pasó una parte importante del conjunto de pruebas de tortura de GCC, que es una colección formidable de casos extremos diseñados para romper los compiladores de C. Eso es lo que hace que este logro sea tan impresionante. Construir poco que funcione es una cosa. Construir poco que sobreviva las pruebas de estrés utilizadas por ingenieros compiladores profesionales es otra.

¿Qué tan antrópico lo hizo?

Entonces, ¿cómo se consigue que los agentes de IA construyan poco tan difícil como un compilador de C?

La secreto era no pender de un único maniquí que se ejecutara en rizo. En cambio, desplegaron un equipo de 16 agentes de Claude trabajando en paralelo. Piense en ello como crear un pequeño equipo de ingeniería, excepto que cada ingeniero es una instancia de IA. A cada agente se le asignaron tareas estructuradas, objetivos claros y golpe al código saco compartido. Luego, estos agentes coordinaron un código muy específico para crear un compilador de C próspero y pragmático.

La orquestación fue otro pilar más. Para ello, Anthropic creó un arnés en torno a de los agentes: un entorno controlado donde podían escribir código, ejecutar pruebas, ver fallas, solucionar problemas e iterar. Por eso, cada vez que poco se rompía, los agentes no paraban. En su emplazamiento, depuraron. Cuando las pruebas fallaron, las revisaron. Este circuito de feedback continua actuó como un sistema de control de calidad incorporado.

Paralelismo igualmente marcó una gran diferencia. Mientras un agente trabajaba en el exploración de la razonamiento, otro podía encargarse de la reproducción de código y otros se centraban en la optimización o la corrección de errores. En emplazamiento de un progreso recto, el exposición se produjo simultáneamente en múltiples frentes, lo que aceleró drásticamente el proceso.

Esto no fue brujería. Era una autonomía estructurada.

Por qué esto es tan importante

Los compiladores son la saco misma de la informática. Cada aplicación que utilizas, cada sistema activo, cada servicio backend, en algún momento, pasa por un compilador. Construir uno se considera un trabajo serio de ingeniería de sistemas, una tarea para desarrolladores con las más altas habilidades. Requiere una comprensión profunda del diseño del jerigonza, la mandato de la memoria, las estrategias de optimización, las diferencias de edificación e innumerables casos extremos.

Entonces, cuando los agentes de IA construyen un compilador de C que funcione en semanas, indica un cambio masivo.

Hasta hace poco, las herramientas de codificación de IA (mira el top 10 aquí) eran asistentes. Como mayor, ayudaron a los desarrolladores a escribir funciones, sugirieron refactorizaciones o generaron textos habitual. Pero este tesina es la prueba positivo de que la IA puede manejar tareas de ingeniería de incorporación complejidad y múltiples etapas con iteraciones y pruebas estructuradas.

Pensándolo admisiblemente, esto puede cambiar el exposición de software tal como lo conocemos.

En emplazamiento de preguntar: «¿Puede la IA ayudarme a escribir esta función?» la nueva pregunta es: «¿Puede la IA coordinar y ejecutar la construcción de un sistema completo?» Y si los compiladores son posibles, las posibilidades ahora se extienden a las bases de datos, sistemas operativose incluso herramientas empresariales a gran escalera.

Lo que todavía no puede hacer (todavía)

Por muy impresionante que sea, el compilador Claude C no reemplazará a GCC o Clang en el corto plazo. ¿Por qué?

Para abrir, no es un compilador completamente adulto y apto para producción. Si admisiblemente compiló con éxito el kernel de Linux y pasó muchas pruebas de estrés, todavía no admite todos los casos extremos o variaciones de edificación que manejan los compiladores de décadas de caducidad. Algunas funciones de bajo nivel, como ciertos comportamientos x86 heredados, aún son limitadas. Incluso depende de herramientas existentes para partes de la condena de herramientas, como el ensamblaje y la vinculación.

Optimización del rendimiento es otra zona. Los compiladores establecidos han tenido abriles, o incluso décadas, de perfeccionamiento. De este modo exprimen toda la eficiencia. El compilador creado por Claude funciona, pero no necesariamente está optimizado a ese nivel.

Pero está admisiblemente.

El objetivo de la prueba de Anthropic no es la perfección. La cuestión era comprobar si era posible. Lo que estamos viendo aquí son sistemas autónomos en etapa original que ya manejan tareas de infraestructura profundamente técnicas. Si esta es la traducción uno, sólo podemos imaginar lo que puede hacer la traducción cinco.

Y ahí es donde las cosas se ponen interesantes.

¿Qué viene luego?

En sus notas finales interiormente del blogNicholas Carlini, autor del cuestionario e investigador del equipo Safeguards de Anthropic, comparte que si admisiblemente el cuestionario y sus resultados lo entusiasman, igualmente lo hacen observar «inquieto». Destaca cómo el uso de la IA para el exposición hasta ahora seguía un procedimiento global: un adjudicatario define una tarea, un LLM la completa y regresa por una respuesta.

El exposición completamente autónomo de los agentes de Claude cambia eso.

Piénselo de esta modo: la verdadera historia aquí no es solo que la IA construyó un compilador. Es que la IA gestionó un tesina de ingeniería difícil y de espacioso plazo con estructura, iteración y coordinación. Y el resultado fue un compilador de C sólido y pragmático.

Hoy es un compilador de C. Mañana, podrían ser sistemas backend completos, infraestructura distribuida, motores de simulación o lenguajes de dominios específicos. Una vez que se demuestra que los agentes pueden colaborar, probarse a sí mismos, solucionar fallas y seguir progresando sin supervisión humana constante, el resonancia se expande rápidamente y, me atrevo a sostener, infinitamente.

Carlini destaca aquí una amenaza positivo. Dice que es “obvio ver producirse las pruebas y contraer que el trabajo está hecho” cuando estos sistemas autónomos están en funcionamiento. Pero este rara vez es el caso, y la mayoría de las veces hay vulnerabilidades en dichos sistemas que deben ser verificadas por humanos antaño de poner en funcionamiento cualquier software de este tipo.

Entonces, si admisiblemente el cuestionario muestra un horizonte completamente nuevo de posibilidades, tendremos que acercarse con cuidado a la hora de ponerlo en actos en el futuro.

Conclusión

Para los desarrolladores, debo sostener esto: no piensen en este exposición como si se hubiera terminado el colección. Simplemente significa que su papel como desarrollador ahora evoluciona. En emplazamiento de escribir cada radio, puede diseñar cada vez más el sistema, puntualizar restricciones, crear herramientas de evaluación y supervisar equipos de agentes. Más importante aún, definitivamente tendrá que demostrar dichos sistemas en indagación de vulnerabilidades. El compilador Claude C, construido por sus agentes, nos muestra un avance de ese futuro.

La IA ya no sólo ayuda a escribir código. Está empezando a construir sistemas. Y esa es una cinta completamente diferente.

Estratega de contenido técnico y comunicador con una plazo de experiencia en creación y distribución de contenido en medios nacionales, el Gobierno de la India y plataformas privadas.

Inicie sesión para continuar leyendo y disfrutar de contenido seleccionado por expertos.

Etiquetado acaban, agentes, Claude, compilador, completamente, crear, funcional, los