Investigadores de Meta y Harvard presentan el Agente de Código Confucio (CCA): un agente de ingeniería de software que puede intervenir en bases de código a gran escalera

¿Hasta dónde puede datar un maniquí de jerga de tamaño mediano si la verdadera innovación pasa de la columna vertebral al andamio del agente y la pila de herramientas? Los investigadores de Meta y Harvard han atrevido Confucius Code Agent, un ingeniero de software de inteligencia sintético de código campechano construido sobre el SDK de […]
Los investigadores de DeepSeek aplican un operación de normalización de matrices de 1967 para solucionar la inestabilidad en las hiperconexiones

Los investigadores de DeepSeek están intentando resolver un problema preciso en el entrenamiento de modelos de verbo grandes. Las conexiones residuales hicieron que las redes muy profundas fueran entrenables, las hiperconexiones ampliaron ese flujo residual y el entrenamiento se volvió inestable a escalera. El nuevo método mHC, Manifold Constrained Hyper Connections, mantiene la topología más […]
Una “caja de arena científica” permite a los investigadores explorar la crecimiento de los sistemas de visión | Parte del MIT

¿Por qué los humanos desarrollaron los fanales que tenemos hoy? Si perfectamente los científicos no pueden retroceder en el tiempo para estudiar las presiones ambientales que dieron forma a la crecimiento de los diversos sistemas de visión que existen en la naturaleza, un nuevo situación computacional desarrollado por investigadores del MIT les permite explorar esta […]
Investigadores del MIT “hacen que los objetos existan” utilizando inteligencia químico y robótica | Telediario del MIT

La IA generativa y la robótica nos acercan cada vez más al día en que podamos pedir un objeto y crearlo en unos minutos. De hecho, los investigadores del MIT han desarrollado un sistema de conversión de voz a verdad, un flujo de trabajo impulsado por inteligencia químico que les permite proporcionar información a un […]
Los investigadores descubren una deficiencia que hace que los LLM sean menos confiables | Telediario del MIT

Según un estudio del MIT, los modelos de lenguajes grandes (LLM) a veces aprenden las lecciones equivocadas. En emplazamiento de contestar una consulta basada en el conocimiento del dominio, un LLM podría contestar aprovechando los patrones gramaticales que aprendió durante la capacitación. Esto puede provocar que un maniquí falle inesperadamente cuando se implementa en nuevas […]
Investigadores de OpenAI entrenan transformadores de poco peso para exponer circuitos interpretables

Si las redes neuronales ahora toman decisiones en todas partes, desde editores de código hasta sistemas de seguridad, ¿cómo podemos ver los circuitos específicos internos que impulsan cada comportamiento? OpenAI ha introducido una nueva interpretabilidad mecanística estudio de investigación que entrena modelos de jerga para que utilicen cableado interno escaso, de modo que el comportamiento […]
Investigadores del MIT proponen un nuevo maniquí de software modular y inteligible | Telediario del MIT

Codificar con modelos de lenguajes grandes (LLM) es muy prometedor, pero igualmente expone algunas fallas de larga data en el software: código confuso, difícil de cambiar de forma segura y, a menudo, opaco sobre lo que efectivamente sucede bajo el capó. Los investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Fabricado (CSAIL) del […]
Los investigadores del MIT desarrollan una utensilio de IA para mejorar la selección de la tensión de la vacuna contra la catarro | MIT News

Cada año, los expertos en vigor globales se enfrentan a una audacia de detención aventura: ¿qué cepas de influenza deberían entrar en la próxima vacuna estacional? La disyuntiva debe hacerse con meses de anticipación, mucho antiguamente de que comience la temporada de catarro, y a menudo puede parecer una carrera contra el temporalizador. Si las […]
Los investigadores vislumbran el funcionamiento interno de los modelos de estilo de proteínas | MIT News

En los últimos abriles, los modelos que pueden predecir la estructura o función de las proteínas se han utilizado ampliamente para una variedad de aplicaciones biológicas, como identificar objetivos fármacos y diseñar nuevos anticuerpos terapéuticos. Estos modelos, que se basan en modelos de idiomas grandes (LLM), pueden hacer predicciones muy precisas de la idoneidad de […]
Utilizando la IA generativa, los investigadores diseñan compuestos que pueden matar bacterias resistentes a las drogas | MIT News

Con la ayuda de la inteligencia industrial, los investigadores del MIT han diseñado antibióticos nuevos que pueden combatir dos infecciones difíciles de tratar: Neisseria Gonorrhoeae y resistente a múltiples fármacos Staphylococcus aureus (MRSA). Utilizando algoritmos de IA generativos, el equipo de investigación diseñó más de 36 millones de compuestos posibles y los seleccionó computacionalmente para […]