en nuestro aludido blogpresentamos Lakebase, la bloque de colchoneta de datos de tercera coexistentes que separa fundamentalmente el almacenamiento y la computación. En este blog, exploramos una consecuencia crítica de este cambio: ¿cómo están cambiando los agentes de IA el ciclo de vida del incremento de software y qué tipo de bases de datos necesitan en realidad los agentes de IA?
El ciclo de vida del incremento de software está experimentando una transformación radical. Los LLM han permitido una nueva coexistentes de marcos agentes que pueden analizar requisitos, escribir código, ejecutar pruebas, implementar servicios y refinar aplicaciones de forma iterativa, todo a una velocidad récord. Como resultado, el costo insignificante de crear e implementar aplicaciones está cayendo en picado.
Aunque todavía estamos en las primeras etapas del incremento de software agente, hemos observado constantemente, tanto interiormente de Databricks como entre nuestra colchoneta de clientes, que el ritmo de experimentación se está acelerando y el gran prominencia de aplicaciones que se están creando se está disparando. A medida que el mundo pasa del software artesanal al incremento de software agente, identificamos tres tendencias emergentes que redefinirán conjuntamente los requisitos de los sistemas de bases de datos modernos:
- El incremento de software pasará de un proceso seguido y calmoso convencional a un proceso evolutivo rápido.
- El software será más valioso en común, pero el valía de cada aplicación individual se desplomará a medida que disminuya el costo insignificante de desarrollar software. Esto significa que necesitamos una infraestructura que pueda soportar el incremento de software a un costo insignificante pequeño. Fundamentalmente, la bloque además debe tener en cuenta el hecho de que cualquiera de estas bases de datos pequeñas y efímeras puede convertirse en un sistema de producción con mucho tráfico, lo que hace que la capacidad de soportar un crecimiento elástico y fluido sea un requisito arquitectónico fundamental.
- Los ecosistemas abiertos se convertirán en un requisito eficaz exacto, no sólo en una preferencia.
A continuación se ofrece una observación más profunda a cada una de estas tendencias y cómo Lakebase tiene una bloque única para respaldarlas.
Progreso rápido de software evolutivo
Correcto a que una gran parte del ciclo de vida del incremento de software era históricamente muy costosa (escribir código, pruebas, operaciones), construir y negociar una nueva aplicación requería una importante inversión en ingeniería. En consecuencia, el incremento de software tradicional se optimizó para una planificación cuidadosa y un proceso relativamente seguido.
Los agentes cambian esta dinámica. Las aplicaciones ahora se pueden gestar, modificar y retornar a implementar en minutos. En sitio de construir un sistema cuidadosamente diseñado, los desarrolladores y agentes exploran cada vez más grandes espacios de posibles implementaciones. El incremento comienza a parecerse a un operación evolutivo:
- Producir una lectura original de una aplicación.
- Cree rápidamente variantes con diferentes esquemas, indicaciones o método.
- Evaluar los resultados.
- Continuar el incremento desde las versiones más exitosas.

Dependiendo de la complejidad, cada iteración evolutiva puede durar desde segundos hasta horas, lo que es entre 100 y 1000 veces más rápido que los ciclos de incremento previos al LLM. De hecho, nuestra telemetría de los entornos de producción de Lakebase muestra que, en promedio, cada tesina de colchoneta de datos tiene ~10 ramas y algunas bases de datos con ramas anidadas que alcanzan profundidades de más de 500 iteraciones (es aseverar, 500 iteraciones en la cambio).

La infraestructura de código como Git ya admite muy perfectamente este flujo de trabajo. Los desarrolladores o agentes pueden crear una rama del código colchoneta con git checkout -b instantáneamente. Sin bloqueo, la infraestructura de bases de datos heredada no ofrece una forma rápida y rentable de bifurcar el estado de la colchoneta de datos.
Lakebase está diseñado para alojar este flujo de trabajo evolutivo agente de forma nativa. Los agentes pueden crear una rama de una colchoneta de datos de producción o prueba al instante y con un costo casi torpe. Correcto a que Lakebase utiliza un mecanismo de ramificación de copia en escritura de metadatos O(1) en la capa de almacenamiento, no se requiere una costosa copia de datos físicos. Simplemente bifurca los datos cercano con el código y solo paga por el cálculo de la colchoneta de datos durante la duración del investigación.
Sensibilidad al costo
Como se mencionó anteriormente, aunque el software será más valioso en común, el valía de cada aplicación individual se desplomará a medida que disminuya el costo insignificante de desarrollar software. Muchos servicios generados por agentes son pequeñas herramientas internas, prototipos o flujos de trabajo limitados. Es posible que solo se ejecuten ocasionalmente o que atiendan cargas de trabajo en gran medida ráfagas y basadas en eventos.
En este mundo, necesitamos una infraestructura que pueda soportar el incremento de nuevo software a un costo insignificante/incremental pequeño. Cualquier colchoneta de datos que imponga cientos de dólares al mes como precio pequeño de relato es inverosímil de razonar si la aplicación en sí proporciona un valía escaso o real. Nuestros datos muestran que para aproximadamente la parte de estas aplicaciones agentes, la vida útil del cálculo de la colchoneta de datos es inferior a 10 segundos.

Las bases de datos tradicionales se diseñaron como componentes de infraestructura siempre activos con aprovisionamiento fijo y gastos operativos fijos. Ese maniquí se adapta a aplicaciones grandes y estables, pero error económicamente cuando las aplicaciones son numerosas, efímeras y de corta duración.
La naturaleza elástica y sin servidor de Lakebase aborda directamente este imperativo de costos. Al desacoplar completamente las instancias informáticas de la capa de almacenamiento, Lakebase puede prosperar automáticamente el cálculo de la colchoneta de datos en función de la carga en menos de un segundo. Fundamentalmente, además reduce la colchoneta de datos a cero cuando no se utiliza, eliminando por completo el costo pequeño y logrando costos inactivos casi nulos.
Creciendo de pequeño a vasto
La naturaleza del incremento impulsado por agentes significa que constantemente se crea un enorme prominencia de bases de datos pequeñas y efímeras para pruebas, creación de prototipos y flujos de trabajo limitados. El desafío arquitectónico crucial es que los desarrolladores y los propios agentes no pueden predecir cuál de estas aplicaciones incipientes despegará repentinamente y requerirá una escalera de producción masiva.
Por lo tanto, la bloque de la colchoneta de datos debe soportar inherentemente crecimiento fluido y elástico desde una instancia pequeña y de bajo costo hasta un sistema de producción a gran escalera con mucho tráfico. Esta transición debe ocurrir sin requerir ningún cambio manual de plataforma, aprovisionamiento o pasos complejos de migración por parte del usufructuario. La bloque por sí sola debería manejar la cambio, lo que hace que la capacidad de prosperar instantáneamente desde una capacidad casi nula a una capacidad masiva sea un requisito fundamental para un mundo donde la exploración agencial es el maniquí de incremento predeterminado.
Ecosistemas de código franco
Los sistemas agentes obtienen sus capacidades de LLM capacitados en amplios corpus de código fuente y documentación técnica disponibles públicamente. Este sesgo de capacitación les brinda una compañerismo operativa profunda con los ecosistemas de código franco, las API y la semántica de errores.
Las bases de datos como Postgres están profundamente arraigadas en el mundo del código franco. Sus interfaces, comportamientos y códigos de error aparecen en todos los datos de entrenamiento de los que aprenden los modelos modernos. Como resultado, los agentes pueden gestar consultas, esquemas e integraciones para ellos de guisa mucho más confiable. Las bases de datos patentadas enfrentan una desventaja inherente porque los agentes simplemente carecen del contexto suficiente para operarlas de guisa efectiva.
Para el incremento impulsado por agentes, la tolerancia ya no es sólo una preferencia filosófica: es un requisito práctico para una automatización confiable. Pero este requisito debe dilatarse más allá de la interfaz de consulta; debe resistir a la propia capa de almacenamiento. Si perfectamente las bases de datos en la nubarrón de segunda coexistentes pueden utilizar motores de ejecución de código franco, aún bloquean sus datos en formatos de almacenamiento internos propietarios.
Lakebase se plinto en Postgres, pero lleva la tolerancia un paso más allá. Almacena datos en formatos de página Postgres abiertos en serie directamente en el almacenamiento de objetos en la nubarrón (el laguna de datos). Esto permite que los agentes, los motores analíticos externos y las nuevas herramientas interactúen con los datos de forma nativa, sin estar nunca obstaculizados por un único motor informático propietario.
Bases de datos para la Era Agentica
El cambio no es hipotético: ya está en marcha. En el servicio Lakebase de Databricks, los agentes de IA ahora crean aproximadamente 4 veces más bases de datos que los usuarios humanos.

Este punto de datos captura las tendencias descritas anteriormente en un solo expresivo. Los agentes son creadores prolíficos de entornos de bases de datos: crean instancias para experimentos, las bifurcan para realizar pruebas y las descartan cuando terminan. La infraestructura que atiende estas cargas de trabajo debe respaldar este patrón económica y operativamente.
Propiedades como la rentabilidad, la agilidad y la tolerancia siempre han sido deseables. Pero el auge del incremento de software agente los ha convertido de poco deseable en requisitos fundamentales. Las bases de datos que imponen costos mínimos elevados, carecen de primitivos de ramificación o bloquean datos en formatos propietarios estarán cada vez más desfasados de la forma en que se construye el software.
Este es precisamente el espacio de diseño de Lakebase. Fue construido para las realidades económicas y técnicas específicas que crea el incremento impulsado por la IA: ramificación evolutiva a costo cero, verdadera elasticidad de escalera a cero, almacenamiento franco de Postgres en el laguna y operaciones autogestionadas. A medida que los agentes participan cada vez más en la creación y cambio del software, las bases de datos más adecuadas para este nuevo mundo son aquellas diseñadas para la experimentación, la tolerancia y la elasticidad desde cero.