Modernización de holganza de Lakebase | Blog de ladrillos de datos

Desde que anunciamos la interpretación preliminar pública de Lakebase en el verano, miles de clientes de Databricks han estado creando aplicaciones inteligentes de datos sobre Lakebase, usándolas para potenciar el servicio de datos de aplicaciones, almacenes de funciones y memoria de agentes, mientras mantienen esos datos estrechamente alineados con los flujos de trabajo de estudio y estudios inevitable.

A medida que nos acercamos al final del año, estamos encantados de propalar un nuevo e interesante conjunto de mejoras:

Escalado inevitable que ajusta dinámicamente el cálculo en función de la carga
Ascender a cerolo que permite que la computación se apague cuando esté inactiva y se reanude automáticamente en cientos de milisegundos.
Aprovisionamiento instantáneo para crear nuevas instancias de bases de datos en segundos
Ramificación instantánea de bases de datosque permite flujos de trabajo similares a git con entornos aislados de copia en escritura para mejora, pruebas y puesta en secuencia.
Copias de seguridad automatizadas y recuperación en un momento donado para una restauración rápida y operaciones más seguras
Postgres 17cercano con el soporte continuo de Postgres 16
Viejo capacidad de almacenamiento hasta 8TB para cargas de trabajo de producción más grandes
Una nueva interfaz de afortunado de Lakebase que simplifica los flujos de trabajo comunes

Estas características representan un hito importante en la definición de la categoría lakebase, una edificación de pulvínulo de datos sin servidor que separa el almacenamiento OLTP de la computación. Son posibles gracias a la combinación de Postgres sin servidor y la tecnología de almacenamiento de nuestra adquisición de Neon con la infraestructura de múltiples nubes de nivel empresarial de Databricks.

Escalado inevitable para cargas de trabajo de aplicaciones dinámicas

Las cargas de trabajo de aplicaciones modernas rara vez siguen patrones de tráfico predecibles. La actividad del afortunado fluctúa a lo dadivoso del día, los trabajos en segundo plano generan ráfagas de escrituras y los sistemas basados en agentes pueden originar picos repentinos en la simultaneidad. Las bases de datos operativas tradicionales requieren que los equipos planifiquen manualmente el uso mayor y ajusten la capacidad, lo que a menudo resulta en un aprovisionamiento excesivo y una complejidad innecesaria.

Poliedro que Lakebase se base en una edificación que separa la capa de almacenamiento de la capa de computación y permite el escalamiento independiente de ambas, ahora estamos lanzando la capacidad de escalado inevitable de computación que puede ajustar la computación dinámicamente según la demanda de carga de trabajo activa. Cuando el tráfico aumenta, la computación aumenta para suministrar el rendimiento. Cuando la actividad se ralentiza, la computación se reduce. Las bases de datos inactivas se suspenden a posteriori de un breve período de inactividad y se reanudan rápidamente cuando llegan nuevas consultas. La computación se ajusta dinámicamente para satisfacer la demanda de la carga de trabajo en los entornos de producción y mejora.

El resultado es menos tiempo dedicado a resolver la capacidad y más tiempo centrado en el comportamiento de las aplicaciones.

Inicio rápido y aprovisionamiento instantáneo

Crear una nueva pulvínulo de datos o reanudar una inactiva no debería detener el mejora. Con esta modernización, las nuevas bases de datos de Lakebase se aprovisionan en segundos y las instancias suspendidas se reanudan rápidamente cuando regresa el tráfico. Esto facilita la puesta en marcha de entornos bajo demanda, la iteración durante el mejora y el soporte de flujos de trabajo donde las bases de datos se crean y descartan con frecuencia.

Para los equipos que crean y prueban aplicaciones, un inicio más rápido reduce la fricción y mantiene los ciclos de iteración ajustados, especialmente cuando se combina con ramificaciones y escalado inevitable.

Ramificación para una iteración más rápida y segura

Crear y desarrollar aplicaciones de producción significa un cambio constante. Los equipos validan actualizaciones de esquemas, depuran problemas complejos y ejecutan canalizaciones de CI que dependen de vistas consistentes de datos. La clonación de bases de datos tradicionales tiene dificultades para mantenerse al día porque las copias completas son lentas, requieren mucho almacenamiento y son operativamente riesgosas.

El servicio de almacenamiento Lakebase implementa divergencia de copia en escritura y ahora exponemos esta funcionalidad como divergencia de pulvínulo de datos a nuestros clientes. Las sucursales son entornos instantáneos de copia en escritura que permanecen aislados mientras comparten almacenamiento subyacente. Esto facilita la puesta en marcha de entornos de mejora, pruebas y preparación en segundos e iterar sobre la dialéctica de la aplicación sin tocar los sistemas de producción.

En la actos, la ramificación elimina la fricción en el ciclo de vida de mejora y ayuda a los equipos a avanzar más rápido y con confianza. (¡Pero todavía no se recomienda realizar pruebas en producción!)

Copias de seguridad automatizadas y recuperación en un momento donado

No todos los problemas de datos son una interrupción. A veces, el problema es más sutil: un error que silenciosamente escribe datos incorrectos a lo dadivoso del tiempo, un cambio de esquema que se comporta de forma diferente a lo esperado o un script de relleno que toca más filas de las previstas. Estos problemas a menudo pasan desapercibidos hasta que los equipos necesitan encargar en datos históricos para realizar estudio, informes o el comportamiento de las aplicaciones posteriores.

En entornos tradicionales, recuperarse de escenarios como este puede resultar doloroso. Los equipos se ven obligados a recobrar el historial a mano, reproducir registros o implementar sistemas temporales solo para recuperar una interpretación buena y conocida de sus datos. Ese proceso requiere mucho tiempo, es propenso a errores y, a menudo, requiere una profunda experiencia en bases de datos.

Lakebase ahora hace que estas situaciones sean mucho más fáciles de manejar. Con copias de seguridad automatizadas y recuperación en un momento donado, los equipos pueden restaurar una pulvínulo de datos a un momento exacto en cuestión de segundos. Esto permite a los equipos de aplicaciones recuperarse rápidamente de problemas de datos causados por errores operativos o de aplicaciones, sin indigencia de reproducción manual ni flujos de trabajo de recuperación complejos.

Aceptar cargas de trabajo de producción más grandes

Más allá de la recuperación, los sistemas de producción además necesitan espacio para crecer a medida que aumentan los volúmenes de datos. Con esta modernización, Lakebase aumenta su capacidad de almacenamiento admitida hasta 8 TB, cuatro veces más que los límites anteriores, lo que lo hace adecuado para cargas de trabajo de aplicaciones más grandes y exigentes.

Compatibilidad ampliada con la interpretación de Postgres

Lakebase ahora además es compatible con Postgres 17, encima de soporte continuo para Postgres 16. Esto brinda a los equipos paso a las últimas mejoras de Postgres y al mismo tiempo mantiene la compatibilidad con las aplicaciones existentes.

Juntas, estas actualizaciones hacen de Lakebase una pulvínulo más sólida para ejecutar cargas de trabajo operativas de nivel de producción en Databricks.

Flujos de trabajo más simples con una nueva interfaz de afortunado de Lakebase

Lakebase ahora incluye una nueva interfaz de afortunado renovada diseñada para simplificar los flujos de trabajo cotidianos. Crear bases de datos, ordenar sucursales y comprender el comportamiento de la capacidad es más sencillo, con mejores títulos predeterminados y un aprovisionamiento más rápido. Se puede entrar a esta nueva interfaz de afortunado en el ícono del Iniciador de aplicaciones para la nueva propuesta de escalado inevitable de Lakebase. La propuesta aprovisionada inicial de Lakebase aparecerá en la interfaz de afortunado en las próximas semanas.

Acogida

Como se indicó anteriormente, miles de clientes de Databricks han estado creando aplicaciones sobre Lakebase. Oportuno a que Lakebase está completamente integrado en la plataforma Data Intelligence de Databricks, los datos operativos residen en la misma pulvínulo que respalda el estudio, la inteligencia fabricado, las aplicaciones y los flujos de trabajo agentes. Unity Catalog proporciona gobernanza, control de paso, auditoría y pelaje consistentes. Las aplicaciones de Databricks y los marcos de agentes pueden utilizar Lakebase para integrar el estado en tiempo vivo con el contexto histórico, eliminando la indigencia de ETL o replicación.

Para los profesionales, esto crea un entorno unificado donde los datos operativos y analíticos permanecen alineados, sin la indigencia de hacer malabarismos con múltiples sistemas para suministrar las aplicaciones conectadas a la inteligencia.

Citando a dos de los primeros usuarios:

¿Qué sigue para Lakebase?

Estas nuevas funciones están disponibles hoy en AWS us-east-1, us-west-2, eu-west-1 y se implementarán gradualmente en más regiones en las próximas semanas. Mira el documentación del producto para obtener más información y probar las últimas capacidades.

Esta modernización representa un importante paso delante para Lakebase. Pero no nos quedamos quietos. ¡Espere muchas actualizaciones interesantes a posteriori de las holganza del próximo año!

¡Felices holganza de parte del equipo de Lakebase!

Etiquetado Actualización, Blog, datos, ladrillos, LakeBase, vacaciones