Athrun Data Intelligence


Los almacenes de datos tradicionales son lentos, costosos y están encerrados detrás de sistemas propietarios. Exigen ajustes constantes y crean fricción para los equipos de investigación que necesitan velocidad y escalera, y ralentizan las decisiones en los equipos de finanzas, operaciones y productos. Databricks SQL (DBSQL) elimina estos límites. Es cinco veces más rápido en promedio, se ejecuta sin servidor y sigue estándares abiertos. Esta inteligencia de rendimiento predeterminada no está bloqueada detrás de niveles premium.

Más del 60% de las empresas Fortune 500 utilizan DBSQL para investigación y BI en la plataforma Data Intelligence de Databricks.

En 2025, DBSQL continuó brindando funcionalidades que mejoraron el rendimiento, la inteligencia sintético, la trámite de costos y las capacidades de SQL campechano. Este sumario destaca las actualizaciones que tuvieron el decano impacto para los equipos de datos este año.

Rendimiento que mejoría automáticamente

Consultas más rápidas sin ajustes

Desde 2022, DBSQL Serverless ha ofrecido una mejoría promedio de rendimiento 5 veces decano. Los paneles que antiguamente tardaban 10 segundos ahora se cargan en aproximadamente 2 segundos, sin requisito de oficina de índices ni ajuste manual.

En 2025, el rendimiento volvió a mejorar:

mejoras de rendimiento para DBSQL

Oportuno a que Databricks se podio en la plataforma de inteligencia de datos, esta inteligencia está arreglado para todos los clientes de forma predeterminada, no bloqueada detrás de niveles premium ni de las ofertas de decano precio.

Mejor visibilidad con Query Profile

Para ayudar a los equipos a comprender los patrones de desempeño, el instinto de perfil de consulta actualizada ahora incluye:

  • Un sumario visual de métricas de ojeada y escritura.
  • Un panel de «operadores principales» para identificar partes costosas de una consulta
  • Navegación más clara a través del manifiesto de ejecución.
  • Filtros para centrarse en métricas específicas

Mejoras en la experiencia de usuario del perfil de consulta.

Esto ayuda a los equipos a diagnosticar paneles lentos y modelos complejos más rápidamente, sin subordinarse de conjeturas.

IA integrada directamente en los flujos de trabajo SQL

La IA es ahora parte del investigación periódico. En 2025, DBSQL introdujo funciones nativas de IA para que los analistas puedan utilizar modelos de idioma grandes directamente en SQL. Algunas capacidades nuevas incluyen:

  • ai_query para resumir, clasificar, extraer y analizar sentimientos
  • ai_parse_documentactualmente en traducción beta, convierte archivos PDF y otros documentos no estructurados en tablas

Estas funciones se ejecutan en modelos hospedados en Databricks, como Meta Ardor y OpenAI GPT OSS, o en modelos personalizados que usted proporcione. Están optimizados para subir y son hasta 3 veces más rápidos que los enfoques alternativos.

Los equipos ahora pueden resumir tickets de soporte, extraer campos de contratos o analizar los comentarios de los clientes directamente internamente de las consultas de informes. Los analistas permanecen en SQL. Los flujos de trabajo se mueven más rápido. No más cambios de herramientas o codificación en Python.

Rendimiento de la IA

Dirección automatizada del rendimiento con optimización predictiva

A medida que los datos crecen y las cargas de trabajo cambian, el rendimiento suele degradarse con el tiempo. La optimización predictiva aborda este problema directamente.

En 2025, Dirección cibernética de estadísticas estuvo arreglado de forma generalizada. Elimina la requisito de ejecutar comandos ANALIZAR o cuidar trabajos de optimización manualmente.

Ahora, optimizaciones predictivas automáticamente:

  • Recopila estadísticas de optimización a posteriori de cargas de datos.
  • Selecciona índices de omisión de datos
  • Restablecimiento continuamente los planes de ejecución a lo holgado del tiempo.

Rendimiento de estadísticas automatizadas con DBSQL

Esto reduce los gastos operativos y evita la variación graduado del rendimiento con la que luchan muchos almacenes.

Funciones de Open SQL que simplifican las migraciones

Para muchos clientes, los procedimientos almacenados, las transacciones y las construcciones SQL patentadas son la parte más difícil de dejar los almacenes heredados. Sin requisa, muchas empresas quieren portar desde sistemas heredados como Oracle, Teradata y SQL Server por razones de TCO y de innovación. DBSQL continuó su inversión en funciones SQL abiertas y compatibles con ANSI para aminorar el esfuerzo de migración y aumentar la portabilidad.

Las nuevas capacidades incluyen:

  • Procedimientos almacenados (Horizonte previa pública) con gobernanza de Unity Catalog
  • Secuencias de comandos SQL (Acondicionado de forma normal) para bucles y condicionales en SQL
  • CTE recursivos (Acondicionado con carácter normal) para consultas jerárquicas
  • colaciones (Horizonte previa pública) para clasificación y comparación según el idioma
  • Mesas Temporales (Horizonte previa pública para todos los clientes en enero) para eliminar la carga de cuidar tablas intermedias o rastrear datos residuales

Estas funciones siguen estándares SQL abiertos y están disponibles en Apache Spark. Facilitan las migraciones y reducen la dependencia de construcciones propietarias.

DBSQL incluso agregó SQL espacial con tipos de geometría y geodesía. Más de 80 funciones como ST_Distance y ST_Contains admiten investigación geoespaciales a gran escalera directamente en SQL.

Dirección de costos para cargas de trabajo a gran escalera

A medida que crece la prohijamiento de SQL, los equipos luchan por explicar el aumento del pago en almacenes, paneles y herramientas. DBSQL introdujo nuevas herramientas que ayudan a los equipos a monitorear y controlar el pago a nivel de almacén, panel y legatario.

Las actualizaciones secreto incluyen:

  • Panel de uso de la cuenta para identificar costos crecientes
  • Etiquetas y Presupuestos para realizar un seguimiento del pago por equipo
  • Tablas del sistema para un investigación detallado del nivel de consulta
  • Panel de control de costos granular y Vistas Materializadas (Horizonte previa privada) para alertas y seguimiento de los generadores de costos

Estas funciones facilitan la comprensión de qué consultas, paneles o herramientas impulsan el consumo.

Monitoreo de almacén y control de entrada

A medida que más equipos dependen de DBSQL, los administradores deben monitorear la concurrencia y el estado del almacén sin otorgar privilegios excesivos a los usuarios. DBSQL incluso agregó nuevas capacidades de gobernanza y observabilidad:

  • Recuento de consultas completadas (GA) para mostrar cuántas consultas finalizan en un período de tiempo, lo que ayuda a identificar patrones de concurrencia
  • PUEDE VER permisos para que los administradores puedan otorgar entrada de solo ojeada al monitoreo sin otorgar derechos de ejecución

gráfico de recuento de consultas completadas

Estas actualizaciones facilitan la ejecución de investigación seguros y confiables a escalera.

El resultado

DBSQL siguió mejorando en 2025. Ahora ofrece un rendimiento sin servidor más rápido, inteligencia sintético integrada, estándares SQL abiertos para migraciones más sencillas y una visibilidad más clara de los costos y el comportamiento de las cargas de trabajo. Oportuno a que DBSQL se ejecuta en la casa Lakehouse de Databricks, el investigación, la ingeniería de datos y la inteligencia sintético operan sobre una pulvínulo única y gobernada. El rendimiento mejoría automáticamente y los equipos dedican menos tiempo a ajustar sistemas o mandar transferencias.

DBSQL sigue siendo un almacén campechano, inteligente y rentable diseñado para las realidades del investigación impulsado por IA, y 2025 lo impulsó nuevamente.

¿Qué sigue?

Databricks SQL continúa liderando el mercado como un almacén preparado para operaciones nativo de IA que elimina la complejidad que enfrentan los clientes en los sistemas heredados. Las próximas características incluyen:

  • Transacciones de múltiples estados, que brindan a los equipos actualizaciones atómicas en múltiples tablas y eliminan la frágil método de reversión personalizada que muchos clientes crearon ellos mismos. Las transacciones de varios estados incluso serán beneficiosas para portar a Databricks.
  • Alertas V2, que extiende la confiabilidad a las operaciones diarias, reemplazando un sistema de alerta difícil con un maniquí más simple y escalable diseñado para miles de controles programados y patrones operativos de nivel empresarial.
  • Más capacidades de IApara que los analistas puedan aplicar LLM y procesar documentos sin dejar sus flujos de trabajo, cerrando la brecha entre la método del almacén y la inteligencia.

Juntas, estas capacidades mueven a DBSQL alrededor de un almacén unificado e inteligente que maneja la método transaccional central, el monitoreo activo y el investigación asistido por IA en un solo circunstancia.

Más detalles sobre las innovaciones

Esperamos que disfrute de esta gran cantidad de innovaciones en Databricks SQL. Siempre puedes comprobar esto. Publicación de novedades de los tres meses anteriores. A continuación se muestra un inventario completo de los lanzamientos sobre los que hemos escrito blogs durante el postrero trimestre:

Empezando

¿Despierto para variar su almacén de datos? ¡El mejor almacén de datos es una casa en un albufera! Para obtener más información sobre Databricks SQL, realice una reconvención por el producto. Reconocimiento databricks.com/sql para explorar Databricks SQL y ver cómo las organizaciones de todo el mundo están revolucionando sus plataformas de datos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *