Athrun Data Intelligence

Desarrollar y probar AWS Glue 5.0 Jobs localmente utilizando un contenedor Docker

AWS Glue es un servicio de integración de datos sin servidor que le permite procesar e integrar datos que se realizan a través de diferentes fuentes de datos a escalera. AWS Glue 5.0, la última lectura de AWS Glue for Apache Spark Jobs, proporciona una experiencia de tiempo de ejecución Apache 3.5 optimizada para el […]

Paso a las mesas de iceberg de Amazon S3 desde Databricks utilizando el catálogo de REST de iceberg de Glue AWS en Amazon Sagemaker Lakehouse

Amazon Sagemaker Lakehouse Permite una plataforma Lakehouse unificada, abierta y segura en sus lagos y almacenes de datos existentes. Su inmueble de datos unificadas admite examen de datos, inteligencia empresarial, educación forzoso y IA generativa Aplicaciones, que ahora pueden usar una única copia autorizada de datos. Con Sagemaker Lakehouse, obtienes lo mejor de entreambos mundos: […]

Presentamos la automatización de AWS Glue Data Catalog para la colección de estadísticas de tablas para mejorar el rendimiento de las consultas en Amazon Redshift y Amazon Athena.

El Catálogo de datos de AWS Glue ahora automatiza la vivientes de estadísticas para nuevas tablas. Estas estadísticas están integradas con el optimizador basado en costos (CBO) de Espectro de desplazamiento al rojo de Amazon y Atenea amazónicalo que resulta en un mejor rendimiento de las consultas y posibles ahorros de costos. Las consultas sobre […]

El catálogo de datos de AWS Glue ahora admite la optimización del almacenamiento de las tablas Apache Iceberg

El Catálogo de datos de AWS Glue Ahora mejoramiento la optimización de tablas administradas de Apache Iceberg al eliminar automáticamente los archivos de datos que ya no son necesarios. Yuxtapuesto con la optimización automatizada de Glue Data Catalog compactación característica, estas optimizaciones de almacenamiento pueden ayudarle a acortar la sobrecarga de metadatos, controlar los costos […]