Athrun Data Intelligence

Optimice la distribución de temas de Apache Kafka con Amazon MSK

Si administra Apache Kafka hoy, sabrá el esfuerzo que requiere establecer temas. Ya sea que utilice soluciones de infraestructura como código (IaC) o realice operaciones con clientes de distribución, configurar la distribución de temas requiere un tiempo valioso que podría dedicarse a crear aplicaciones de transmisión. Streaming administrado por Amazon para Apache Kafka (Amazon MSK) […]

Reducción de costos para cargas de trabajo de Apache Spark con mucha reproducción aleatoria con almacenamiento sin servidor para Amazon EMR Serverless

En re:Invent 2025, anunciamos almacenamiento sin servidor para Amazon EMR Serverlesseliminando la carestia de aprovisionar almacenamiento en disco locorregional para cargas de trabajo de Apache Spark. El almacenamiento sin servidor de Amazon EMR Serverless reduce los costos de procesamiento de datos hasta en un 20 % al mismo tiempo que ayuda a organizar fallas en […]

Anuncio de compatibilidad con Apache Iceberg v3 en Snowflake

El soporte de larga data de Snowflake para el tipo de datos transformación ahora se extiende a las tablas Iceberg con v3, que incluye soporte para lotes (COPIAR), microlote (tubo de cocaína) y transmisión (Transmisión de Snowpipe) canaliza directamente a las tablas Iceberg con subcolumnarización cibernética (“trituración”) para un rendimiento de recitación enormemente optimizado. […]

Una implementación de codificación para crear una canalización unificada de Apache Beam que demuestra el procesamiento por lotes y transmisiones con ventanas de tiempo de eventos mediante DirectRunner

En este tutorial, demostramos cómo construir un unificado Haz Apache canalización que funciona a la perfección tanto en modo por lotes como en modo secuencial utilizando DirectRunner. Generamos datos sintéticos que tienen en cuenta la hora del evento y aplicamos ventanas fijas con activadores y retrasos permitidos para demostrar cómo Apache Beam maneja consistentemente eventos […]

Presentamos AWS Glue 5.1 para Apache Spark

Pegamento AWS es un servicio de integración de datos escalable y sin servidor que simplifica el descubrimiento, la preparación, el movimiento y la integración de datos de múltiples fuentes. AWS anunció recientemente Glue 5.1, una nueva traducción de AWS Glue que acelera las cargas de trabajo de integración de datos en AWS. AWS Glue 5.1 […]