Athrun Data Intelligence

Optimizar el tiempo de ejecución de Amazon EMR para Apache Spark con EMR S3A

Con el tiempo de ejecución de Amazon EMR 7.10, Amazon EMR ha introducido EMR S3A, una implementación mejorada del conector del sistema de archivos S3A de código rajado. Este conector mejorado ahora se establece automáticamente como el conector del sistema de archivos S3 predeterminado para las opciones de implementación de Amazon EMR, incluidas Amazon EMR […]

Mejorar la disponibilidad y la latencia de la culo de Amazon EMR utilizando ZGC generacional

En Amazon EMRescuchamos constantemente los desafíos de nuestros clientes con la ejecución a gran escalera Amazon EMR HBase despliegues. Un punto de dolor consistente que mantuvo emergiendo es un comportamiento de aplicación impredecible oportuno a la cosecha de basura (GC) se detiene en HBase. Los clientes que ejecutaban cargas de trabajo críticas en HBase estaban […]

Cómo FINRA estableció la observabilidad operativa en tiempo verdadero para cargas de trabajo de big data de Amazon EMR en Amazon EC2 con Prometheus y Grafana

Esta es una publicación invitada de FINRA (Autoridad Reguladora de la Industria Financiera). FINRA se dedica a proteger a los inversores y preservar la integridad del mercado de una forma que facilite mercados de hacienda vibrantes. FINRA realiza procesamiento de big data con grandes volúmenes de datos y cargas de trabajo con diferentes tamaños y […]