Construyendo Prometheus: cómo la agregación backend permite clústeres de IA a escalera de gigavatios

Compartimos detalles del papel que desempeña la agregación backend (BAG) en la construcción de clústeres de IA a escalera de gigavatios de Meta, como Prometeo. BAG nos permite conectar sin problemas miles de GPU en múltiples centros de datos y regiones. Nuestra implementación BAG conecta dos estructuras de red diferentes: Estructura de cronograma desagregado (DSF) […]
Cómo FINRA estableció la observabilidad operativa en tiempo verdadero para cargas de trabajo de big data de Amazon EMR en Amazon EC2 con Prometheus y Grafana

Esta es una publicación invitada de FINRA (Autoridad Reguladora de la Industria Financiera). FINRA se dedica a proteger a los inversores y preservar la integridad del mercado de una forma que facilite mercados de hacienda vibrantes. FINRA realiza procesamiento de big data con grandes volúmenes de datos y cargas de trabajo con diferentes tamaños y […]