Cómo bajar 30–50% el gasto en AWS sin romper producción
No es magia ni rightsizing genérico. Es el orden específico de palancas que aplicamos en clientes que pagan factura inflada por convención, no por necesidad.
La factura de AWS de la mayoría de empresas medianas en LATAM tiene un 30–50% de grasa pura. No es exageración. Es lo que vemos cuando entramos a hacer un análisis FinOps serio. Lo que sigue es el orden exacto que aplicamos — no porque sea moda, sino porque es el orden que evita romper producción.
Paso 1: visibilidad antes que acción
Sin tags consistentes (Environment, Owner, Project, CostCenter) no puedes asignar costos. Sin asignar costos no puedes negociar con áreas internas. Lo primero, durante una semana: parche masivo de tags + activar Cost Allocation Tags en Billing. Después, dashboards con costo por proyecto.
Paso 2: apagar lo que nadie usa
Snapshots huérfanos de EBS, IPs elásticas sin asignar, ambientes de QA corriendo 24/7 cuando solo se usan en horario laboral, RDS encendidos sin tráfico. Este es el más fácil y nadie lo hace — porque nadie quiere ser el que apaga algo y rompe a otro equipo. La regla simple: si lleva 30 días sin tráfico, se apaga con notificación previa.
Paso 3: Reserved Instances y Savings Plans, pero bien
La trampa: muchas empresas compran RIs por tres años en instancias específicas y se quedan amarradas a hardware que va a ser obsoleto. Recomendación: Compute Savings Plans (no EC2-specific), por un año, cubriendo el 60–70% del baseline. El resto on-demand para flexibilidad.
Paso 4: rightsizing con datos, no intuición
AWS Compute Optimizer y Trusted Advisor te dicen exactamente qué instancias están sobredimensionadas. Pero ojo: bajar de m5.2xlarge a m5.large necesita 7 días de observación bajo carga real, no un viernes a las cinco. Hazlo con maintenance windows y rollback automático.
Paso 5: Spot y autoscaling para cargas tolerantes
Workers de procesamiento, builds, jobs batch, training de ML — todo eso debería correr en Spot. Karpenter en Kubernetes lo automatiza con elegancia. Reducción típica: 60–80% en esa porción de la factura.
Paso 6: la conversación incómoda — arquitectura
A veces la factura está inflada porque la arquitectura está mal. Lambda invocándose en loop por evento mal filtrado, RDS sobredimensionado porque alguien activó Multi-AZ "por si acaso", egress de datos entre regiones porque servicios mal ubicados. Esto requiere refactor — pero el ROI es brutal.
Cómo te ayudamos en Athrun Data Intelligence
Auditoría FinOps inicial gratuita: en una llamada de 30 minutos te mostramos qué porcentaje de tu factura es probablemente recortable y por dónde empezar. Si encaja, lo ejecutamos por sprints con métricas semanales.
Fuentes
¿Esto te resuena? Hablemos.
Si lo que leíste describe un problema tuyo, agenda 30 minutos con nosotros. Sin compromiso. Te decimos si encajamos.
Solicita diagnóstico gratuito