Implementamos arquitectura TIG on-prem (Telegraf + InfluxDB v2 + Grafana) para datos críticos bancarios: ingestión confiable, retención por costos y tableros accionables. Definimos SLI/SLO por servicio, alertas sin ruido y correlación con cambios para reducir MTTR y OPEX. Operación lista para auditoría, DR y gobierno de datos.
Alcance
- Modelado de KPIs/SLIs/SLOs por servicio y dominio (canales, pagos, core).
- Ingesta con Telegraf (SNMP, WMI, APIs, logs) y etiquetas para auditoría.
- Grafana: tableros operativos, de servicio y ejecutivos con drill-down.
- Alertas útiles (menos ruido) con ventanas y supresión + runbooks de respuesta.
- Retención por tiers en InfluxDB v2 y gobierno de costos.
Entregables
- Stack TIG on-prem en producción con tableros accionables.
- Catálogo de SLI/SLO y matriz de alertas alineadas a negocio.
- Playbook de operación, on-call y postmortems.
- Reducción de MTTR/MTTD y visibilidad ejecutiva real.