Resolución más rápida de problemas del sistema
Accesibilidad mejorada a los datos para los empleados que ofrecen información y servicios esenciales a los clientes cuando los necesitan
Roadmap de plazo más prolongado para el monitoreo de infraestructura y mantenimiento
El gigante de la energía brasileño monitorea sistemas críticos para el negocio con Elastic
Fundado hace más de un siglo, el Grupo Energisa es la empresa privada más grande del sector eléctrico en Brasil, con más de 8 millones de clientes. Con un enfoque en la sustentabilidad, la misión de la empresa es generar y distribuir energía de forma que beneficie la calidad de vida de los clientes y además brinde soporte para el crecimiento comercial y económico.
Pero la expansión continua trae aparejados desafíos. A medida que la empresa crece, se agregan más sistemas tecnológicos que deben ser accesibles para los empleados y ofrecer a los clientes información y servicios esenciales cuando los necesiten. Es primordial mantener la disponibilidad permanente de estos sistemas mediante el logging y la resolución de problemas técnicos lo más rápido posible.
Hasta hace poco, los analistas de Energisa no tenían la capacidad de observar con facilidad el rendimiento de estos sistemas críticos para el negocio. Los logs de aplicaciones y servicios se generaban en formato de texto, lo que dificultaba encontrarlos en un sistema descentralizado. La mera cantidad de información y el tamaño de los archivos, que se almacenaban en una base de datos relacional tradicional, complicaban el desafío.
Utilidad a partir de los datos
Los analistas dedicaban mucho tiempo a examinar las bases de datos o archivos de texto; con frecuencia recurrían a hojas de cálculo complejas para observar el rendimiento del sistema. Romulo Maini Pinto, líder del equipo de ingeniería de software de Energisa, dice: “Nuestro proceso anterior hacía que fuera desafiante responder preguntas simples y complicaba la detección de la causa raíz del problema o incluso tomar medidas preventivas”.
Para abordar estos desafíos, Maini y su equipo investigaron el mercado en busca de una solución de observabilidad que sirviera para las necesidades de Energisa. “Queríamos centralizar los logs de infraestructura y aplicaciones, posibilitar el análisis de causa raíz y la intervención temprana para mantener la disponibilidad de nuestros sistemas”, explica Maini. “También queríamos ayudar a los analistas a ahorrar tiempo mediante alertas oportunas y la presentación de la información de una forma que facilitara la comprensión y permitiera actuar en consecuencia”.
Junto con los analistas en sistemas de Energisa, Altamir Dias Cassiano y Guilherme da Silva Lima, Maini optó por la solución Elastic Observability.
Elegimos Elastic por su comunidad de usuarios activa y la evolución continua de la solución para satisfacer las necesidades de nuestros clientes. También nos atrajo el excelente soporte técnico permanente, la visualización de datos clara y la facilidad de uso general.
Energisa ahora usa Elastic para gestionar más de 1400 servidores y monitorea métricas relacionadas con la infraestructura, CPU, memoria y más.
El equipo de analistas también aprovechó las API de Elastic para el mantenimiento de los servidores: desarrolló una aplicación cuyo objetivo es evitar falsas alarmas cuando los servidores se colocan fuera de línea para tareas de mantenimiento o cambian de estado durante el uso normal.
Soporte para el negocio de Energisa y sus clientes
Gracias al despliegue, Energisa mejoró drásticamente la observación del entorno de sus servidores.
Con Elasticsearch Watcher, el equipo de analistas recibe alertas mediante la herramienta de comunicación de la empresa con bastante anticipación, de modo que puede intervenir y resolver los problemas antes de que requieran mucho tiempo. Dado que los logs son tan precisos, los analistas e ingenieros pueden ver exactamente lo que se debe hacer y evitar las falsas alarmas que generan soluciones menos precisas.
La resolución de problemas también cuenta con el soporte de Canvas, una herramienta de visualización de datos integrada en Kibana. Esto significa que el equipo de infraestructura de Energisa puede visualizar el estado del entorno completo desde una sola pantalla, priorizar los problemas que necesitan resolución urgente y asegurarse de que las aplicaciones sigan brindando soporte a los clientes y el negocio en general.
Ahorro de tiempo y mejora de procesos
Energisa también obtuvo mejoras importantes en el monitoreo de aplicaciones. Los equipos de desarrollo pueden evaluar el estado de las aplicaciones y el entorno en el que se hospeda la aplicación. También pueden encontrar rápidamente logs específicos que soporten la corrección de errores y la resolución de incidentes.
En una instancia, el equipo pudo intervenir y resolver un problema en 10 minutos. Antes de Elastic, eso hubiera demorado al menos una hora, incluso podría haber resultado imposible.
Además de ayudar a resolver problemas, Elastic simplifica los procesos relacionados con la gestión del negocio y las responsabilidades del equipo de analíticas. “Kibana con separación de espacios brinda gobernanza de logs y métricas, lo que permite a los analistas acceder a los datos relacionados únicamente con su área de negocios”, explica Maini.
Con la mirada hacia el futuro, Maini planea introducir software de machine learning que soporte un análisis predictivo más avanzado y está entusiasmado por trabajar con Elastic a medida que la solución Observability continúe avanzando.