Skip to main content

Hoy la inactividad IT representa un riesgo que puede comprometer el futuro de cualquier negocio. Por esta razón, numerosas empresas recurren a servicios especializados que garantizan la continuidad operativa en sus centros de datos.

La digitalización abre paso a nuevas tecnologías para utilizar en el trabajo, muchas de ellas relacionadas con la eficiencia y la productividad. Quizás las más importantes sean aquellas que garantizan la continuidad operativa del negocio, incluso ante situaciones adversas. 

A lo largo de este artículo, exploraremos qué significa realmente la continuidad operacional para las corporaciones chilenas, sus beneficios y mejores prácticas; teniendo como norte la importancia de estar siempre conectados.

¿Qué es la continuidad operativa en centros de datos y por qué es crucial?

La continuidad operativa se ha convertido en un pilar clave para las empresas en Chile, sobre todo en sectores estratégicos como minería, energía, retail y telecomunicaciones. Este concepto se centra en la capacidad de las organizaciones para mantener sus servicios activos y estables, incluso ante circunstancias inesperadas.

En el contexto chileno, donde los desastres naturales son un riesgo común, asegurar la continuidad operacional no solo es una medida de prevención, sino también una ventaja competitiva que permite a las organizaciones adaptarse rápidamente y proteger tanto su productividad como la confianza de sus clientes.

A modo de ejemplo, según revela el reporte “Una visión sistémica para afrontar el desafío de la continuidad operativa frente a desastres en Chile”, publicado en 2020 por la investigadora Conecta Resiliencia, el terremoto y tsunami del 27 de febrero de ese año produjo pérdidas cercanas a los US$ 30.000 millones, el equivalente a un 18% del PIB

Principales desafíos de la continuidad operativa en entornos de alta disponibilidad

En ámbitos empresariales donde se requiere una actividad constante, como bancos, plataformas de comercio electrónico o servicios en la nube; cualquier tipo de interrupción puede tener un gran impacto en sus operaciones y escalar hacia la experiencia del usuario.

Para que esto no suceda, las empresas utilizan entornos de alta disponibilidad: un sistema diseñado para minimizar el tiempo de inactividad y garantizar que los servicios, aplicaciones o datos estén disponibles de manera continua, incluso ante fallas o problemas imprevistos. 

Consecuencias de no implementar un plan de continuidad operativa

Cuando una empresa ve interrumpidas sus operaciones, es propensa a sufrir distintos efectos negativos, entre los que se encuentran: 

  • El daño a su reputación dentro de su segmento de mercado.
  • Pérdida de credibilidad frente a clientes actuales y futuros.
  • Disminución de la productividad.
  • Pérdidas económicas, como consecuencia de la falta de productividad.
  • Deshonrar la imagen de la marca.
  • Cierre del negocio, como la consecuencia más drástica.

Desafíos de la continuidad operativa

En Chile, la continuidad operativa es un aspecto fundamental para las empresas más grandes de la industria, en mayor medida aquellas que se ubican en regiones propensas a un eventual desastre natural o cortes de suministro eléctrico por razones climatológicas (como las lluvias y vientos fuertes en invierno o climas calurosos y el sobrecaliento de dispositivos frágiles en verano).

Un relevamiento de Conecta Resiliencia indica que la mitad de sus encuestados identificó al terremoto de 2020 como uno de los desastres más destructivos en la historia de Chile, y solo el 36% se siente realmente preparado para enfrentar una catástrofe similar en el futuro. 

Esto refleja que el desafío principal para las empresas es desarrollar planes de continuidad operativa que aseguren su funcionamiento ante eventos adversos. Aunque dos tercios de los encuestados en el estudio ya contaban con planes de continuidad operativa, solo la mitad de ellos había incluido protocolos específicos para desastres naturales. Y solo un 36% tenía certeza sobre la eficacia de sus planes.

Cómo implementar un plan de continuidad operativa eficaz en centros de datos

Para implementar un plan de continuidad operativa eficaz en data center, es preciso establecer una serie de estrategias y soluciones que aseguren la disponibilidad ininterrumpida y el funcionamiento estable de los sistemas críticos. 

A continuación, exploraremos algunos componentes que ayudan a construir una infraestructura resiliente, capaz de soportar demandas de alta disponibilidad y recuperación rápida ante desastres. 

Redundancia de hardware y software

Los sistemas de alta confiabilidad están diseñados para garantizar la continuidad operativa de cargas críticas mediante redundancia en la alimentación eléctrica. Estos equipos dirigen la energía desde una fuente principal (primaria) o, en caso de fallo, desde una fuente secundaria, asegurando un suministro ininterrumpido.

En caso de falla de la fuente primaria, la fuente secundaria asume automáticamente la alimentación de las cargas conectadas, sin interrupciones perceptibles. Una vez restaurada la fuente primaria, el interruptor de transferencia (switch) puede devolver la alimentación a esta de manera automática. Este proceso, que suele completarse en milisegundos, protege la operación de sistemas sensibles, como servidores, equipos médicos o infraestructura industrial crítica.

Además, el software de gestión integrado permite monitorear y controlar el estado de las fuentes de energía en tiempo real, facilitando alertas predictivas y ajustes automáticos. Este complemento asegura que los sistemas operen de manera eficiente, optimizando los tiempos de respuesta y reduciendo riesgos operativos.

La combinación de hardware redundante y herramientas de software de monitoreo garantiza la continuidad de los procesos más importantes, minimizando el impacto de fallos inesperados en entornos críticos.

Servidores de alta disponibilidad y confiabilidad

Los servidores son la columna vertebral del procesamiento centralizado y acceso a información en las empresas, gestionando tareas críticas como almacenamiento de archivos, bases de datos, correo electrónico y servicios web. Diseñados para operar de manera ininterrumpida, estos sistemas ofrecen alta disponibilidad, rendimiento y escalabilidad, adaptándose a una variedad de sistemas operativos según las necesidades empresariales.

Además, su infraestructura puede complementarse con soluciones de soporte físico, como sistemas UPS (fuente de alimentación ininterrumpida), racks de alta densidad, sistemas de aire acondicionado de precisión y herramientas de detección de incendios, que garantizan la continuidad operativa incluso ante situaciones críticas.

Soluciones de backup y respaldo de información

Otra estrategia que las empresas utilizan para aminorar los daños de una interrupción operativa son las soluciones de resguardo de información. Conocidos como backup en inglés, permite respaldar los datos más valiosos en dispositivos independientes a través de una suite de software especializado. 

Con ayuda de software especializado, las empresas pueden recuperar información ante una inminente pérdida. Sin embargo, cabe resaltar que la esencia prima de los planes de continuidad operativa es evitar que esto suceda. Estas soluciones crean copias de seguridad de forma regular y muchas veces se integran con otros sistemas de recuperación de información. 

Monitoreo de variables y entornos TI

Dado que una gran empresa no puede mantener los ojos siempre abiertos, en todo lugar, en todas las áreas que la componen; existen soluciones que ayudan a mantener una atención permanente en tu equipamiento TI, de manera que se puedan detectar anomalías o fallas en los sistemas. 

Los sistemas de monitoreo previenen incidentes que afectan la continuidad operativa del negocio ¿cómo? monitoreando variables claves de su entorno, como temperatura, humedad y presencia de líquidos en áreas sensibles para las operaciones de una compañía. 

Soluciones como el software PRTG Network Monitor integradas con sensores físicos recopilan y analizan datos en tiempo real, emitiendo alertas ante desviaciones que podrían comprometer la infraestructura.

El rol de la transformación digital en la continuidad operativa

El centro de las operaciones hoy está puesto en las tecnologías que una empresa utiliza para hacer más eficiente su trabajo. Hace décadas atrás, innovarse digitalmente era adquirir computadoras: estas inauguraron un nuevo mundo en el procesamiento de datos, la manipulación de hojas de cálculo y la redacción de documentos de forma digital. 

Sin embargo, hoy el diferenciador es mucho más exigente, ya que ciertas tecnologías como el uso de computadoras y softwares administrativos se ha democratizado a tal punto que es utilizado por cualquier persona para administrar su día a día. Actualmente, las empresas empeñan todo su esfuerzo en implementar lo último disponible en un mercado que parece no tener límites. 

Automatización de tareas

Este punto es clave para la eficiencia operativa, ya que uno de los atributos más importantes de la digitalización es la automatización de tareas. Estas herramientas reducen el error humano y permiten que las operaciones se desarrollen sin interrupciones, incluso en situaciones de crisis. Según un informe de McKinsey & Company, la automatización reduce el tiempo de inactividad de las máquinas entre un 30 y 50%; además de incrementar la productividad laboral en un 15%. 

Gestión de datos en tiempo real

Con ayuda de sensores M2M, herramientas IoT y softwares de análisis de datos en tiempo real, las organizaciones pueden supervisar todo el amplio espectro de sus operaciones las 24 horas del día. Gestionar datos no es solo tomar decisiones empresariales, sino también tener la tecnología suficiente para detectar anomalías en los centros de datos y mitigar los riesgos antes de que se conviertan en una interrupción operativa. 

Continuidad operativa

Hablar de continuidad operativa también es un fenómeno actual de las nuevas tecnologías. Hoy las corporaciones se preocupan por tener un respaldo de energía ante cualquier desperfecto eléctrico. En data centers, las empresas implementan UPS para asegurar el suministro constante de energía y proteger su infraestructura tecnológica. Estos componentes regulan y estabilizan el voltaje, lo que protege los equipos sensibles y garantiza la disponibilidad continua del servicio.

Mejor comunicación

Las plataformas de colaboración digital como Microsoft Teams, Slack y Zoom permiten la comunicación continua entre equipos, independientemente de dónde se encuentren físicamente sus empleados. Esto es indispensable cuando el trabajo cara a cara no es posible, sea una decisión empresarial o un fenómeno de aislamiento mundial como lo fue la pandemia de Coronavirus; ya que mantiene la productividad y el trabajo en equipo en marcha. 

Tecnologías clave para la continuidad operativa: big data, IA y cloud computing

Más allá de todas las tecnologías y estrategias propias de la industria 4.0 que se han mencionado, existen tres que marcaron un antes y un después en el contexto empresarial. Cuando hablamos de continuidad operativa, no podemos olvidar el uso de big data, inteligencia artificial y tecnologías cloud

En primer lugar, el cloud computing contribuye a la continuidad operativa mediante el acceso remoto de sus usuarios a información y aplicaciones alojadas en internet. De este modo, no importa lo que ocurra en las instalaciones físicas de la compañía, los datos siempre estarán disponibles. Además, la tecnología nube es fácilmente escalable y no precisa de costos excesivos (en materia de infraestructura y mantenimiento local). 

La big data está estrechamente vinculada con la tecnología en la nube y la IA. No es solo un fin, sino un medio para mejorar decisiones operativas. Hoy, cada acción empresarial genera datos que, al analizarse, revelan patrones como las ventas o el tiempo de permanencia en un sitio web. Así, los analistas identifican áreas de mejora y permite a las empresas aumentar su eficiencia operativa.

En ocasiones, estos análisis son comandados mediante inteligencia artificial. Utilizando fórmulas matemáticas y estadísticas, una IA es capaz de analizar los datos registrados por un sensor de monitoreo en data center para detectar anomalías en su entorno. De esta forma, alertar a sus ejecutivos ante un desperfecto como la presencia de humo, humedad excesiva o un incremento anormal de la temperatura. 

Transformación digital como obstáculo para la continuidad operativa

Al leer el prospecto de un producto, siempre es mejor concentrarse no solo en sus aspectos positivos sino también en los efectos adversos que su uso podría contener. No hay dudas que las tecnologías de la industria 4.0 pueden potenciar al máximo el rendimiento laboral de una organización; pero implementarlas de forma errónea puede también hacer estragos en las operaciones. 

En ese sentido, el informe de McKinsey define cinco errores más comunes de las empresas al escalar su transformación digital

  • Implementación aislada: No tener una perspectiva holística de la transformación digital e implementar nuevas tecnologías de forma independiente. 
  • Falta de adaptación: Muchas empresas pierden la oportunidad de personalizar y adaptar la tecnología necesaria según sus necesidades, solo por seguir la última tendencia disponible. 
  • Parálisis por análisis: Ante la búsqueda de querer incorporar tecnología a toda la red de trabajo al mismo tiempo, la demanda que esto genera puede paralizar a sus desarrolladores. 
  • Impulso por tecnología en lugar de su valor: Implementar tecnologías por el hecho de hacerlo y no por su valor en términos de desarrollo comercial y futuro. 
  • Dejar que la perfección derrote a lo que es mejor: Pensar en una arquitectura IoT soñada, con el máximo desarrollo y potencial disponible; pero nunca concretar su ejecución. 

Estrategias de mitigación de riesgos para garantizar la continuidad operativa

Para las empresas chilenas, la continuidad operativa es una prioridad estratégica, especialmente en un contexto de digitalización y evolución incesante de las nuevas herramientas tecnológicas. En línea con esto, la consultora IDC pronosticó para este año un crecimiento del 11% en inversiones TI por parte de las corporaciones nacionales, en comparación con 2023. 

Para mitigar los riesgos de la inactividad empresarial, las organizaciones deben gestionar un plan de contingencia con estrategias que consideren la recuperación cuando se enfrenten a la interrupción de sus operaciones. Estos obstáculos pueden aparecer por distintas razones: accidentes laborales, ciberataques, fallas técnicas e incluso desastres naturales.

A modo de pensar la mitigación de riesgos a nivel empresarial, existen cuatro puntos que son fundamentales para resguardar la continuidad operativa: 

1. Evitar el riesgo

Este punto implica tomar decisiones que eliminen la posibilidad ciertas amenazas en términos de software, hardware y redes de conexión. Esto significa: adoptar arquitecturas y equipos que han demostrado ser eficientes, en lugar de tecnologías que carecen de sustento. 

2. Reducir el riesgo

La reducción del riesgo en infraestructuras TI se centra en medidas que minimicen la probabilidad de fallos o interrupciones. Algunos ejemplos conocidos son los sistemas de respaldo y recuperación de desastres, sistemas de redundancia o RAID y parches de seguridad

3. Transferir el riesgo

Esto se puede lograr mediante contratos de servicio con terceros, como proveedores de soporte técnico o especialistas en seguridad de data centers que sean capaces de asesorar, suministrar, reparar y suplir el reemplazo de dispositivos y componentes en caso de fallos operativos. 

4. Aceptar el riesgo

La cuarta estrategia se aplica a menudo a riesgos menores, como problemas de bajo impacto que puedan ser atendidos en tiempos de inactividad o a componentes con poca vida útil que necesitan ser reemplazados periódicamente. Aquí entran en juego los sistemas de monitoreo en tiempo real, que detectan a tiempo problemas para abordarlos rápidamente. 

Impacto de los ciberataques y cómo proteger los centros de datos

Otro escenario que puede atentar contra la continuidad operativa son los ciberataques. Es normal relacionar esta actividad con malwares y correo electrónico malicioso; pero lo cierto es que el centro de datos es el target más codiciado por los delincuentes cibernéticos. Y al ser un área con alta demanda de trabajo, un ataque a su sistema podría provocar la parálisis de toda una compañía. 

Una forma acertada de proteger el centro de datos es mediante los nodos que posibilitan su acceso desde el exterior. Hoy las operaciones comerciales se ejecutan a través de internet; por lo tanto, las empresas necesitan proteger los datos que se envían y reciben a través de su protocolo web y arriba a su datacenter. 

Los firewalls, por mencionar un ejemplo, filtran el contenido desde y hacia internet de acuerdo a reglas de tráfico que cada empresa fija. Busca proteger su red y los dispositivos que están conectados a una red interna, además de impedir el acceso de usuarios ajenos a la compañía. Puede ser implementado en la modalidad de hardware o software, o en una combinación de ambos. 

Los riesgos económicos de un ciberataque

Más allá de la continuidad operativa, existen otras razones para protegerse ante ciberataques y la más importante es la financiera. Deshacerse de un ataque cibernético puede resultar muy costoso, sin contar consecuencias adicionales como la pérdida de información valiosa y la reposición de herramientas dañadas. 

En Latinoamérica, el costo promedio de una filtración de datos es de aproximadamente US$ 4,16 millones, según indica Statista.

La importancia de la monitorización continua en la continuidad operativa

El monitoreo continuo de riesgos, junto con sus planes de acción, permite desarrollar y ajustar las medidas de respuesta para la interrupción, recuperación y reanudación de las operaciones en las instalaciones de TI y sus datacenter

Esta supervisión implica el seguimiento y análisis continuo de varios parámetros, entre los cuales se encuentran: 

  • Rendimiento y la salud del hardware.
  • Condiciones medioambientales.
  • Seguridad y acceso del sistema.
  • Productividad del software.
  • Consumo eléctrico.

La principal razón por la que una compañía debería contratar servicios de monitorización es para prever a tiempo y actuar con rapidez ante cualquier problema que pueda surgir dentro de estos puntos mencionados. 

Mantener una vigilancia constante sobre parámetros de temperatura, entradas DNS, voltajes de corriente y muchos más; optimizan la continuidad operativa y mejoran el prestigio de la compañía frente a sus competidores.  

Tendencias emergentes y futuras en continuidad operativa para centros de datos

Durante todo este trayecto alrededor de la continuidad operativa y su impacto en los data center, hemos mencionado que este segmento (al igual que muchos más dentro del espectro TI) se encuentra en constante evolución, principalmente en búsqueda de mejorar su rendimiento y eficacia en un mundo empresarial cada vez más preocupado por sus índices de sostenibilidad y el cuidado del medio ambiente. 

Gartner se pronunció al respecto y dio a conocer cuáles son las tendencias del futuro en materia de continuidad operativa. Según la consultora, el 95% de los grandes centros de datos utilizarán herramientas de automatización para aumentar la eficiencia operativa para 2025, a través del uso de software y mecanizando procesos rutinarios. 

Otra tecnología que abrirá paso a la continuidad operativa en los próximos años es el cloud computing. Según Mordor Intelligence, se espera que este mercado crezca a una tasa compuesta anual del 16,40%, alcanzando los USD 1,44 billones para 2029. Este crecimiento está siendo impulsado principalmente por aplicaciones de IaaS, SaaS y PaaS, aunque uno de los principales desafíos que enfrenta es la ciberseguridad.