Servidores de centros de datos que muestran la hora digital 06:10 PM para ilustrar la sincronización horaria de Bodet Time

Sincronización horaria en los centros de datos: retos, dificultades y soluciones

No pasa una semana sin que se oiga hablar de los centros de datos. Todo el mundo sabe ya que los centros de datos son los pilares de la economía digital mundial. Procesar transacciones financieras, alojar bases de datos, gestionar flujos de vídeo, ejecutar sistemas de inteligencia artificial: todas estas operaciones se basan en un requisito previo fundamental del que nunca se habla realmente: el control de un momento concreto.

La más mínima diferencia horaria entre algunos de los miles de servidores de un centro de datos puede provocar incoherencias en los datos, crear brechas de seguridad o incumplimientos normativos. ¿Cuáles son los retos, las dificultades técnicas y las soluciones para implementar una sincronización horaria fiable en un entorno de centro de datos? Eso es lo que vamos a tratar aquí.

¿Por qué es tan importante la sincronización horaria en un centro de datos?

Las aplicaciones modernas se basan en bases de datos distribuidas cuyos nodos se encuentran repartidos por varias ubicaciones geográficas. Para garantizar la coherencia de las transacciones, estos sistemas utilizan sellados de tiempo precisos que permiten ordenar los eventos. Google, por ejemplo, ha desarrollado un sistema que combina relojes atómicos y receptores GPS en cada uno de sus centros de datos con el fin de mantener una incertidumbre temporal inferior a 7 ms. Amazon ha adoptado un enfoque similar con su servicio Amazon Time Sync, que ofrece una precisión de microsegundos para sus bases de datos distribuidas. 

Otro aspecto importante es el cumplimiento normativo. Por ejemplo, en el ámbito financiero, la normativa europea incluye una directiva sobre el mercado de instrumentos financieros, la MiFID II. Esta directiva, y más concretamente su norma técnica reglamentaria RTS 25, exige que los relojes comerciales de los sistemas de negociación estén sincronizados con el tiempo universal coordinado (UTC), con una divergencia máxima establecida. Del mismo modo, en Estados Unidos, las normas de la FINRA exigen una sincronización con una precisión de 50 milisegundos. Por lo tanto, los centros de datos que alojan estas actividades deben disponer de una infraestructura de sincronización adecuada.
 

Más información: La MiFID II y la sincronización horaria

La norma RTS 25 de la Directiva europea MiFID II establece varios niveles de precisión en función del tipo de actividad. Los sistemas de negociación de alta frecuencia deben estar sincronizados con una precisión de 100 microsegundos con respecto al tiempo universal coordinado (UTC). El resto de actividades de negociación electrónica cuentan con una tolerancia de 1 milisegundo, y las actividades manuales, de 1 segundo. 

La normativa también exige que cada sellado de tiempo sea trazable hasta el UTC mediante una cadena documentada, y que los registros se conserven durante cinco años. Estos requisitos se aplican a todas las empresas de inversión que operan en la UE.

La seguridad informática es otro reto importante para un centro de datos. El registro de eventos es uno de los pilares de esta seguridad. En caso de ciberataque, los equipos de seguridad deben poder reconstruir la cronología exacta de los acontecimientos a partir de los registros de cientos de equipos diferentes. Si los relojes no están sincronizados, la fiabilidad de la reconstrucción no está garantizada, lo que complica el análisis forense y la respuesta a los incidentes. 

Estos tres aspectos no son los únicos puntos importantes: la sincronización horaria también es importante para las aplicaciones en tiempo real. Es el caso del vídeo en streaming, el cálculo de alto rendimiento y otras aplicaciones que traen de cabeza a los ingenieros. 

NTP y PTP: dos protocolos para dos niveles de precisión

El protocolo NTP (Network Time Protocol) es el protocolo «histórico» de sincronización horaria. Basado en una arquitectura jerárquica por estratos, NTP sincroniza los relojes de software de los equipos con una precisión del orden del milisegundo en una red local y de algunas decenas de milisegundos en Internet. NTP es la opción preferida para muchas aplicaciones debido a su sencillez y solidez. 

El protocolo PTP (Precision Time Protocol) satisface las necesidades de aquellas aplicaciones en las que el milisegundo ya no es suficiente. A diferencia del protocolo NTP, que se basa en sellados de tiempo puramente algorítmicos, PTP propaga información temporal procedente de equipos específicos. Esto permite eliminar los retrasos variables que introduce la pila de software y alcanzar precisiones del orden del microsegundo, o incluso inferiores. 

PTP funciona según una arquitectura cliente-servidor, en la que un reloj de referencia denominado «Grandmaster» distribuye la hora a toda la red. La elección del Grandmaster se lleva a cabo mediante el algoritmo BMCA (Best Master Clock Algorithm). 

En la práctica, ambos protocolos suelen coexistir en un mismo centro de datos. PTP se implementa en los segmentos de la red que exigen la máxima precisión (operaciones de negociación, bases de datos distribuidas, telecomunicaciones), mientras que NTP sigue prestando servicio a los equipos para los que basta con una precisión del orden del milisegundo (servidores de aplicaciones, estaciones de trabajo, equipos periféricos). Un servidor de tiempo de calidad debe ser capaz de distribuir ambos protocolos simultáneamente para satisfacer todas las necesidades.

Bodet Time Una sincronización horaria fiable para sus entornos críticos

Una sincronización horaria fiable para sus entornos críticos

Asegure una sincronización horaria precisa y coherente en todos sus dispositivos, sin ningún desfase.

Garantice una hora sincronizada

Retos técnicos propios de los centros de datos

Aunque están muy extendidos, los centros de datos no son entornos como los demás. Imponen restricciones de sincronización que suelen ser muy específicas. 

Por lo general, los mensajes de sincronización atraviesan numerosos conmutadores y routers. En cada dispositivo por el que pasan, pueden sufrir retrasos impredecibles. Esta variación del retardo de propagación, denominada PDV (Packet Delay Variation), reduce la precisión de la sincronización. Cuanto mayor es el número de conmutadores por los que pasa, mayor es el impacto. La colocación estratégica de los denominados relojes de frontera (boundary clocks) permite reducir considerablemente este efecto al «terminar» la señal PTP en cada etapa y regenerarla con un nuevo sellado de tiempo. 

La teoría en la que se basa PTP parte de una premisa concreta: el tiempo de tránsito de un paquete es idéntico en ambos sentidos (ida y vuelta). Sin embargo, en las complejas redes de un centro de datos, las rutas de ida y vuelta pueden ser diferentes, lo que crea una asimetría que introduce un error temporal que PTP no sabe estimar. 
El diseño de una red lo más simétrica posible, junto con el uso de algoritmos específicos, permite mitigar este problema. 

La mayoría de los algoritmos de sincronización se desarrollaron en una época en la que las infraestructuras informáticas se diseñaban y gestionaban de forma diferente. Hoy en día, la mayoría de las infraestructuras están virtualizadas. 
Las máquinas virtuales y los contenedores no disponen de su propio reloj de hardware, por lo que dependen del reloj de su host físico. La sincronización precisa del host se vuelve, por tanto, aún más crítica, ya que cualquier desviación repercute en el conjunto de cargas virtuales que aloja (y hay que estar atentos, ya que estos recursos pueden ser reubicados «sin previo aviso»). 

Un último aspecto técnico importante es el de la resiliencia. ¿Qué ocurre si el servidor de tiempo pierde temporalmente su fuente de referencia externa (avería del receptor GPS, corte de red)? De ahí la importancia de la calidad del oscilador interno del servidor de tiempo. Un oscilador OCXO (Oven-Controlled Crystal Oscillator) o un oscilador de rubidio permitirá mantener una precisión aceptable durante varias horas, o incluso varios días, en modo «holdover». 

Garantizar la seguridad de la sincronización horaria

La sincronización horaria representa un vector de ataque a menudo subestimado, pero también muy utilizado. Manipular la hora de un sistema informático puede tener consecuencias en cadena: invalidar certificados TLS, eludir mecanismos de autenticación, posibilitar ataques de repetición o falsear el sellado de tiempo de los registros, lo que impediría realizar un análisis forense eficaz. 

El protocolo NTP, en su configuración estándar, intercambia paquetes sin cifrar y sin autenticar. Esto lo hace vulnerable a varios tipos de ataques: 

  • Suplantación de identidad (spoofing)
  • Ataque de denegación de servicio (DDoS)
  • Interceptación (man-in-the-middle)

El protocolo Network Time Security (NTS) ofrece una solución a estas vulnerabilidades. NTS utiliza TLS para el establecimiento inicial de la conexión y un mecanismo de cifrado autenticado para proteger los paquetes NTP intercambiados durante la sincronización. Esto garantiza tanto la autenticidad de la fuente como la integridad de los datos temporales transmitidos. 

Arquitecturas recomendadas: redundancia y resiliencia

La disponibilidad de la hora es tan importante como la de la red o el suministro eléctrico. Una arquitectura de sincronización robusta se basa en varios niveles de redundancia

  • Se recomienda no depender nunca de una única fuente de tiempo. Lo ideal es combinar varias fuentes independientes, por ejemplo, GPS y un oscilador interno para el holdover. En caso de pérdida de la señal satelital (interferencias, fallo de hardware), el oscilador tomará el relevo de forma transparente. 
  • El propio servidor de tiempo debe estar diseñado para una alta disponibilidad: doble fuente de alimentación, salidas Ethernet dobles, componentes redundantes. 
  • A nivel de red, la redundancia informática pasa por la implementación de varios servidores de tiempo en distintas zonas del centro de datos, con mecanismos de conmutación automática. En el caso de NTP, las técnicas de peering entre servidores permiten garantizar la continuidad del servicio. En el caso de PTP, el algoritmo BMCA selecciona automáticamente el mejor Grandmaster disponible en caso de fallo. 
  • Por último, una arquitectura de sincronización completa debe incluir un sistema de supervisión que permita verificar constantemente la precisión efectiva de la sincronización en cada punto de la red. Esta trazabilidad es especialmente importante en los sectores regulados.

Contacte con nosotros

Blogs similares

¿Cómo optimizar el funcionamiento y la seguridad de un sitio industrial?

En una línea de producción, los diferentes puestos de trabajo se vuelven cada vez más automatizados para mejorar la rentabilidad y la productividad de...

Análisis comparativo de los osciladores: MEMS vs TCXO vs OCXO vs RUBIDIO

Los osciladores son componentes imprescindibles para los mecanismos de sincronización horaria. Marcan el paso del tiempo y aseguran la calidad de los...

Los principios esenciales de una sincronización horaria en la red

Hoy en día, es poco frecuente encontrar una aplicación en la que sólo intervenga una sola máquina. La mayoría de las tareas llevadas a cabo implican...