Lopez Doriga
Lopez Doriga Lopez Doriga
  • Nacional
  • Internacional
  • Deportes
  • Economía
  • Ciencia y Tecnología
  • Entretenimiento
  • López-Dóriga TV
  • Opinión
  • Últimas Noticias

Minuto a Minuto

Nacional Sheinbaum pide que Marcha de la Generación Z continúe por la “vía pacífica”
La presidenta Sheinbaum reaccionó a los disturbios durante la Marcha de la Generación Z en la Ciudad de México este 15 de noviembre
Nacional Da formal prisión a exagente del Cisen, señalado como segundo tirador en asesinato de Colosio
Jorge Antonio Sánchez , exagente del Cisen, es señalado por su participación en el homicidio del priista Luis Donaldo Colosio
Nacional Marcha de la Generación Z en CDMX: Hay 20 detenidos y 120 lesionados, entre ellos 100 policías
Pablo Vázquez, titular de la SSC CDMX, informó del saldo tras los enfrentamientos regIstrados en la marcha de la Generación Z
Internacional Maduro canta ‘Imagine’ de John Lennon en medio de las tensiones con EE.UU.
Nicolás Maduro, presidente de Venezuela, cantó de manera breve la canción 'Imagine' durante un evento celebrado en Caracas
Nacional Recordar es la única forma de volver a ver con claridad, por Fernando Azcárraga López
"Tengo vida, tengo familia, disfruto todavía los pequeños regalos de cada día…, pero mi país ya no es hermoso. A mi edad he visto cómo ha evolucionado"
Ver más noticias
Ciencia y Tecnología
Falla en mantenimiento de rutina, la causa de la caída de Facebook, WhatsApp e Instagram
Facebook. Foto de Pexels. (Archivo)

Falla en mantenimiento de rutina, la causa de la caída de Facebook, WhatsApp e Instagram

Facebook dijo que la caída de sus plataformas se debió a una falla en el mantenimiento de rutina que cortó todas las conexiones en la red troncal

octubre 5, 2021

Después de que el fundador de Facebook, Mark Zuckerberg, se disculpara por la caída de dicha red social, además de Instagram, WhatsApp y Messenger, la compañía detalló la causa de la interrupción del servicio.

De acuerdo con un comunicado de Facebook, las plataformas dejaron de funcionar durante más de seis horas debido a una falla en el mantenimiento de rutina que cortó todas las conexiones en la red troncal.

La compañía aseguró que cada ‘fracaso’ como el apagón del 4 de octubre es una oportunidad para aprender y mejorar y que ya realizan un extenso proceso de revisión para hacer más resistentes sus sistemas.

Así explicó Facebook la caída de sus redes sociales: 

Esta interrupción fue provocada por el sistema que administra la capacidad de nuestra red troncal global. La columna vertebral es la red que Facebook ha construido para conectar todas nuestras instalaciones informáticas, que consta de decenas de miles de millas de cables de fibra óptica que cruzan el mundo y conectan todos nuestros centros de datos.

Esos centros de datos vienen en diferentes formas. Algunos son edificios masivos que albergan millones de máquinas que almacenan datos y ejecutan las cargas computacionales pesadas que mantienen nuestras plataformas en funcionamiento, y otros son instalaciones más pequeñas que conectan nuestra red troncal a Internet en general y a las personas que usan nuestras plataformas.

Cuando abre una de nuestras aplicaciones y carga su feed o mensajes, la solicitud de datos de la aplicación viaja desde su dispositivo a la instalación más cercana, que luego se comunica directamente a través de nuestra red troncal a un centro de datos más grande. Ahí es donde se recupera y procesa la información que necesita su aplicación, y se envía de vuelta a través de la red a su teléfono.

El tráfico de datos entre todas estas instalaciones informáticas se gestiona mediante enrutadores, que determinan dónde enviar todos los datos entrantes y salientes. Y en el extenso trabajo diario de mantener esta infraestructura, nuestros ingenieros a menudo necesitan tomar parte de la red troncal fuera de línea para el mantenimiento, tal vez reparando una línea de fibra, agregando más capacidad o actualizando el software en el enrutador.

Esta fue la fuente del apagón de ayer. Durante uno de estos trabajos de mantenimiento de rutina, se emitió un comando con la intención de evaluar la disponibilidad de la capacidad de la red troncal global, que accidentalmente cortó todas las conexiones en nuestra red troncal, desconectando efectivamente los centros de datos de Facebook a nivel mundial. Nuestros sistemas están diseñados para auditar comandos como estos para evitar errores como este, pero un error en esa herramienta de auditoría no detuvo correctamente el comando.

Este cambio provocó una desconexión completa de nuestras conexiones de servidor entre nuestros centros de datos e Internet. Y esa pérdida total de conexión provocó un segundo problema que empeoró las cosas.

Uno de los trabajos que realizan nuestras instalaciones más pequeñas es responder a las consultas de DNS. DNS es la libreta de direcciones de Internet, lo que permite que los nombres web simples que escribimos en los navegadores se traduzcan a direcciones IP de servidor específicas. Esas consultas de traducción son respondidas por nuestros servidores de nombres autorizados que ocupan direcciones IP bien conocidas, que a su vez se anuncian al resto de Internet a través de otro protocolo llamado protocolo de puerta de enlace fronteriza (BGP).

Para garantizar un funcionamiento confiable, nuestros servidores DNS desactivan esos anuncios BGP si ellos mismos no pueden hablar con nuestros centros de datos, ya que esto es una indicación de una conexión de red no saludable. En la interrupción reciente, toda la red troncal se retiró de la operación, lo que hizo que estas ubicaciones se declararan insalubres y retiraran esos anuncios de BGP. El resultado final fue que nuestros servidores DNS se volvieron inalcanzables a pesar de que todavía estaban operativos. Esto hizo imposible que el resto de Internet encontrara nuestros servidores.

Todo esto sucedió muy rápido. Y mientras nuestros ingenieros trabajaban para averiguar qué estaba sucediendo y por qué, se enfrentaron a dos grandes obstáculos: primero, no era posible acceder a nuestros centros de datos a través de nuestros medios normales porque sus redes estaban caídas, y segundo, la pérdida total de DNS se rompió. muchas de las herramientas internas que normalmente usamos para investigar y resolver interrupciones como esta.

Nuestro acceso a la red principal y fuera de banda estaba inactivo, por lo que enviamos ingenieros al sitio a los centros de datos para que depuraran el problema y reiniciaran los sistemas. Pero esto llevó tiempo, porque estas instalaciones están diseñadas con altos niveles de seguridad física y del sistema en mente. Es difícil acceder a ellos y, una vez que estás dentro, el hardware y los enrutadores están diseñados para ser difíciles de modificar incluso cuando tienes acceso físico a ellos. Por lo tanto, tomó más tiempo activar los protocolos de acceso seguro necesarios para que las personas estén en el sitio y puedan trabajar en los servidores. Solo entonces podríamos confirmar el problema y volver a poner nuestra columna vertebral en línea.

Una vez que se restauró la conectividad de nuestra red troncal en las regiones de nuestro centro de datos, todo volvió a funcionar. Pero el problema no había terminado: sabíamos que volver a activar nuestros servicios de una sola vez podría causar una nueva ronda de accidentes debido a un aumento en el tráfico. Los centros de datos individuales informaban caídas en el uso de energía en el rango de decenas de megavatios, y revertir repentinamente tal caída en el consumo de energía podría poner en riesgo todo, desde sistemas eléctricos hasta cachés.

Con información de López-Dóriga Digital

Minuto a minuto

Sheinbaum pide que Marcha de la Generación Z continúe por la “vía pacífica”
México
Sheinbaum pide que Marcha de la Generación Z continúe por la “vía pacífica”
Videos: México y Uruguay empatan en Torreón
Deportes
Videos: México y Uruguay empatan en Torreón
Mueren cuatro migrantes tras volcadura de bote en EE.UU.; habría mexicanos entre las víctimas
Internacional
Mueren cuatro migrantes tras volcadura de bote en EE.UU.; habría mexicanos entre las víctimas
María Corina Machado pide a funcionarios que “bajen las armas” y acompañen “la libertad de Venezuela”
El Mundo
María Corina Machado pide a funcionarios que “bajen las armas” y acompañen “la libertad de Venezuela”
Da formal prisión a exagente del Cisen, señalado como segundo tirador en asesinato de Colosio
México
Da formal prisión a exagente del Cisen, señalado como segundo tirador en asesinato de Colosio
Lopez Doriga Digital
  • [email protected]
  • Aviso de privacidad
  • Declaración de accesibilidad
  • Nacional
  • Internacional
  • Deportes
  • Economía
  • Ciencia y Tecnología
  • Entretenimiento
  • López-Dóriga TV
  • Opinión
  • Últimas Noticias

López-Dóriga Digital 2014–2021 - Todos los Derechos Reservados.

  • Nacional
  • Internacional
  • Deportes
  • Economía
  • Ciencia y Tecnología
  • Entretenimiento
  • López-Dóriga TV
  • Opinión
  • Últimas Noticias

Síguenos

Inklusion
Loading