Un simple error humano bastó para tumbar medio Internet

Resultado de imagen para error de amazon internet

A finales del mes de febrero Amazon Web Services sufrió una importante caída en su servicio S3 que fue suficiente para tumbar medio Internet.

Puede parecer exagerado pero no lo es en absoluto, ya que actualmente dicho servicio da hospedaje y funciones de computación en la nube a una gran cantidad de empresas, entre las que se encuentran algunas tan importantes como Drobox, Canon, HTC y Netflix.

No teníamos claro qué era lo que había ocurrido, pero gracias a la investigación que ha realizado la propia Amazon sabemos que todo se ha debido a un simple error humano, concretamente a un comando de desactivación de servidores mal introducido.

El plan inicial era que un equipo de profesionales desactivara una zona controlada de servidores para llevar a cabo labores de mantenimiento, pero al introducir mal dicho comando se acabaron apagando una enorme cantidad de servidores y se produjo la correspondiente caída del servicio.

A pesar de que la red de servidores está diseñada para subsanar caídas como ésta y aguantar “el tirón” de la mejor manera posible la pérdida de capacidad de computación (rendimiento) fue muy grande, tanto que no pudieron aguantar.

Una vez identificado el problema hubo que reiniciar los servidores que fueron desactivados, una labor que acabó necesitando más tiempo del esperado y que al final acabó, como dijimos al inicio, por tumbar medio Internet durante casi cinco horas.

Más información: WCCFTech.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s