¿Por qué se cayeron los servicios Azure de Microsoft?

Negocios

Los servicios de Azure tuvieron problemas de disponilidad durante casi un día, después de que Microsoft comenzara una actualización que falló en el ‘Blob’.

La nube de Microsoft Azure sufrió una caída de sus servicios que afectó a clientes de todo el mundo el martes y que, según han explicado las fuentes de la empresa de Redmond, fue causado por un problema técnico que se produjo durante la actualización de rendimiento para su servicio de almacenamiento en la nube.

Windows AzureAunque Microsoft había probado ampliamente la actualización durante varias semanas antes de aplicarlo, un problema salió a la superficie después de  aplicar la actualización al servicio Azure, tal y como explicó Jason Zander, vicepresidente corporativo del equipo de Microsoft Azure, en el blog de la empresa en un artículo publicado ayer mismo.

Como publicó ChannelBiz,El servicio de cloud computing de Microsoft Azure, que alberga sitios web y permite a los clientes almacenar y gestionar datos de forma remota, sufrió problemas que llevaron a una caída de varios de sus servicios y el portal web de MSN estuvo inaccesible a los usuarios de Internet.

Durante el despliegue de las actualizaciones, los técnicos encontraron un problema en el almacenamiento ‘blob front end’ lo que llevó al sistema a ser incapaz de asumir más tráfico de datos, lo que que a su vez afectó a otros servicios integrados de la plataforma de la empresa, de acuerdo con las palabras de Zander. El término ‘Blob’ se refiere a ‘Binary Large Objects’, u objetos binarios grandes, elementos utilizados en las bases de datos para almacenar datos de gran tamaño que cambian de forma dinámica.

Explica el vicepresidente corporativo del equipo de Microsoft Azure, que “una vez que hemos detectado este problema, el cambio se deshace rápidamente, pero hubo que reiniciar los extremos delanteros de almacenamiento a fin de deshacer completamente la actualización. Una vez que se desplegaron las medidas de mitigación, la mayoría de nuestros clientes comenzaron a ver la mejora de disponibilidad en todas las regiones afectadas”. Sin embargo, reconoció el directivo que aunque casi todos los servicios vuelven a estar en línea, “un subconjunto limitado de clientes todavía está experimentando problemas intermitentes, y nuestros equipos de ingeniería y de apoyo participan activamente para solucionar esto”.

Dice Zander que “cuando tenemos un incidente como este, nuestro enfoque principal es poder eaccionar rápidamente y poder examinar de cerca lo que salió mal para asegurarnos de que no vuelva a suceder“.

Lea también :