Innehållsförteckning:
Ordspråkigt "programvarufel" skickade en spiral av dåliga konfigurationer till andra system
Efter ett av de längre avbrottet för tjänsteservicen för Google i det senaste minnet, skickade sök- och mjukvarugiganten en ursäkt och förklaring till dagens händelser. Enligt den officiella Google-bloggen stötte ett internt system som skickar ut konfigurationsinformation för system bortom det ett programfel som skickade felaktiga kommandon till flera områden.
Det tog bara från klockan 10:55 PT när felet först sågs till 11:02 när användare började se massiva avbrott i Gmail, Google+, Drive och andra tjänster. Cirka 12 minuter senare medan ingenjörer fortfarande var i färd med att ta reda på vad som hände, hade det första systemet som skickade ut den dåliga informationen självkorrigerat och började konfigurera andra system på rätt sätt. Google hävdar att nästan alla användares tjänster var igång igen klockan 11:30, vilket verkar vara förenligt med den allmänna konsensus bland användare.
Som du kan förvänta dig ger inlägget detaljer om vad som görs för att förhindra att detta händer i framtiden. Fler kontroller införs så att felaktiga konfigurationer, om de genereras av buggar, inte så lätt skickas ut till andra system. Dessutom planerar Google att förbättra riktad sökning efter problem under servicefel.
Naturligtvis tror vi inte att vi kommer att se störningar som denna med någon högre frekvens än vi redan upplever nu.
Källa: Google Blog