3月3日凌晨,阿里云出現(xiàn)宕機(jī)故障。
受宕機(jī)故障影響,華北不少互聯(lián)網(wǎng)公司APP、網(wǎng)站紛紛癱瘓,一大波程序員、運(yùn)營(yíng)和運(yùn)維不得不從被窩里爬起來(lái)干活。
更重要的是,這已經(jīng)不是阿里云第一次出現(xiàn)故障。
網(wǎng)友“上海藍(lán)盟網(wǎng)絡(luò)夏立成”調(diào)侃,“阿里云一年一宕機(jī),今年特別早”。
而在宕機(jī)驚魂之后,人們需要思考宕機(jī)故障何以屢屢發(fā)生,事后該如何賠償?
驚魂三小時(shí)
針對(duì)阿里云此次宕機(jī),58高級(jí)架構(gòu)師沈劍稱,事故持續(xù)了3個(gè)小時(shí)左右,事后觀察了2個(gè)小時(shí)。
宕機(jī)最直接的影響是,購(gòu)買阿里云服務(wù)的企業(yè)網(wǎng)站或APP無(wú)法正常使用。
如果說(shuō)“無(wú)法使用”還是一個(gè)抽象名詞,那么受影響的企業(yè)能夠提供比較具象的理解。
孔夫子舊書網(wǎng)3日發(fā)布聲明稱,由于阿里云大規(guī)模故障,導(dǎo)致孔網(wǎng)暫時(shí)無(wú)法使用。言外之意,在宕機(jī)的這段時(shí)間內(nèi),用戶將無(wú)法在孔網(wǎng)購(gòu)買商品。
再比如同日發(fā)布聲明的即嗨比分(一家足球賽事直播應(yīng)用平臺(tái))稱,阿里云宕機(jī)導(dǎo)致即嗨部分模塊出現(xiàn)卡頓現(xiàn)象,即用戶體驗(yàn)出現(xiàn)下降。
依次類推,阿里云出現(xiàn)故障面積越大,受影響的企業(yè)和用戶也就越多。
在宕機(jī)故障發(fā)生大約1小時(shí)后,阿里云官方回應(yīng)稱,華北2地域可用區(qū)C部分ECS服務(wù)器等實(shí)例出現(xiàn)IO HANG,經(jīng)緊急排查處理后逐步恢復(fù)。
中新社國(guó)是直通車查詢阿里云官網(wǎng)顯示,阿里云服務(wù)從地域上可以分為亞太、歐洲與美洲、中東與印度三大塊,而具體到亞太又包括華北、華東、華南、香港等13個(gè)分區(qū)。

阿里云官網(wǎng)截圖
“華北2地域可用區(qū)C部分”,即華北地域中的一處。
通常,為了降低網(wǎng)絡(luò)時(shí)延、提高客戶訪問(wèn)速度,企業(yè)會(huì)選擇購(gòu)買靠近客戶的地域。
因此,此次宕機(jī)故障發(fā)生后,“華北可謂是亂成一鍋粥”。
而隨著越來(lái)越多企業(yè)及應(yīng)用將數(shù)據(jù)搬上云端,服務(wù)器上的每一個(gè)小小的宕機(jī),都可能引發(fā)一場(chǎng)大災(zāi)難。
阿里云歷次宕機(jī)
作為國(guó)內(nèi)最大的云服務(wù)商,這并不是阿里云第一次宕機(jī)。
2018年6月,阿里云出現(xiàn)大規(guī)模訪問(wèn)異常,圖片服務(wù)等產(chǎn)品無(wú)法正常使用,官網(wǎng)賬號(hào)也無(wú)法登陸。官方公布,該故障是因?yàn)檫\(yùn)維上的一個(gè)操作失誤。事后,阿里云表示,將敬畏每一行代碼,敬畏每一份托付。
2016年10月,阿里云華東1地域可用區(qū)B部分也曾發(fā)生過(guò)ECS服務(wù)器IO HANG的事故。
再往前,2015年9月,阿里云云盾的安騎士產(chǎn)品升級(jí)觸發(fā)bug導(dǎo)致了用戶ECS里的部分正常文件被誤隔離。原因是,程序員寫錯(cuò)了一行代碼。也是在當(dāng)年,阿里云啟動(dòng)了“百倍時(shí)間賠償計(jì)劃”。
另有媒體統(tǒng)計(jì),2012年、2013年、2014年阿里云都曾出現(xiàn)不同程度的故障。
據(jù)市場(chǎng)研究機(jī)構(gòu)IDC日前報(bào)告,阿里云市場(chǎng)份額位居中國(guó)第一,占比達(dá)到43%,相當(dāng)于第二至第九名的總和。排名其后的分別是,騰訊云、中國(guó)電信、AWS、金山云、Ucloud、微軟、百度云和華為云。
如此大體量,阿里云每次的宕機(jī)都會(huì)給客戶帶來(lái)不小影響。
與其給客戶帶來(lái)的負(fù)面影響相反,阿里云憑借中國(guó)大市場(chǎng)已經(jīng)躋身全球云服務(wù)領(lǐng)先地位。
阿里巴巴1月30日公布財(cái)報(bào)顯示,阿里云營(yíng)收規(guī)模為213.6億元,4年間增長(zhǎng)約20倍,成為亞洲最大的云服務(wù)公司。上一年,這一數(shù)字為111.7億元。
宕機(jī)如何賠償?
在此次宕機(jī)事件發(fā)生后,阿里云表示,將根據(jù)SLA協(xié)議,盡快處理賠償事宜。
“SLA協(xié)議”即,服務(wù)等級(jí)協(xié)議(Service Level Agreement,簡(jiǎn)稱 “SLA”)。根據(jù)阿里云官網(wǎng)資料顯示,對(duì)于單ECS實(shí)例,如服務(wù)可用性低于99.95%,用戶可獲得月度服務(wù)費(fèi)10%、25%、100%不等的賠償。

阿里云官網(wǎng)截圖
此外,華為云、騰訊云的賠償標(biāo)準(zhǔn)均與此相似。
一位云計(jì)算企業(yè)工程師告訴中新社國(guó)是直通車,云服務(wù)發(fā)生故障的賠償基本以“送時(shí)間”為主。比如此前,阿里云就執(zhí)行過(guò)“百倍時(shí)間賠償”。

阿里云官網(wǎng)截圖
“但這點(diǎn)賠償有時(shí)候與企業(yè)的損失差距巨大。”前述工程師舉例,如果京東淘寶5分鐘不能登陸,這得損失多少錢。
針對(duì)此次宕機(jī),也有網(wǎng)友提出,除了賠使用時(shí)長(zhǎng)和代金券,還應(yīng)該賠償“加班費(fèi)”,不少運(yùn)維和程序員從被窩里爬起來(lái)加班。
而對(duì)企業(yè)而言,他們最關(guān)心是如何避免發(fā)生故障。
有分析人士認(rèn)為,盡管云服務(wù)商承諾99.99%的安全可靠性,但誰(shuí)都有可能是那倒霉的0.01%。因此,避免故障通常有兩種做法,一種是數(shù)據(jù)備份,并定期更新;一種是不把雞蛋放在同一個(gè)籃子里,使用一個(gè)以上的云服務(wù)提供商。
但這無(wú)疑都會(huì)增加企業(yè)的成本。云服務(wù)商如何更可靠,仍是一個(gè)待解之題。
推薦閱讀
Uber計(jì)劃將在印度的外賣業(yè)務(wù)出售給對(duì)手Swiggy
據(jù)彭博消息,Uber計(jì)劃將Uber Eats在印度的外賣業(yè)務(wù)出售給對(duì)手Swiggy,此次交易以股權(quán)交換的形式進(jìn)行,Uber將獲得其10%的股份,交易或?qū)⒃诮酉聛?lái)的幾周完成。 2018年,UberE>>>詳細(xì)閱讀
本文標(biāo)題:阿里云宕機(jī)驚魂三小時(shí):眾多app癱瘓 會(huì)賠多少錢?
地址:http://www.zcgs360.cn/a/daohang/308153.html