為什麼明星一出軌微博就宕機?

燃財經(ID:rancaijing)原創

作者 | 張藍予

編輯 | 蘇琦

“微博史上三大戰役:范冰冰李晨,王寶強,鹿晗。“微博技術專家胡忠想2017年在微博上調侃道。

李晨髮長文表示“珍惜范冰冰”、王寶強發佈離婚聲明,鹿晗公佈戀情,都一度讓微博宕機,短則十分鐘,長則持續了1個多小時。對此微博迴應稱流量瞬間暴增,超出服務器最大訪問閥值,將加強技術儲備,完善應對方案。

6月27日晚間,范冰冰李晨宣佈分手,瞬間億級的訪問量,讓微博再一次“崩潰”:范冰冰賬號評論區無法加載,搜索“范冰冰李晨”顯示失敗。

為什麼微博總是宕機?隨著5G時代來臨,邊緣計算廣泛應用後,宕機情況還會繼續發生嗎?

衡量明星火不火,就看微博是否為他宕機過

不得不承認,明星的內容與流量支撐起了微博的大半江山。每次明星爆出熱點事件,觀眾都會第一時間奔向微博吃瓜,瞬間湧入的流量也直接導致了微博宕機。

2015年6月1日,在李晨和范冰冰承認兩人正在熱戀中的兩天後,李晨又深夜髮長文證實張馨予出軌導致分手並稱珍惜范冰冰。微博瞬間陷入崩潰,十幾分鍾後才恢復正常。

2016年5月20日,霍建華工作室官方微博發消息稱:“華說:希望得到大家的祝福,@林心如。”林心如工作室則轉發了該微博並加了一顆愛心,默認了戀情,微博系統一度崩潰。

但這兩次微博宕機還算小範圍,王寶強馬蓉事件曾讓微博一天內“癱瘓”了數次。

2016年8月14日,王寶強深夜發佈離婚聲明稱妻子馬蓉與經紀人存在婚外不正當兩性關係。微博瞬間爆掉,僅五秒內該條微博的評論數就已過萬。緊接著微博服務器崩潰,無法刷出新內容。

為什麼明星一出軌微博就宕機?

微博修復好後,幾條相關微博的點贊數和評論數都超過了100萬,有網友表示,凌晨兩點,微博很多內容還是加載不出來。第二天一早,不僅微博熱搜無法進入,部分地區微博的評論點贊提示功能更是失靈,用戶關注頁面出現bug,feed流出現問題,最新內容無法刷出。

僅僅一個月後,網上突然出現大批爆料,稱演員喬任樑在上海桃浦離世。晚上10點許,上海警方微博發佈消息,稱9月16日晚18時21分,普陀公安接到報警稱桃浦地區祁順路某住宅樓內有一男子死亡。該微博發佈15分鐘後,新浪微博開始宕機。

為什麼明星一出軌微博就宕機?

微博界面顯示網絡出錯

2017年10月8日下午,國慶節假期的最後一天,演員鹿晗和關曉彤公開戀情。隨後微博出現了無法正常刷新、評論等多個頁面無法正常顯示的問題。此次兩人的戀情公佈,微博數據也達到了巔峰,兩人互動數(轉評贊)合計1380萬。

為什麼明星一出軌微博就宕機?

微博客服證實客戶端出現了無法正常刷新、評論等多個頁面無法正常顯示的問題,並表示工程師已在排查。

為什麼明星一出軌微博就宕機?

這次癱瘓堪稱微博史上最嚴重的一次,持續了1.5個小時,王高飛也在微博上表示,緊急租了1000臺服務器才解決問題。

2018年10月16日早間,演員趙麗穎和馮紹峰突然在社交平臺微博上發佈婚訊。熟悉的一幕再次上演,搜索相關關鍵詞時,系統一度卡頓。微博方面迴應稱,確實是發生宕機,原因是流量瞬間暴增,超出服務器最大訪問閥值。並稱後續將仔細覆盤,加強技術儲備,完善應對方案。

發生了幾次宕機事件後,吃瓜群眾們對此表示已經習慣,甚至很多人認為,如果明星突然宣佈結婚或分手微博還沒宕機,只能證明該明星還不夠火。

今年的兩次宕機,發生在“志玲姐姐”結婚和“範爺”分手上。

6月6日,林志玲結婚喜訊宣佈後,在微博搜索上林志玲的名字顯示搜索失敗,請重試。

6月27日,范冰冰李晨宣佈分手,范冰冰賬號評論區無法加載,搜索“范冰冰李晨”顯示失敗。

此外,朱一龍發博、沈夢辰賣貨,王思聰公佈百萬大抽獎結果等事件也一度讓微博發生小範圍故障。

成本和宕機之間,微博選擇前者

都9012年了,微博為何還在不斷宕機?

據業內技術人員介紹,服務器集群都會按照平時流量預估的峰值來設置。這幾次宕機事件都是由於突發熱點事件造成的瞬間流量過大,導致服務器壓力承受不住客戶請求而崩潰。

為什麼明星一出軌微博就宕機?

微博技術專家演講截圖

據微博技術專家在演講時引用的數據圖顯示,鹿晗關曉彤宣佈戀情的瞬間,搜索流量激增3倍有餘。

為了成本考慮,目前微博都是在熱點事件爆發後才會去阿里雲緊急擴容。

為什麼明星一出軌微博就宕機?

微博CEO王高飛微博截圖

幾年前,微博建設了一套全自動化運維平臺,新浪微博技術專家介紹,微博的自動化運維平臺是藉助公有云彈性計算資源平臺應對爆發式峰值流量,基於Docker、Swarm等容器雲技術體系實現分鐘級千臺規模機器創建及服務部署自動化運維體系。

架構內部主要採用私有云,早期採用物理機部署,通過化零為整建立冗餘池;此外通過OpenStack+KVM的虛擬化方式進行資源整合,建立VM池。在公有云方面,通過採用阿里雲等設施進行多雲對接。

微博遇到的流量挑戰是瞬間峰值高但持續時間短,當流量激增形成脈衝計算時,保證系統穩定性的唯一辦法就是快速擴容甚至是實時擴容,通過引入阿里雲的彈性計算資源來應對流量短時高峰的情況。目前微博混合雲DCP平臺,具備15分鐘內擴容1000+服務器的能力。

這為微博省去了大量的成本,畢竟平時如果徵用這麼多服務器,也都基本處於閒置狀態,實在過於浪費。阿里雲官微曾表示,一臺機器租用1小時只要1.86元,但事實上這只是華北3區一臺低配版機器的價格。就按這個低配價來算,每天使用1臺機器將產生45元錢左右的費用,1000臺就要45000元,一月就是135萬元,一年將近為微博帶來1620萬元的成本。粗略算來,動態擴容一年或許可以為微博省下超過1000萬的費用。

微博技術專家胡忠想也曾在微博上吐過苦水:擴容少了沒扛住,掛了;擴容多了沒流量,虧了。

為什麼明星一出軌微博就宕機?

微博技術專家胡忠想微博截圖

面對這種“裡外不是人”的兩難狀態,熱點發生時再動態擴容來應對,或許才是微博最佳的選擇,畢竟誰也無法預估當天會有哪對明星情侶宣佈分手。

如果發生宕機,阿里雲目前技術可以做到在1分半鐘內解決。在2018杭州雲棲大會主論壇上,阿里雲測試混合雲容災方案,在服務器宕機、業務中斷的幾秒後,監控系統探測到服務不可連接,在1分半鐘之內,業務在雲上恢復了運行。

除了擴容外,“降級”也是一種合理的控制手段。將應用服務器進行業務拆分,每個業務應用負責相對獨立的業務運作,業務之間通過同享數據庫來實現。當服務器負載過重時,平臺可以做降級策略,保證核心業務順暢運行。比如當微博的熱搜榜癱瘓時,評論、轉發等功能還可以正常使用。

微博技術專家此前表示,在應對流量峰值時,除了彈性伸縮系統,還需要統一的監控平臺、核心鏈路服務自動伸縮、預案&干預手段相互配合,以保障峰值服務正常運行。

熱點無法預測,“邊緣計算”或將解決宕機難題

其實,出現宕機也不全是微博的錯,畢竟熱點無法預測。一般像雙十一、春節這種大型流量節點,各家都會提前做好充足的準備工作。

百度為了今年春晚紅包戰事提前準備一個月,增加了3萬臺服務器,投入了大幾億的成本。

為了迎接2018年雙十一,阿里雲新增了近千萬的彈性計算能力,相當於10座大型的數據中心,創造了“脈衝計算”的新紀錄。但扛住了千億級訪問量,維持交易正常進行,卻沒想到大量用戶提交退款,退款頁面瞬時崩潰。

為什麼明星一出軌微博就宕機?

再充足的準備,也難以抵擋瞬間巨大的流量湧入。今年春節零點後,微信紅包顯示無法發送,直到半個小時以後才逐漸恢復。

在通信博士張峻愷看來,現在服務器的所有數據都放在單點雲上,這種情況無論如何擴容,都會有瓶頸。他認為,未來“邊緣計算”的成熟可以解決這一問題。

邊緣計算是一種分佈式計算,將數據資料的處理、應用程序的運行和功能服務的實現,由網絡中心下放到網絡邊緣的節點上。這樣就可以把雲打散,就近接入不同節點,提供最近端服務。

全國網民在同時訪問微博時,可以就近訪問不同的節點。各個節點之間有一定的處理能力,處理完再上報給集中節點,這就大大減少了數據的匯聚和傳輸量,同時就近節點的訪問延遲也會縮短。

此外,邊緣計算支持數據本地處理,大流量業務本地卸載可以減輕回傳壓力,有效降低成本。

預計到2020年,每人每天平均將產生1.5GB的數據量。5G時代以後,微博、抖音等APP數據量會呈幾何性增長,帶寬的擴張卻是線性增長,所以必須利用“邊緣計算”調整網絡結構,讓帶寬增長的速度趕上數據增長的速度。

目前,“邊緣計算”還在發展階段,張峻愷認為,未來5年內將會完成布點建設。

*題圖來源於視覺中國。

相關推薦

推薦中...