分佈式系統常見的容錯策略

通信科技 java文章分享 java文章分享 2017-08-29

服務不同，容錯策略往往也不同。

消費者根據配置的路由策略選擇某個目標地址之後，發起遠程服務調用，在此期間如果發生了遠程服務調用異常，則需要服務框架進行集群容錯，重新進行選路和調用。集群容錯是系統自動執行的，上層用戶並不需要關心底層的服務調用過程。

一、失敗自動切換（Failover）

服務調用失敗自動切換策略指的是當發生RPC調用異常時，重新選路，查找下一個可用的服務提供者。

服務發佈的時候，可用指定服務的集群容錯策略。消費者可用覆蓋服務提供者的通用配置，實現個性化的容錯策略。

Failover策略的設計思路如下：消費者路由操作完成之後，獲得目標地址，調用通信框架的消息發送接口發送請求，監聽服務端的應答。如果返回的結果是RPC調用異常（超時、流控、解碼失敗等系統異常），根據消費者集群容錯的策略進行容錯路由，如果是Failover，則重新返回到路由Handler的入口，從路由節點繼續執行。選路完成之後，對目標地址進行比對，防止重新路由到故障服務節點，過濾掉上次的故障服務提供者之後，調用通信框架的消息發送節課發送請求信息。

分佈式服務框架提供Failover容錯策略，但是用戶在使用時需要自己保證用對地方，下面是Failover策略的應用場景總結：

讀操作，因為通常是冪等的。
冪等性操作，保證調用1次與N次效果相同。

需要特別指出的是，失敗重試會增加服務調用時延，因此框架必須對失敗重試的次數做限制，通常默認是3，防止無限制重試導致服務調用時延不可控。

二、失敗通知（Failback）

在很多業務場景中個，消費者需要能夠獲取到服務調用失敗的具體信息，通過對失敗錯誤碼等異常信息的判斷，決定後續的執行策略，例如非冪等性的服務調用。

Failback的設計方案如下：服務框架獲取到服務提供者返回的RPC異常響應後，根據策略進行容錯。如果是Failback模式，則不再重試其他服務提供者，而是將RPC異常通知給消費者，由消費者捕獲異常進行後續處理。

三、失敗緩存（Failcache）

Failcache策略是失敗自動恢復的一種，在實際項目中他的應用場景如下：

服務有狀態路由，必須定點發送到指定的服務提供者。當發生鏈路中斷、流控等服務暫時不可用時，服務框架將消息臨時緩存起來，等待週期T，重新發送，知道服務提供者能夠正常處理該消息。
對時延要求不敏感的服務。系統服務調用失敗，通常是鏈路暫時不可用、服務流控、GC掛住服務提供者線程等，這種失敗不是永久性的失敗，他的恢復是可預期的。如果消費者對服務調用時延不敏感，可以考慮採用自動恢復模式，即先緩存，再等待，最後重試。
通知類服務。例如通知粉絲積分增長、記錄接口日誌等，對服務調用的實時性要求不高，可以容忍自動恢復帶來的時延增加。

為了保證可靠性，Failcache策略在設計的時候需要考慮如下幾個要素：

緩存時間、緩存對象上限數等需要作出限制，防止內存溢出。
緩存淘汰算法的選擇，是否支持用戶配置。
定是充實的週期T、充實的最大次數等需要作出限制並支持用戶指定。

重試達到最大上線仍失敗，需要丟棄消息，記錄異常日誌。

四、快速失敗（Failfast）

在業務高峰期，對於一些非核心的服務，希望只調用一次，失敗也不再重試，為重要的核心服務節約寶貴的運行資源。此時，快速失敗是個不錯的選擇。

快速失敗策略的設計比較簡單，獲取到服務調用異常之後，直接忽略異常，記錄異常日誌。

五、容錯策略擴展

無論服務框架默認支持多少種容錯策略，業務在實際使用中一定會有不適應的地方。通過開放容錯策略接口的方式，可以支持用戶自定義擴展容錯策略。

在集群容錯設計的時候，需要考慮擴展性名主要從以下幾個方面進行設計：

容錯接口的開放。
屏蔽底層細節，用戶定製簡單。
配置應該天生支持擴展，不要讓用戶擴展服務框架Schema。

相關推薦

'下一代Wi-Fi 6標準正式啟用，蘋果iPhone 11全系支持'

"9月16日，Wi-Fi聯盟官網宣佈正式啟動Wi-Fi 6認證計劃。據悉，該計劃旨在使採用下一代802.11ax Wi-Fi無線通信技術的設備達到既定標準。參與認證的設備製造商可以在他們的產品包裝上印上一個小小的Wi-Fi 6認證標誌。和上一代的Wi-Fi 技術標準相比，W...

Wi-Fi 技術 iPhone 三星集團康卡斯特智能手機思科系統通信高通英特爾 Galaxy Note 虛擬現實博通路由器美國電話電報公司華碩電腦小米手機 2019-09-19

'辦公手機號兩次被停機運營商：通話異常高頻被系統限制'

"近日，濟南多名市民向齊魯晚報⋅齊魯壹點反映，稱手機用著用著突然遭到運營商停機。聯繫運營商後，他們被告知停機是由於撥打“騷擾電話”導致。“我們打的都是正常電話，不是騷擾電話，而且停機前也沒通知一聲。”市民質疑。涉事的通信運營商迴應稱，用戶手機被停機是因系統檢測到通話異常高頻...

運營商信息安全跳槽那些事兒人生第一份工作通信山東齊魯晚報濟南 2019-09-18

'為大家解答一下，採購物聯網卡時常見的問題，避免踩坑'

"近期一段時間內，有許多盆友來資詢南淺物聯卡小編有關物聯網卡的價錢、實名認證、總流量這些難題，這種難題看上去雖似非常簡單普遍，可是略微不留意也會掉進某些虛假代理的騙局，做為權威的老牌物聯網卡商，小編對於物聯網卡對於購置全過程中較為普遍的難題，給大夥兒總的來說，僅參考！！ 1...

物聯網運營商中國移動通信智能家居技術中國聯通中國電信原汁原味的德系SUV 穿戴設備自行車 2019-09-18

'我國北斗系統在軌衛星已達39顆，開啟全球服務'

"“2020年，中國將如期完成北斗全球系統的全面建設，北斗應用也將加快推進，實現中國北斗、世界北斗、一流北斗的發展目標。”9月10日，北斗衛星導航系統總設計師楊長風在河南鄭州舉行的中國衛星導航與位置服務第八屆年會暨中國北斗應用大會上說。本次大會的主題是“北斗服務全球，融合創...

北斗衛星導航系統人造衛星 GPS 巴基斯坦技術測繪交通通信無人機烏干達柬埔寨地球緬甸我的第一部5G手機物聯網 2019-09-17

'辦公手機號變成騷擾電話運營商：通話異常高頻被系統限制'

"近日，濟南多名市民向齊魯晚報·齊魯壹點反映，稱手機用著用著突然遭到運營商停機。聯繫運營商後，他們被告知停機是由於撥打“騷擾電話”導致。“我們打的都是正常電話，不是騷擾電話，而且停機前也沒通知一聲。”市民質疑。涉事的通信運營商迴應稱，用戶手機被停機是因系統檢測到通話異常高頻...

運營商信息安全跳槽那些事兒人生第一份工作通信山東齊魯晚報濟南 2019-09-17

'重構能量想象，華為Mate30系列無線快充將成一大驚喜'

"9月19日，華為即將在德國慕尼黑舉辦新品發佈會，正式揭曉年度旗艦華為Mate30系列的神祕面紗。隨著發佈會日期的臨近，9月13日華為終端官方微博再次放出了全新預告視頻，配文“一觸即發的能量，讓自由盡情釋放。9月19日，與#華為Mate30#一起，#Rethinkpossi...

華為公司我的第一部5G手機 GPU 技術中央處理器攝影通信 2019-09-17

'基於FPGA的便攜式多路高精度採集系統設計'

"隨著電子信息技術的飛速發展，數據採集系統愈來愈廣泛地應用於工業控制、測量、通信和軍事等領域[1-2]。怎樣在體積受限、能耗受限、干擾大的環境中設計一個擁有多通道、高精度、海量數據採集能力的系統，仍具有一定的研究價值[3-5]。本文以採集旋翼槳葉表面貼裝的多路靈敏氣壓傳感器...

技術電信設計德州儀器通信 2019-09-17

'中國雲體系聯盟聯合舉辦中國5G鏈網產業峰會'

"2019年9月6日至7日，中國5G鏈網產業峰會在南京隆重召開。峰會由南京鏈網移動科技研究院、中國雲體系產業創新戰略聯盟、清華大學互聯網產業研究院、中國人民大學大數據區塊鏈與監管科技實驗室、香港應用科技研究院聯合實驗室、澳門科技大學和巴比特等機構聯合舉辦。峰會上發佈了一系列...

我的第一部5G手機區塊鏈信息安全南京技術數字貨幣運營商大數據中國人民大學經濟通信金融清華大學米爾頓·巴比特電腦知識產權第二十二屆中國農加工投洽會 2019-09-15

'中國北斗系統在軌衛星已達39顆，明年全面完成建設'

北斗衛星導航系統人造衛星 GPS 巴基斯坦技術測繪交通通信無人機烏干達柬埔寨緬甸我的第一部5G手機地球物聯網 2019-09-15

'我國北斗快速輔助定位系統用戶規模已突破3億'

"據新華社北京9月13日電我國自主研發的北斗快速輔助定位系統，填補了我國移動通信領域衛星導航輔助定位服務技術空白，用戶已突破3億規模。這是記者從中國兵器工業集團有限公司近日召開的2019年科技工作會議上了解到的消息。據瞭解，當前兵器工業集團裝備體系策劃與重大專項科研取得新突...

技術通信經濟知識產權人造衛星中國兵器工業集團大眾汽車 2019-09-15

'北斗系統開啟全球服務'

"第二十屆中國北京國際科技產業博覽會上展出的北斗衛星導航系統模型。新華社發“2020年，中國將如期完成北斗全球系統的全面建設，北斗應用也將加快推進，實現中國北斗、世界北斗、一流北斗的發展目標。”9月10日，北斗衛星導航系統總設計師楊長風在河南鄭州舉行的中國衛星導航與位置服務...

北斗衛星導航系統人造衛星 GPS 巴基斯坦測繪技術交通第二十二屆中國農加工投洽會無人機柬埔寨物聯網緬甸烏干達通信我的第一部5G手機 2019-09-15

'北斗系統開啟全球服務定位精度將與美國GPS相媲美'

"我國北斗系統在軌衛星已達39顆，明年全面完成建設北斗系統開啟全球服務第二十屆中國北京國際科技產業博覽會上展出的北斗衛星導航系統模型。新華社發“2020年，中國將如期完成北斗全球系統的全面建設，北斗應用也將加快推進，實現中國北斗、世界北斗、一流北斗的發展目標。”9月10日，...

北斗衛星導航系統 GPS 人造衛星巴基斯坦測繪技術地球通信烏干達交通柬埔寨第二十二屆中國農加工投洽會無人機緬甸我的第一部5G手機物聯網經濟 2019-09-15

'北斗系統開啟全球服務定位精度將與美國GPS媲美'

北斗衛星導航系統 GPS 人造衛星巴基斯坦測繪技術通信交通第二十二屆中國農加工投洽會烏干達地球柬埔寨我的第一部5G手機緬甸無人機物聯網經濟 2019-09-15

'5G手機密集問世低價策略背後都隱藏哪些不為人知紅利'

"在華為OV之後，中國移動也推出了自己的首款5G手機，值得注意的是，這批已上市的5G手機價格普遍低於此前市場的預期。在5G手機問世前，市場普遍預測首批5G手機的價格在8000元以上，而目前各廠商推出的5G手機價格大多在3000至6000元。有觀點認為，這是手機廠商為了搶奪5...

我的第一部5G手機運營商華為公司華為Mate 電信中國移動勁拓股份 iQOO618強悍單品推薦創新科技技術 OPPO 通信 Galaxy Note 三星集團華為榮耀小米手機 2019-09-15

'我國自主研發的北斗快速輔助定位系統用戶規模已突破3億'

"新華社北京9月13日電（記者胡喆）我國自主研發的北斗快速輔助定位系統，填補了我國移動通信領域衛星導航輔助定位服務技術空白，用戶已突破3億規模。這是記者從中國兵器工業集團有限公司近日召開的2019年科技工作會議上了解到的消息。據瞭解，當前兵器工業集團裝備體系策劃與重大專項科...

技術通信人造衛星經濟設計中國兵器工業集團知識產權十三五 2019-09-14

'遊資機構合力上板中興通訊機構成都系淨買入光環新網'

"指數集體收漲板塊全線飄紅遊資機構合力上板中興通訊1733.23。盤面上，板塊全線飄紅，科技題材全天活躍，帶動市場情緒回暖，行業板塊漲幅靠前的有邊緣計算、國產操作系統、通信設備。昨日科技板塊在午後急速上行，帶動了市場整體氛圍，其中5G核心股中興通訊(000063)全天逐步...

中興通訊銀河證券國泰君安證券龍虎榜光環新網投資成都體育鄭煤機華東電腦九鼎新材紹興我的第一部5G手機中投公司海通證券浙江稠州職業籃球俱樂部漢麻產業通信廣州上海 2019-09-14

'三星5G佈局“十年磨一劍”Note10系列震撼首銷搶佔5G市場'

"2019年，5G強勢來襲！若要給2019年最高頻詞彙弄一個榜單，5G絕對可以躋身前三甲。在這股5G浪潮下，越來越多企業投入競爭戰，作為與消費者接觸最密切的產品，5G手機成為了眾人目光的焦點所在。8月21日，三星在北京召開了三星Galaxy Note10系列新品發佈會，正式...

我的第一部5G手機三星集團運營商技術中國聯通通信韓國中國電信藍牙人生第一份工作虛擬現實人民日報無人駕駛 2019-09-14

'國家郵政局局長：加快建設中國快遞業全球服務體系'

"億歐物流9月12日消息，在9月10日舉辦的第三屆中國（杭州）國際快遞業大會上，國家郵政局局長馬軍勝表示，要加快我國快遞業“走出去”步伐，逐步構建起一個“以中國為中心，連接世界各大洲，通達主要目標市場”的全球快遞服務體系。對於我國快遞業如何更好地“走出去”，馬軍勝提出四點...

馬軍勝雲計算技術大數據杭州金融區塊鏈通信 2019-09-14

'北斗超GPS，北斗快速輔助定位系統用戶突破3億，趕超美國不是夢'

"歐界報道：上世紀90年發生"銀河號"事件後，我國就開始發力導航衛星領域，隨著北斗的逐漸成熟，我國在導航衛星領域的發展已經越來越強，無需以來其他國家，就連日本都對此表示稱讚。一直以來，美國在全球衛星定位系統領域都處於遙遙領先的地位，而我國直到2000年才發射第一顆定位衛星，...

GPS 人造衛星技術通信日本硬件大眾汽車經濟 2019-09-14

'射頻前端與基帶芯片系統級整合高通持續賦能全球5G發展'

"5G難，難在系統級工程能力的構建。在每個技術驅動的次時代，都要經歷產業從出生萌芽到艱難成熟的蛻變。按照3GPP的定義，5G是迄今為止最大的一次通信技術升級，甚至超越了通信行業本身範疇，與想象力匹配的是5G商用難度升級。5G產業需從底層地基開始構建，毫不誇張地說，芯片級能力...

我的第一部5G手機高通智能手機技術通信運營商設計軟件硬件設計模式韓國 2019-09-14

推薦中...