信通院發布首份《中國混沌工程調查報告》,京東云成典型案例
來源:中金在線
?
2021-12-10 22:47:08
2021年11月,中國信通院發布國內首個《中國混沌工程調查報告》,基于混沌工程業界現狀,探索并提升國內云業務系統穩定性。作為對外輸出混沌工程能力的先行者,京東云加入信通院成立的國內首個混沌工程實驗室,參與混沌工程標準編寫,并貢獻了混沌工程的最佳實踐。
今年首次開啟“晚8點”模式的京東11.11,迎來持續脈沖式流量高峰,對系統在持續高壓環境下的穩定性有極高要求。借助領先的混沌工程能力,京東云不僅以超高彈性應對海量并發,保障流量高峰的平穩順滑,還推進技術備戰常態化、自動化,減少25%的備戰時間和人力投入。
搞破壞,混沌工程的穩定之道
“系統越復雜,越脆弱”。企業在數字化轉型中擁抱云計算、大數據、AI等新技術的同時,容易出現系統架構復雜度拉升、調用鏈增長、依賴關系復雜等問題。混沌工程被認為是檢驗、增強系統穩定性的不二選擇。
混沌工程為揭示系統缺陷而進行破壞性試實驗,提前探知系統風險,通過架構優化和運維模式改進來解決系統風險,真正建立系統的韌性架構,降低企業損失。
在混沌工程的理論中,將正常的系統數據假設為“穩定狀態”,參照真實環境的多類型事件注入故障,如服務器崩潰、硬盤故障、網絡連接斷開等,并直接面向生產環境的實際流量進行破壞性實驗。通過“穩定狀態”的變化來反駁假設,發現并修復問題。
在實施過程中破壞系統穩定狀態的難度越大,即可對系統穩定性樹立更強的信心。一旦發現缺陷,就能定向優化改進,避免在系統規模化后缺陷被放大。
不同于業界熟知的故障注入測試,混沌工程不僅制造故障來測試系統反饋,還基于不可預知性模擬各類異常場景,進行生產上各層次的流量切換演練。
500)this.width=500" align="center" hspace=10 vspace=10 alt="信通院發布首份《中國混沌工程調查報告》,京東云成典型案例">
自從Netflix開源ChaosMonkey,混沌工程在全球多家頂級科技企業的實踐,充分驗證其在穩定性領域的作用。伴隨云服務逐漸成為基礎設施,穩定性被不斷強調,混沌工程正在憑借“搞破壞”的工程理念成為云服務的穩定之道。
助力企業引入混沌工程,京東云推出穩定性主動管理系統云泰
“平時多演練、戰時少挨槍”。京東云在多年的京東618、京東11.11磨練中,成為混沌工程的領先實踐者和受益者,從單業務場景故障到整機房斷電宕機…..京東云完美通過各類超「變態」場景考驗。
基于京東體系多年積累的混沌工程能力,京東云沉淀出穩定性主動管理系統——云泰,對外輸出可見、可查、可管、可控的穩定性解決方案,提供穩定性主動測算、故障注入與演練、全鏈路壓測、紅藍對抗和基于“穩定性基線”的評分服務等核心功能。
通過穩態監控功能,云泰可保持對核心資源、服務的數據觀測,支持完成主動測算系統穩定性,從實時和周期性完成健康度、異常趨勢及SLI可用性測算,到實時感知突發事件和異常事件,快速定位系統故障等日常需求,云泰系統都全面覆蓋。
500)this.width=500" align="center" hspace=10 vspace=10 alt="信通院發布首份《中國混沌工程調查報告》,京東云成典型案例">
同時云泰系統的故障注入與演練功能,支持引入指定的演練對象后,在演練大廳選擇故障類型、編排演練場景,定時執行故障演練,并通過對關聯業務、基礎資源等對象“穩定狀態”的實時監控,快速完成故障定位,檢驗系統的穩定性能。
相比手動演練易出現操作故障、不可重復執行、無歷史記錄等問題,云泰的演練平臺不僅設有種類豐富的故障,可高效完成場景編排,還能自動、定時、重復執行,并結合實時監控、實時定位和完善的歷史記錄幫助全面探索系統穩定性。
500)this.width=500" align="center" hspace=10 vspace=10 alt="信通院發布首份《中國混沌工程調查報告》,京東云成典型案例">
針對傳統性能測試經濟成本高、技術難度大、測試周期長的痛點,云泰系統內置了全鏈路壓測平臺,壓測集群支持百萬級并發,且能按需、實時擴容,其高性能、低成本、可擴展和支持復雜場景的特性,可以為多個行業提供優質的性能測試服務,尤其是海量高并發、波峰波谷現象明顯的電商、游戲等領域。
全面輸出,京東云服務產業數字化
作為京東集團面向政企客戶輸出技術的核心平臺,京東云致力于打造“更懂產業的云”,運用京東數智化實戰中積累的技術能力,助力產業數字化升級。
以戰養戰,混沌工程不僅在京東內部廣泛應用,也在持續對外輸出,推進提升產業數字化過程中的系統穩定性。
以2021年服貿會為例,京東云再度作為官方技術服務商,提供數智化技術支持與運營服務保障,繼助力打造全球聞名的“永不落幕服貿會”后,驅動展客商體驗全面升級。服貿會開幕前,京東云正是基于混沌工程,在6個場景下對直播、2D、3D、官網、智能推薦和預約購票等多個子系統的部署情況進行故障模擬,完成破壞性演練工作,保障服貿會相關系統的穩定性和高可用。
在云服務成為產業數字化基礎設施的當下,作為最懂產業的云,京東云將繼續積極參與混沌工程實驗室項目,為普及混沌工程貢獻有生力量,同時持續輸出京東云的混沌工程成功經驗,助力產業數字化過程中IT系統穩定性的持續提升。
今年首次開啟“晚8點”模式的京東11.11,迎來持續脈沖式流量高峰,對系統在持續高壓環境下的穩定性有極高要求。借助領先的混沌工程能力,京東云不僅以超高彈性應對海量并發,保障流量高峰的平穩順滑,還推進技術備戰常態化、自動化,減少25%的備戰時間和人力投入。
搞破壞,混沌工程的穩定之道
“系統越復雜,越脆弱”。企業在數字化轉型中擁抱云計算、大數據、AI等新技術的同時,容易出現系統架構復雜度拉升、調用鏈增長、依賴關系復雜等問題。混沌工程被認為是檢驗、增強系統穩定性的不二選擇。
混沌工程為揭示系統缺陷而進行破壞性試實驗,提前探知系統風險,通過架構優化和運維模式改進來解決系統風險,真正建立系統的韌性架構,降低企業損失。
在混沌工程的理論中,將正常的系統數據假設為“穩定狀態”,參照真實環境的多類型事件注入故障,如服務器崩潰、硬盤故障、網絡連接斷開等,并直接面向生產環境的實際流量進行破壞性實驗。通過“穩定狀態”的變化來反駁假設,發現并修復問題。
在實施過程中破壞系統穩定狀態的難度越大,即可對系統穩定性樹立更強的信心。一旦發現缺陷,就能定向優化改進,避免在系統規模化后缺陷被放大。
不同于業界熟知的故障注入測試,混沌工程不僅制造故障來測試系統反饋,還基于不可預知性模擬各類異常場景,進行生產上各層次的流量切換演練。
自從Netflix開源ChaosMonkey,混沌工程在全球多家頂級科技企業的實踐,充分驗證其在穩定性領域的作用。伴隨云服務逐漸成為基礎設施,穩定性被不斷強調,混沌工程正在憑借“搞破壞”的工程理念成為云服務的穩定之道。
助力企業引入混沌工程,京東云推出穩定性主動管理系統云泰
“平時多演練、戰時少挨槍”。京東云在多年的京東618、京東11.11磨練中,成為混沌工程的領先實踐者和受益者,從單業務場景故障到整機房斷電宕機…..京東云完美通過各類超「變態」場景考驗。
基于京東體系多年積累的混沌工程能力,京東云沉淀出穩定性主動管理系統——云泰,對外輸出可見、可查、可管、可控的穩定性解決方案,提供穩定性主動測算、故障注入與演練、全鏈路壓測、紅藍對抗和基于“穩定性基線”的評分服務等核心功能。
通過穩態監控功能,云泰可保持對核心資源、服務的數據觀測,支持完成主動測算系統穩定性,從實時和周期性完成健康度、異常趨勢及SLI可用性測算,到實時感知突發事件和異常事件,快速定位系統故障等日常需求,云泰系統都全面覆蓋。
同時云泰系統的故障注入與演練功能,支持引入指定的演練對象后,在演練大廳選擇故障類型、編排演練場景,定時執行故障演練,并通過對關聯業務、基礎資源等對象“穩定狀態”的實時監控,快速完成故障定位,檢驗系統的穩定性能。
相比手動演練易出現操作故障、不可重復執行、無歷史記錄等問題,云泰的演練平臺不僅設有種類豐富的故障,可高效完成場景編排,還能自動、定時、重復執行,并結合實時監控、實時定位和完善的歷史記錄幫助全面探索系統穩定性。
針對傳統性能測試經濟成本高、技術難度大、測試周期長的痛點,云泰系統內置了全鏈路壓測平臺,壓測集群支持百萬級并發,且能按需、實時擴容,其高性能、低成本、可擴展和支持復雜場景的特性,可以為多個行業提供優質的性能測試服務,尤其是海量高并發、波峰波谷現象明顯的電商、游戲等領域。
全面輸出,京東云服務產業數字化
作為京東集團面向政企客戶輸出技術的核心平臺,京東云致力于打造“更懂產業的云”,運用京東數智化實戰中積累的技術能力,助力產業數字化升級。
以戰養戰,混沌工程不僅在京東內部廣泛應用,也在持續對外輸出,推進提升產業數字化過程中的系統穩定性。
以2021年服貿會為例,京東云再度作為官方技術服務商,提供數智化技術支持與運營服務保障,繼助力打造全球聞名的“永不落幕服貿會”后,驅動展客商體驗全面升級。服貿會開幕前,京東云正是基于混沌工程,在6個場景下對直播、2D、3D、官網、智能推薦和預約購票等多個子系統的部署情況進行故障模擬,完成破壞性演練工作,保障服貿會相關系統的穩定性和高可用。
在云服務成為產業數字化基礎設施的當下,作為最懂產業的云,京東云將繼續積極參與混沌工程實驗室項目,為普及混沌工程貢獻有生力量,同時持續輸出京東云的混沌工程成功經驗,助力產業數字化過程中IT系統穩定性的持續提升。