上海2022年3月2日 /美通社/ -- 近日,憑借智能運維管理體系賦予云原生業務可觀測性能力以及保障千行百業數字化業務的高質量發展,天旦榮膺由BP商業伙伴頒發的“智能運維100強”。
云原生時代須要可觀測性能力
2021年是云原生技術的全面爆發之年,從底層平臺到上層應用,云原生技術重塑IT架構的同時,也對運維管理帶來挑戰。容器、微服務等技術盡管可以承載業務并發量的指數級增長,支持業務需求的頻繁變更,但隨著應用架構的不斷變化,一旦業務出現問題就難以精準定位到發生故障的節點,傳統被動響應式的運維管理模式顯得捉襟見肘。云原生環境下,新一代的業務運維管理需要更主動、更敏捷、更適應規模化管理的能力升級。
從傳統的APM產品到日志監控工具,云原生可觀測性概念在智能運維管理領域的熱度不斷提升。介于傳統的智能運維產品僅面向服務端,解決基礎運維問題,而云原生環境存在著復雜的分布式系統,需要盡可能多地收集所有系統組件的相關數據(包括云、容器、終端與應用等),實時評估業務的運行狀態。此外,大家都知道“Metrics、Tracing與Logging”是“可觀測性能力”的三大支柱,在云原生運維實踐中,必須建立統一的Metrics、Tracing與Logging規范,才能快速地發現問題,找到問題根因。
天旦“全景感知”的智能運維體系,守護數字業務生命力
從On Cloud到In Cloud,云原生2.0的時代已經來臨。面對敏捷的云原生業務,企業一方面需要應云而變,運用主動發現等可觀測性能力實現云原生環境下的智能故障診斷與根因分析;另一方面需要借助更敏捷、智能的網絡與業務運維管理產品以解決監控節點數量的成倍增長、監控數據采集難、海量數據處理瓶頸等規模化運維管理難題。為此,天旦通過一項核心技術、三大核心產品幫助企業快速構建全景感知的智能運維體系,通過一體化的性能監控管理靈活應對云原生應用的彈性擴縮與規模化集群,實現實時感知、敏捷擴展的運維管理能力新升級,守護數字業務生命力。
云原生環境,由于系統整體行為方式發生變化,導致為這些系統、應用提供的保障與服務也隨之改變。即使是智能運維產品也只是報告系統整體的運行狀況,被動地呈現“失敗”與“故障”。而隨著大量分布式系統、規模化的微服務部署之后,影響故障產生的因素可能出現在任意細微的節點,如何主動發現這些問題、調取影響故障的全路徑、詳細分析故障產生的原因就需要運用主動發現能力。
天旦全景感知的智能運維體系以核心的互聯數據技術為基礎,首先將云原生、混合云等環境中的網絡數據進行全量采集,其次通過分析與解碼,理解并還原數據的傳輸路徑、業務與上層應用的表達,將各種各樣的業務系統語言、網絡傳輸路徑等轉換成統一的格式,最后通過建立統一的Metrics、Tracing與Logging數據規范,綜合運用“依賴分析”、“剖析”與“排錯”等主動發現能力,通過指標實時呈現網絡與業務實時動態,調取模塊間的交互狀態,基于逐層下鉆分析獲取詳細的日志信息,實現智能故障診斷與根因分析。
傳統的智能運維管理已經無法適應云原生環境。智能運維(AIOps)的概念最早由Gartner提出,是指通過將機器學習等人工智能技術應用至運維管理過程中,自動地從海量數據中學習并總結規則,作出相應決策的運維方式。盡管智能運維管理技術改變了傳統的運維工作模式,將運維從繁瑣的故障排查流程中解放出來,但在云原生環境下,IT架構發生改變,無法感知與預測的因素越來越多,智能運維管理無法再單獨以運維的視角,而要融入開發與業務部門的視角,在具備主動發現能力的同時,運用全鏈路業務可觀測性能力與云網可觀測性能力保障網絡與業務系統的穩定。
天旦運用Cloud Probe云流量可觀測性采集產品將公有云、私有云、混合云、虛擬化、容器等環境中的網絡流量通過微探針、旁路探針、SDN引流等多種方式進行全量采集與集中管控,再通過互聯數據智能解碼引擎進行分析與處理,運用具備云網可觀測性能力的網絡性能管理NPM智能關聯中間件、網絡與應用交互各節點的邏輯訪問關系,綜合分析IT基礎設施指標與網絡指標,構建對云網環境的全景、立體式監測;運用具備業務可觀測性能力的業務性能管理BPC,通過全鏈路監控,提供四大指標與兩大維度,實時感知業務變化趨勢,實現單個業務請求全生命周期的觀測與分析,為云原生、混合云環境下的全鏈路業務監控提供保障。除此以外,全景感知的智能運維體系還能為企業提供安全審計、監管上報、科技績效管理等管理能力,實現以業務核心的綜合運維管理能力的新升級。
從恒豐銀行、臺州銀行、聯通支付到廈門國際銀行,“全景感知”的智能運維體系不僅助力眾多國內金融機構的數字化實踐,還在制造、醫療、政府、能源電力等眾多行業成功落地。隨著云原生技術的不斷發展、云原生應用程度的不斷加深,智能運維管理的難度也在不斷上升。除了需要應對新技術應用所帶來的挑戰外,各行業還需要面臨嚴峻的市場競爭、國際形勢變化等眾多考驗。在邁向云原生2.0的關鍵時期,天旦將持續以全景感知的智能運維產品體系為依托,運用統一可觀測性能力賦能企業的運維管理工作,為企業的數字化業務高質量發展保駕護航。