(CWW)隨著電信運營商“CHBN四輪驅動”戰略發展,傳輸網絡承載的無線2G/3G/4G/5G、家寬業務、集客專線及其他新型業務的故障快速恢復面臨更高要求;同時隨著業務發展,傳輸網絡規模本身也日益龐大,以筆者所在的浙江移動為例,全省有16萬套傳輸設備、223萬千米光纜、66萬條傳輸電路,日常運維壓力與日俱增。而傳統的傳輸網絡運維模式流程復雜,主要依靠運維人員現場搶修故障,運維成本較高,故障恢復的及時性難以得到保障;并且缺少可視化過程呈現,無法快速確定故障影響范圍、遠程調度和高效搶通業務。
(資料圖片)
本研究主要探索傳輸自智網絡運維新模式,通過打造自動化的傳輸業務自恢復能力,實現傳輸業務故障域內自愈、光纜故障跳纖輔助搶通,同時通過跨專業、跨網絡、跨平臺的能力共享,拉通其他故障域相關系統,實現故障識別、故障定位、方案處理、故障處置的全流程自動化和可視化,進而實現CHBN不同業務場景下的傳輸故障自愈,讓一線故障處理人員真正做到“故障無感”,滿足運營商自智網絡發展要求,踐行降本增效理念,節省日常運維成本。
核心技術能力
傳統的傳輸故障搶修采用線下面向人的“遠程專家經驗+現場人工搶修”模式,需要通過人工翻閱操作指導手冊進行遠程調度,且需要監控人員、傳輸運維專家、外線維護及客服人員多輪交互溝通。為此本研究將傳輸故障搶修模式創新升級為線上面向機器的自動調用模式,系統基于AI自學習能力自動生成搶修方案,完成故障搶通。本研究所涉及的創新技術包括流程自動化、故障可視化、方案智輸出、業務自恢復、能力原子化5項核心能力。
流程自動化:當前運營商傳輸網故障處理只有故障識別、故障定位實現自動化,故障方案、故障搶修均需要人工完成。代維人員接到故障工單后需要通過現場熔纖、跳纖、更換硬件等操作修復故障,此過程完全依賴現場代維人員的經驗。因此,筆者基于自智網絡設想提出了“全流程自動化”的解決方案,首創PTN遠程業務自愈、現場跳纖方案兩項核心能力,滿足故障“先搶通,后恢復”目標,實現故障識別、定位、處置、修復全流程自動化?!肮收献孕迯汀笨缦到y交互模型如圖1所示。
圖1“故障自修復”跨系統交互模型無感化
業務自愈核心能力,先于故障派單系統在告警預處理階段實現業務“無感”恢復,針對一線代維真正實現故障面向自智網絡的傳輸故障自愈系統研究。
現場跳纖輔助能力,針對無法遠程業務自愈的場景,通過現場跳纖輔助能力自動生成跳纖搶通方案,并自動派單至一線搶修人員,實現全程自動化、線上化。
故障可視化:通過對傳輸設備、傳輸光纜進行數據采集和錄入,映射成數字孿生實體,實現故障的可視化和模擬仿真。在傳輸設備方面,利用網管數據驅動,將抽象的網元、告警、業務等信息具象化,然后利用傳輸光纜NFC、RFID等啞資源數據采集新模式,將光纜、告警等資源映射到GIS地圖,最終構建數字化、可視化智慧運維地圖,實現故障全程可管可視。
方案智輸出:基于上述數字化仿真設備和光纜資源,利用告警信息聚類分析,提供自動匯聚故障信息及處理方案能力,結合系統專家經驗庫積累的歷史故障搶修場景,通過AI智能研判,匹配歷史方案庫,自動輸出傳輸故障光纜跳纖搶通方案和可用纖芯信息。
為此本研究首創基于中斷光路和中斷光纜的迂回路由最小跳數跳纖算法,可實現無法同纜調纖場景的故障搶通?;谝炎R別的傳輸中斷告警信息及相關光路、光纜信息,通過通用路由組織規范,輸出異路由光纜跳纖搶通方案。該算法較傳統同纜調纖方案適用范圍更廣,成功率更高。
業務自恢復:針對政企專線等高價值用戶,通過對業務狀態實時感知,結合隨流檢測性能數據、SRv6重路由技術,快速自動恢復中斷業務,在保證SLA的情況下,維持業務“永久在線”,提升用戶體驗,簡化業務運維。
當前主流傳輸設備廠家只具備SPN重路由能力,為此本研究首創PTN業務一鍵重路由能力,基于故障管理系統已定界定位的故障根因,自動關聯相關傳輸電路,自學習故障搶修案例庫,自動導航生成故障搶修方案,并一鍵自動下發激活至設備完成故障修復,滿足高價值用戶、亞運重保等場景需求。
能力原子化:在上述平臺核心能力探索建設的基礎上,筆者提出“大平臺、小工具”相結合的模式,通過能力解耦,實現現有能力的原子化,并能共享給外部平臺。目前已實現基于ChatOps機器人等小工具應用,通過告警狀態和業務信息自助獲取,實現網絡能力實時共享,并已完成傳輸日常光路開環故障自助查詢、傳輸光纜故障影響業務查詢等機器人部署,賦能一線代維人員自助查詢使用。各核心能力平臺與ChatOps機器人交互模型如圖2所示。
圖2 各核心能力平臺與ChatOps機器人交互模型
總結
通過上述流程自動化、故障可視化、方案智輸出、業務自恢復、能力原子化5項核心能力的部署,本研究在浙江移動已實現系統上線,覆蓋無線、家客、集客及傳輸等12類已知故障場景,截至目前共準確輸出跳纖搶通方案59 0 4個,實現業務自愈5 61次,有效支撐了運營商日常故障處置和重保場景保障,快速實現傳輸故障搶通修復。另外,通過核心能力解耦,傳輸光路開環通報、光纜/設備承載業務查詢等ChatOps機器人支撐一線人員自助查詢1萬余次。通過上述傳輸故障自愈系統和ChatOps機器人的應用,浙江移動在傳輸故障處置效率、業務恢復時長等方面有了較大改善,在自智網絡實踐方面積累了一定經驗,為運營商網絡運維模式變革探索出了新的路徑。