(CWW)中國移動副總經(jīng)理李慧鏑在中國移動2021年網(wǎng)絡工作會議上提出:“‘十四五’期間,以構(gòu)建‘高效、智能、簡潔、協(xié)同’的新型網(wǎng)絡運營體系為目標,全力推動數(shù)智化轉(zhuǎn)型,充分利用大數(shù)據(jù)、人工智能等技術(shù)提升網(wǎng)絡自動化、智能化運營水平,到2025年實現(xiàn)L4級‘自動駕駛網(wǎng)絡’;全面實現(xiàn)高質(zhì)量發(fā)展,網(wǎng)絡質(zhì)量、運營效益、響應效率持續(xù)保持行業(yè)領(lǐng)先,達到世界一流水平。”
比照中國移動集團發(fā)展方向,廣西移動立足廣西省內(nèi)Diameter信令網(wǎng)維護現(xiàn)狀,借助大數(shù)據(jù)及智能算法技術(shù),著力提升網(wǎng)絡維護的數(shù)智化能力,從而實現(xiàn)向主動運維的轉(zhuǎn)型。
Diameter信令網(wǎng)數(shù)智化維護工具的搭建
【資料圖】
經(jīng)過分析,廣西移動發(fā)現(xiàn)Diameter信令網(wǎng)維護工作中的“痛點”主要集中在以下幾個方面。第一,故障定位遲緩,在現(xiàn)有維護模式下,告警信息數(shù)量巨大,容易造成人工甄別費時費力,導致從告警發(fā)生到故障定位的過程遲緩。第二,處理決策遲緩,信令網(wǎng)涉及網(wǎng)元眾多,目前缺乏對復雜問題的交叉關(guān)聯(lián)自動智能分析,以致對重大網(wǎng)絡隱患的預防能力不足。在隱患出現(xiàn)時,較難快速作出對策選擇。第三,故障處理遲緩,網(wǎng)絡中設備眾多,95%的運維流程和作業(yè)節(jié)點都需要人為干預,“故障驅(qū)動”的被動運維影響業(yè)務體驗,且運維成本居高不下。
圍繞維護環(huán)節(jié)數(shù)智化能力的提升,廣西移動從兩個方面入手推動Diameter信令網(wǎng)維護的數(shù)智化轉(zhuǎn)型,即數(shù)據(jù)可視化、大數(shù)據(jù)及AI智能算法,并將Diameter信令網(wǎng)可視化智能分析工具作為本次實踐的重要依托。
可視化的信令拓撲
廣西移動信令網(wǎng)可視化分析工具主要包括廣西移動Diameter信令鏈路實時告警監(jiān)控及查詢、廣西省內(nèi)DRA網(wǎng)元及鏈路實時運行監(jiān)控、告警及業(yè)務異常查詢3個部分。
Diameter信令鏈路實時告警監(jiān)控及查詢主要包括以下內(nèi)容:第一,信令鏈路拓撲圖可依據(jù)維護需要,按照地市、網(wǎng)元、廠家的不同維度進行展示,以便在出現(xiàn)信令鏈路告警時,以最便捷的方式,從不同維度找到與出現(xiàn)信令鏈路告警相關(guān)的對端網(wǎng)元及信令鏈路;第二,信令鏈路告警可細化至信令鏈路組及其中的信令鏈路告警,并用不同顏色標記當前告警級別;第三,目前覆蓋的高技能及業(yè)務異常場景,包括單鏈路告警定位、鏈路組告警定位、信令網(wǎng)元退服板卡定位、故障CE定位、業(yè)務流量突增預警、Diameter接口負荷預警;第四,信令鏈路拓撲圖自動生成,可自動感知網(wǎng)元的增減,并在拓撲圖中實時更新。
廣西省內(nèi)DRA網(wǎng)元及鏈路實時運行監(jiān)控、告警及業(yè)務異常查詢,包括總體設備監(jiān)控指數(shù)、設備資源使用率、4G信令轉(zhuǎn)發(fā)成功率、5G EPSFB(網(wǎng)絡側(cè)語音回落)會話查詢成功率。
告警及業(yè)務異常查詢區(qū)內(nèi)容可配置,維護人員可選擇運維工作中需要重點關(guān)注的告警項。
廣西移動信令網(wǎng)可視化分析工具可以極大地提高對信令告警的識別及定位速度,簡化故障定位的查詢工作。基于微服務架構(gòu)的智能化工具廣西移動信令網(wǎng)可視化分析工具主要采用微服務分層架構(gòu),系統(tǒng)整體上分為5層,具體如圖1所示。
圖1廣西移動信令網(wǎng)可視化分析工具的系統(tǒng)分層
微服務架構(gòu)的特點是針對特定服務發(fā)布,影響小、風險小、成本低;方便頻繁發(fā)布版本,快速交付需求;可實現(xiàn)低成本擴容、彈性伸縮,適應云環(huán)境。廣西移動信令網(wǎng)智能化維護之所以采用該微服務架構(gòu),就是考慮到應對維護需求和網(wǎng)絡 結(jié)構(gòu)的持續(xù)優(yōu)化要求,可以對該智能化工具持續(xù)進行擴展。
借助AI模型,提升告警預警能力
通過對Diameter信令網(wǎng)運行及告警數(shù)據(jù)的實時收集,形成了大量的維護數(shù)據(jù)信息,如何從中挖掘有價值的信息,對網(wǎng)絡運行狀態(tài)進行預警,成 為有效降低網(wǎng)絡運行風險的關(guān)鍵。為此,廣西移動借鑒小波變換(wavelet transform,WT)模型,根據(jù)歷史數(shù)據(jù),實現(xiàn)對未來數(shù)據(jù)的趨勢預測,將無形的業(yè)務趨勢實時、可視化地呈現(xiàn)于保障指揮室。在重要會議、重大活動、重要節(jié)日和應急保障中,實現(xiàn)業(yè)務變化與趨勢預測的實時比較,為決策分析提供參考,有助于管理層觀察、評估、決策和調(diào)度網(wǎng)絡業(yè)務, 提升業(yè)務保障能力。
小波變換是一種新的變換分析方法,繼承和發(fā)展了短 時傅立葉變換局部化的思想,同時又克服了窗口大小不隨頻 率變化等缺點,能夠提供一個隨頻率改變的“時間-頻率”窗口,是進行信號時頻分析和處理的理想工具。它的主要特點是通過變換充分突出問題某些方面的特征,能對時間(空間)頻率進行局部化分析,通過伸縮平移運算對信號(函數(shù))逐步進行多尺度細化,最終達到高頻處時間細分、低頻處頻 率細分,能自動適應時頻信號分析的要求,從而聚焦至信號 的任意細節(jié),解決了傅立葉變換困難問題,成為繼傅立葉變換以來在科學方法上的重大突破。
借助AI模型,結(jié)合專家知識庫,可以有效解決處置決策遲緩的問題。通過大數(shù)據(jù)技術(shù)完成對原始數(shù)據(jù)特征的自動檢 測,可強化數(shù)據(jù)聚合;綜合運用大數(shù)據(jù)技術(shù)中的批處理、實時計算和交互式計算的能力,可有效挖掘數(shù)據(jù)的價值;結(jié)合專家經(jīng)驗完善并優(yōu)化AI算法,可持續(xù)迭代升級,不斷沉淀經(jīng)驗,始終保持告警的精確性。
設計符合自身維護要求的網(wǎng)絡健康度評估方法
設備健康度評估是指對設備運行狀態(tài)進行評估,以確定設備當前的工作狀態(tài)、性能和可靠性水平。通過設備健康度評估,維護人員可以快速識別潛在的故障和問題,并采取相應措施,提高設備的可靠性和效率。同時,通過可配置的規(guī)則,維護人員也可以及時發(fā)現(xiàn)重點關(guān)注的性能指標對網(wǎng)絡的影響。
設備健康度評估量化是指通過對設備運行數(shù)據(jù)和狀態(tài)的監(jiān)測、分析,結(jié)合設備設計參數(shù)和使用壽命等因素,采用數(shù)學模型和方法,對設備的健康狀況進行評估,并給出定量的 健康指標或評分。
廣西Diameter信令網(wǎng)智能維護工具主要從健康指標的緊急性和重要性兩個維度進行設置,以便及時、全面地反映設備運行狀況。
系統(tǒng)建議滿分為100分,不設加分項。每個檢查項的得分需要考慮該檢查項的緊急度和重要性,緊急度按高中低分別對應3、2、1;扣分按照緊急度與重要性的乘積計算,比如某項指標的緊急度為3、重要性為15,那么該項指標不合格時將扣除45分。如果某些檢查項的不合格結(jié)果是因為健康檢查程序沒有執(zhí)行造成的,則可調(diào)整為合格。
綜合上述檢查項的總分,形成當前設備健康度得分。為使設備健康度一目了然,對不同的健康度分數(shù)段用不同顏色 進行標記,評估綜合得分與健康度的對應關(guān)系如下。第一, ≥90,標記綠色,表示健康:設備正常運轉(zhuǎn),未出現(xiàn)任何故障或異常情況,性能表現(xiàn)優(yōu)異。第二,75~90,標記黃色,表示亞健康:設備出現(xiàn)一些故障或異常情況,但仍可正常運轉(zhuǎn),性能表現(xiàn)稍有下降。第三,60~75,標記紅色,表示故障狀態(tài):設備出現(xiàn)多次故障或異常情況,需要頻繁維修或更換部件, 性能表現(xiàn)明顯下降。第四,<60,不再顯示得分,表示嚴重故障:設備常常出現(xiàn)故障或異常情況,無法正常運轉(zhuǎn),需要大量時間和費用進行修理或更換,性能表現(xiàn)嚴重下降。
為了便于采用大數(shù)據(jù)對大量的信令維護數(shù)據(jù)進行處理,需要對現(xiàn)有信令數(shù)據(jù)格式中的節(jié)點信息進行規(guī)范,以滿足后續(xù)處理需要。根據(jù)廣西移動的信令網(wǎng)結(jié)構(gòu)特點、信令點命名 規(guī)范,所有鏈路命名均按照統(tǒng)一長度、統(tǒng)一關(guān)鍵信息排序,采用統(tǒng)一命名規(guī)則,以方便后續(xù)的數(shù)據(jù)處理。
智能化維護實踐的意義
在引入信令網(wǎng)智能維護工具后,廣西移動Diameter信令網(wǎng)維護的故障識別、定位、預測能力有了明顯改善,推動服務質(zhì)量持續(xù)提升,主要體現(xiàn)在如下方面:可視化分析提升了告警識別能力,實現(xiàn)了多維度監(jiān)控,可快速全面掌控網(wǎng)絡運行狀 況;借助大數(shù)據(jù)可提升故障分析能力,通過多維度交叉智能分析實現(xiàn)了對CE設備重大故障的分析定位;借助AI模型提升預測預警能力,實現(xiàn)了從被動運維向主動運維的轉(zhuǎn)型。
同時,引入智能化維護理念還助力廣西移動積極融入中國移動集團的“自動駕駛網(wǎng)絡”演進戰(zhàn)略,增強自身創(chuàng)新能力,提升運維效率,充分挖掘現(xiàn)有網(wǎng)絡能力,助力實現(xiàn)可持續(xù)發(fā)展。
關(guān)鍵詞: