C114訊 9月11日消息(岳明)數(shù)字中國建設(shè)如火如荼,企業(yè)業(yè)務(wù)與新一代信息技術(shù)深度融合,ICT基礎(chǔ)設(shè)施的高效運轉(zhuǎn)已逐步轉(zhuǎn)變?yōu)槠髽I(yè)發(fā)展的核心競爭力。隨著ICT基礎(chǔ)架構(gòu)愈發(fā)龐大、復(fù)雜,運維工作面臨著規(guī);(fù)雜化、智能化等挑戰(zhàn)。據(jù)Gartner預(yù)測,到2025年部署在云原生平臺的IT系統(tǒng)將增至95%,IT運維模式革新和運維平臺轉(zhuǎn)型已成為大勢所趨。
新華三集團作為中國IT統(tǒng)一運維軟件市場上的“五冠王”,憑借創(chuàng)新實力領(lǐng)跑。新華三集團智能管理與運維產(chǎn)品線總經(jīng)理敖襄橋在接受C114采訪時指出,智能運維強調(diào)的是AI賦能,通過自動化和預(yù)測分析來減少人工干預(yù),提高IT運維的效率和效果,而統(tǒng)一平臺則是實現(xiàn)變革的基礎(chǔ)。
新華三集團智能管理與運維產(chǎn)品線總經(jīng)理 敖襄橋
正是基于對產(chǎn)業(yè)技術(shù)變革的深刻洞察,在2023領(lǐng)航者峰會上,新華三集團重磅發(fā)布U-Center5.0統(tǒng)一運維平臺,面向云智原生時代的企業(yè)運維新需求,U-Center基于AI能力,以“統(tǒng)一門戶、統(tǒng)一告警、統(tǒng)一資源、統(tǒng)一流程、統(tǒng)一分析”五大特點,重塑智能運維新模式,助力百行百業(yè)用戶持續(xù)降低基礎(chǔ)設(shè)施與應(yīng)用的統(tǒng)一運維復(fù)雜度,從容迎接智能化變革。
瞄準(zhǔn)客戶痛點
敖襄橋指出,“統(tǒng)一”是U-Center5.0的核心關(guān)鍵詞。“我們在與很多客戶的交流中發(fā)現(xiàn),統(tǒng)一是客戶比較明顯的痛點。在客戶的運維系統(tǒng)中,安全域、網(wǎng)絡(luò)域、計算域等都可能有特定的運維軟件,而且都是割裂的,數(shù)據(jù)無法拉通,問題定位復(fù)雜,運維人員會面臨很多困擾。”
能不能把按照功能分域,把相互獨立的運維系統(tǒng)拉通,進一步降低運維復(fù)雜度呢?新華三集團對U-Center這一廣受市場與客戶認(rèn)可的平臺進行了新一輪迭代,推出了U-Center5.0統(tǒng)一運維平臺,賦予統(tǒng)一運維新內(nèi)涵。
統(tǒng)一門戶,打通邊界:U-Center通過入口統(tǒng)一、風(fēng)格統(tǒng)一、數(shù)據(jù)拉通、操作拉通,打通了運維邊界,實現(xiàn)云、網(wǎng)、端異構(gòu)全域混合資源的“一站式”管理,運維效率可提升60%。
統(tǒng)一告警,價值萃取:U-Center可將接收的所有資源告警統(tǒng)一處理、抑制、壓縮、統(tǒng)一轉(zhuǎn)發(fā)規(guī)則、統(tǒng)一升級策略,實現(xiàn)多個來源的告警統(tǒng)一管理,高效整合不同系統(tǒng)的告警信息,告警壓縮率可達95%以上。
統(tǒng)一資源,摸清家底:企業(yè)中共存不同系統(tǒng),導(dǎo)致整體資源狀態(tài)及變化不可視。U-Center以CMDB為資源管理中心,可對全局資源進行統(tǒng)一建模、接入、關(guān)聯(lián)、調(diào)和一致,讓IT資產(chǎn)全域可視、可管、可用,各種維度資源情況一覽無余,隨時掌控全局。
統(tǒng)一流程,提升效率:U-Center通過流程接入規(guī)范和流程自定義,實現(xiàn)運維業(yè)務(wù)全流程端到端可視化和持續(xù)優(yōu)化,讓服務(wù)響應(yīng)更敏捷、團隊協(xié)作更有效、故障恢復(fù)更快捷、服務(wù)更滿意。
統(tǒng)一分析,優(yōu)化治理:U-Center匯集多來源、多類型的運維數(shù)據(jù),通過數(shù)據(jù)基建、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)服務(wù)、數(shù)據(jù)應(yīng)用實現(xiàn)多級價值提升;基于AI能力實現(xiàn)多場景智能運維,充分萃取數(shù)據(jù)價值,為業(yè)務(wù)運營運維提供數(shù)據(jù)分析和決策支撐。其實,不僅僅是多域,在“多云”環(huán)境下,U-Center 5.0也同樣游刃有余。在實際生產(chǎn)過程中,每個云廠家提供的能力都不一致,U-Center 5.0構(gòu)建了一個中間的適配層,把各個廠家公共的能力抽出來做適配,盡量屏蔽多運維層造成數(shù)據(jù)不統(tǒng)一。
實現(xiàn)全場景落地
當(dāng)前企業(yè)IT基礎(chǔ)架構(gòu)規(guī)模越來越大,架構(gòu)越來越復(fù)雜,產(chǎn)品與應(yīng)用迭代的速度很快。在這樣的背景下,運維人員如何進行快速的故障診斷和業(yè)務(wù)恢復(fù)呢?新華三將IT統(tǒng)一運維切入點放到了網(wǎng)絡(luò)上。
“從新華三自身的IT實踐來看,故障可以映射到網(wǎng)絡(luò)層、應(yīng)用層以及用戶體驗層,但網(wǎng)絡(luò)層出現(xiàn)故障對系統(tǒng)的影響最大,故障定位也是優(yōu)先從網(wǎng)絡(luò)找起。從客戶的角度來講,看到的是網(wǎng)絡(luò)中斷或者是反應(yīng)緩慢,排除網(wǎng)絡(luò)的問題再看應(yīng)用,一層層迭代的定位。”敖襄橋指出,“我們運維團隊是基于網(wǎng)絡(luò)來孵化的,這也體現(xiàn)新華三在網(wǎng)絡(luò)層面運維的獨特優(yōu)勢和多年積淀。網(wǎng)絡(luò)只是切入點,新華三的智能運維已經(jīng)覆蓋了包含數(shù)據(jù)中心、園區(qū)網(wǎng)、廣域網(wǎng)等ICT領(lǐng)域里所有的計算與網(wǎng)絡(luò)架構(gòu),可以幫助客戶實現(xiàn)ICT基礎(chǔ)設(shè)施+應(yīng)用的全棧智能運維。”
在數(shù)據(jù)中心場景,新華三可以基于總體意圖來完成網(wǎng)絡(luò)自動化配置,引入數(shù)字孿生系統(tǒng),讓客戶在做所有變更之前,在孿生系統(tǒng)中進行包括配置解決、網(wǎng)絡(luò)的可達性的驗證,提前確認(rèn)變更是不是可以達到預(yù)期;對數(shù)據(jù)中心網(wǎng)絡(luò)故障,做快速自動化的故障診斷與規(guī)避,自動化下發(fā)策略,進行故障隔離與處理提示。
在園區(qū)網(wǎng)場景,新華三最關(guān)注的是接入,在園區(qū)無線化的趨勢之下,如何實現(xiàn)漫游、海量、多制式終端的無縫接入和最佳體驗。新華三可以通過智能分析能力來獲取包括AC、AP以及核心交換機的運行數(shù)據(jù),對終端和用戶進行數(shù)據(jù)解析和跟蹤,保證園區(qū)接入。
在廣域網(wǎng)場景中,客戶其實關(guān)心的是成本和服務(wù)質(zhì)量,新華三智能運維希望給客戶呈現(xiàn)的是基于服務(wù)質(zhì)量自動廣域網(wǎng)鏈路選擇,更多強調(diào)的是整個廣域網(wǎng)鏈路的SLA(服務(wù)等級協(xié)議)測量,基于客戶的策略和SLA測量的結(jié)果來做廣域網(wǎng)鏈路的調(diào)度優(yōu)化。
當(dāng)然,要實現(xiàn)全應(yīng)用場景的落地,背后離不開不斷地技術(shù)創(chuàng)新。比如在服務(wù)質(zhì)量測量方面,傳統(tǒng)的服務(wù)質(zhì)量是通過撥測來實現(xiàn),新華三則應(yīng)用了隨流檢測技術(shù),通過真實業(yè)務(wù)流量情況下測出來的網(wǎng)絡(luò)狀態(tài)數(shù)據(jù),反饋到算法中,幫助客戶做出廣域網(wǎng)鏈路的最佳選擇。
加速駛向AI大模型時代
敖襄橋認(rèn)為,運維的技術(shù)領(lǐng)域非常寬,既要懂各種數(shù)據(jù)中心內(nèi)的IT基礎(chǔ)設(shè)施相關(guān)技術(shù),還要懂云原生、智原生技術(shù),搞得定應(yīng)用軟件架構(gòu);既要能理解硬件設(shè)備是怎么工作的,還要理解應(yīng)用軟件是怎么運轉(zhuǎn)的。所以新華三一直認(rèn)為,要想把運維做好,需要非常強的領(lǐng)域知識背景。AIGC技術(shù),恰好具備吸收消化,壓縮大量知識的能力。AIGC的出現(xiàn)與逐步成熟,極大加速了IT智能運維的發(fā)展進程。“沒有AIGC能力的加持,智能運維技術(shù)主要是面向KPI數(shù)據(jù)的趨勢預(yù)測和故障診斷等;AIGC的出現(xiàn),實現(xiàn)了完整專家經(jīng)驗注入,讓我們看到了一個解決問題的新方法,新思路,新華三也將全面擁抱AIGC。”
在IT智能運維大模型打造上,新華三集團是“站在巨人肩膀上”,“要落地AIGC能力,首先,是聚焦新華三過往20年的內(nèi)部積累數(shù)據(jù),包括大量的ICT領(lǐng)域知識語料,各種產(chǎn)品手冊和技術(shù)文檔,也包括大量各種客戶側(cè)問題、故障的協(xié)助處理記錄,工單信息等。這些數(shù)據(jù)都可以被加工為高質(zhì)量的新華三獨有的ICT領(lǐng)域運維數(shù)據(jù)集;同時,密切關(guān)注學(xué)術(shù)界的技術(shù)進展和跟蹤通用大模型的趨勢,基于新華三的歷史經(jīng)驗積累數(shù)據(jù)和學(xué)術(shù)界的進展,為客戶提供有新華三知識注入的ICT領(lǐng)域、智能運維領(lǐng)域的大模型。”
敖襄橋表示,出于安全性和隱私保護等多方面的考慮,在AIGC模型的部署和應(yīng)用方面,大部分客戶會選擇進行本地部署。當(dāng)前AIGC大模型的本地推理部署會面臨一定的計算資源瓶頸。但新華三相信,隨著技術(shù)的進步,產(chǎn)業(yè)的成熟,大模型推理的算力瓶頸將較快地得到解決。“我們給客戶推薦的是新華三調(diào)優(yōu)過的大模型,這個大模型比開源大模型在智能運維領(lǐng)域有更強的優(yōu)勢。如果客戶有較充裕的計算資源和豐富的自有私域運維數(shù)據(jù),新華三可以進一步提供服務(wù),支持客戶在本地去構(gòu)建自有私域運維大模型,基于新華三大模型做私域模型的微調(diào);還可以直接將私域知識加工后,通過外掛知識庫的方式,掛接到本地部署的新華三運維大模型上來。”
當(dāng)全面引入AIGC賦能后,未來的運維工程師日常工作是什么樣的?當(dāng)一個故障發(fā)生后,系統(tǒng)會把中斷的日志信息、告警信息推給AIGC大模型,它會快速給出一個診斷步驟和修復(fù)方案,幫助運維人員一步一步地找到故障根因,定位和修復(fù)故障;除了給出快速排障的應(yīng)急方案外,大模型還會預(yù)測出可能發(fā)生類似故障的模塊并建議盡快進行替換,甚至是進一步幫助用戶提出優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)方案,避免未來再出現(xiàn)單點故障引起的此類問題。
可以預(yù)見,新華三U-Center統(tǒng)一運維平臺走向AI大模型時代,將進一步釋放智能運維的想象力和生產(chǎn)力。