C114通信網(wǎng)  |  通信人家園

技術(shù)
2018/2/1 14:41

基于大數(shù)據(jù)對(duì)運(yùn)營(yíng)商基站覆蓋中心點(diǎn)的預(yù)測(cè)及對(duì)比分析

《移動(dòng)通信》  唐忠林 許盛宏 譚志遠(yuǎn)

唐忠林,許盛宏,譚志遠(yuǎn)

中國(guó)電信股份有限公司廣東研究院,廣東 廣州 510630)

【摘要】為了深入了解運(yùn)營(yíng)商網(wǎng)絡(luò)覆蓋程度,提升網(wǎng)絡(luò)資源投放效率,通過(guò)Mean-Shift算法對(duì)基站的MR數(shù)據(jù)做首次聚類(lèi)分析,預(yù)測(cè)出局部最優(yōu)的基站覆蓋中心點(diǎn),再用DBSCAN算法預(yù)測(cè)出全局最優(yōu)的基站覆蓋中心點(diǎn)。在此基礎(chǔ)上分析三大運(yùn)營(yíng)商基站小區(qū)在地理位置上的部署密集程度,從而獲得每個(gè)運(yùn)營(yíng)商的網(wǎng)絡(luò)熱點(diǎn)區(qū)域分布,為網(wǎng)絡(luò)規(guī)劃和智慧網(wǎng)優(yōu)提供全方位的分析方法。

【關(guān)鍵詞】MR    Mean-Shift    DBSCAN    聚類(lèi)算法

doi:10.3969/j.issn.1006-1010.2017.22.001      中圖分類(lèi)號(hào):TP312      文獻(xiàn)標(biāo)志碼:A      文章編號(hào):1006-1010(2017)22-0001-04

引用格式:唐忠林,許盛宏,譚志遠(yuǎn). 基于大數(shù)據(jù)對(duì)運(yùn)營(yíng)商基站覆蓋中心點(diǎn)的預(yù)測(cè)及對(duì)比分析[J]. 移動(dòng)通信, 2017,41(22): 1-4.

1   引言

隨著大數(shù)據(jù)時(shí)代的迅猛發(fā)展,人們對(duì)LBS(Location Based Services,基于位置服務(wù))的需求也快速增長(zhǎng),無(wú)線定位技術(shù)逐步得到重視,位置服務(wù)已經(jīng)成為一種熱門(mén)的技術(shù)。輔助GPS(AGPS)定位技術(shù)結(jié)合了GPS定位和蜂窩基站定位的優(yōu)勢(shì),借助蜂窩網(wǎng)絡(luò)的數(shù)據(jù)傳輸功能,可以快速精準(zhǔn)地定位,在移動(dòng)設(shè)備尤其是手機(jī)終端中被廣泛使用[1]。運(yùn)營(yíng)商通過(guò)更新4G網(wǎng)絡(luò)主設(shè)備網(wǎng)管,即新增輔助GPS和異網(wǎng)檢測(cè)功能,實(shí)現(xiàn)了基站MR(Measurement Report,測(cè)量報(bào)告)數(shù)據(jù)版本升級(jí)。在新的數(shù)據(jù)源中不僅能夠獲取到精確的GPS地理信息,同時(shí)異網(wǎng)檢測(cè)功能也可以針對(duì)其他運(yùn)營(yíng)商網(wǎng)絡(luò)覆蓋強(qiáng)度進(jìn)行周期測(cè)量,從而解決了當(dāng)前MR應(yīng)用過(guò)程中定位精度不足和只能評(píng)估本網(wǎng)絡(luò)覆蓋情況的局限[2]。通過(guò)本次研究,可以有效拓展MR的分析能力,針對(duì)三網(wǎng)(中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通)的覆蓋情況進(jìn)行對(duì)比分析。

本文通過(guò)對(duì)輔助GPS數(shù)據(jù)的挖掘分析,預(yù)測(cè)出運(yùn)營(yíng)商的基站覆蓋中心點(diǎn),可以實(shí)現(xiàn)運(yùn)營(yíng)商之間的網(wǎng)絡(luò)可持續(xù)化對(duì)比,為解決傳統(tǒng)三網(wǎng)對(duì)比測(cè)試樣本不充足、對(duì)比不全面的問(wèn)題提供一種有效解決方案。

2   運(yùn)營(yíng)商基站覆蓋中心點(diǎn)預(yù)測(cè)

以基站采集到的終端測(cè)量報(bào)告作為數(shù)據(jù)源,并將數(shù)據(jù)源按頻點(diǎn)和PCI(Physical Cell Identifier,物理小區(qū)標(biāo)識(shí))進(jìn)行分組,對(duì)分組后的每組數(shù)據(jù)用Mean-Shift(偏移均值向量算法)算法做首次密度聚類(lèi)[3-4],找到局部最優(yōu)的基站覆蓋中心點(diǎn)。結(jié)合專(zhuān)業(yè)的業(yè)務(wù)背景知識(shí),對(duì)局部基站覆蓋中心點(diǎn)用DBSCAN算法做二次聚類(lèi),找到全局最優(yōu)的基站覆蓋中心點(diǎn)[5-8]。最后用本網(wǎng)的主覆蓋小區(qū)來(lái)驗(yàn)證所預(yù)測(cè)出來(lái)的基站覆蓋中心點(diǎn)的正確性。具體流程如圖1所示:

圖1    運(yùn)營(yíng)商基站覆蓋中心點(diǎn)預(yù)測(cè)流程

2.1  數(shù)據(jù)源提取及清洗

本模型采用中國(guó)電信全省MR的輔助GPS相關(guān)數(shù)據(jù),主要包括:各運(yùn)營(yíng)商的頻點(diǎn)、PCI、用戶個(gè)人上報(bào)的百度經(jīng)緯度、地市、中國(guó)電信主服務(wù)小區(qū)百度經(jīng)緯度等屬性,并對(duì)每條記錄中的異常數(shù)據(jù)、無(wú)效數(shù)據(jù)進(jìn)行了清洗。為減少鄰區(qū)等干擾因素影響模型的準(zhǔn)確度,本模型只提取了室外且相距主服務(wù)小區(qū)1 km以內(nèi)的MR記錄。

2.2  Mean-Shift算法聚類(lèi)過(guò)程

Mean-Shift算法是一個(gè)迭代的過(guò)程。對(duì)于d維空間的N個(gè)樣本點(diǎn),首先隨機(jī)選擇一個(gè)點(diǎn),并以這個(gè)點(diǎn)為圓心、以R為半徑做一個(gè)d維的高維球,落在這個(gè)球內(nèi)的所有樣本點(diǎn)和圓心都會(huì)產(chǎn)生一個(gè)向量,每個(gè)向量都以圓心為起點(diǎn)、以球內(nèi)的樣本點(diǎn)為終點(diǎn),計(jì)算出球內(nèi)所有向量的和,最終得出Mean-Shift向量。再以Mean-Shift向量的終點(diǎn)為圓心重復(fù)上述步驟。由同起點(diǎn)向量求和法則可知,Mean-shift向量最終將收斂到概率密度最大的區(qū)域[9]。Mean-Shift向量的基本形式如下:

(1)

其中,x為空間中任意一點(diǎn);D表示在N個(gè)樣本點(diǎn)xi中有D個(gè)點(diǎn)落在SD區(qū)域中。

Mean-Shift算法的偽代碼思想如下:

(1)隨機(jī)選擇一點(diǎn)為中心點(diǎn),固定一個(gè)窗口,計(jì)算出Mean-Shift向量;

(2)判斷是否達(dá)到收斂,若收斂則終止,否則執(zhí)行第(3)步;

(3)以Mean-Shift向量的終點(diǎn)為新的中心,重復(fù)上述步驟[10]。

由于獲取到的用戶輔助GPS數(shù)據(jù)呈現(xiàn)出無(wú)規(guī)律分布,因此采用基于概率密度的Mean-Shift算法進(jìn)行聚類(lèi)分析。該算法忽略了數(shù)據(jù)源中的異常值,每次只對(duì)窗口內(nèi)局部數(shù)據(jù)進(jìn)行計(jì)算,計(jì)算完成后再移動(dòng)窗口。

本模型首先以中國(guó)電信的數(shù)據(jù)做訓(xùn)練集,以頻點(diǎn)和PCI作為分組條件,分別把具有相同頻點(diǎn)和PCI的個(gè)人上報(bào)百度經(jīng)緯度進(jìn)行聚類(lèi)。經(jīng)過(guò)多次模型訓(xùn)練并結(jié)合業(yè)務(wù)實(shí)際,本模型最終設(shè)置的Mean-Shift窗寬系數(shù)為0.02,聚類(lèi)得到多個(gè)同一頻點(diǎn)和PCI下多個(gè)基站覆蓋中心經(jīng)緯度。預(yù)測(cè)中國(guó)電信室外的基站覆蓋中心點(diǎn)有159 284個(gè),將預(yù)測(cè)出來(lái)的覆蓋中心點(diǎn)經(jīng)緯度與中國(guó)電信MR數(shù)據(jù)本身提供的小區(qū)百度經(jīng)緯度在百度地圖上作距離對(duì)比。結(jié)果表明,對(duì)于廣州市區(qū)統(tǒng)計(jì)出基站覆蓋中心點(diǎn)有80.3%落在主覆蓋小區(qū)對(duì)應(yīng)方向角附近150 m以內(nèi),但在同一頻點(diǎn)和PCI下有部分預(yù)測(cè)的基站覆蓋中心點(diǎn)相距較近。結(jié)合專(zhuān)業(yè)的業(yè)務(wù)知識(shí),運(yùn)用區(qū)域聚類(lèi)算法DBSCAN進(jìn)行二次聚類(lèi),將屬于同頻點(diǎn)同PCI且相距較近的基站覆蓋中心點(diǎn)聚為一個(gè)新中心點(diǎn)。

2.3  DBSCAN二次聚類(lèi)過(guò)程

DBSCAN是一種基于高密度連通區(qū)域的聚類(lèi)算法,能夠?qū)⒕哂凶銐蚋呙芏鹊膮^(qū)域劃分為簇。該算法需要兩個(gè)核心的參數(shù):一個(gè)參數(shù)是半徑,表示以給定點(diǎn)P為中心的圓形鄰域的范圍;另一個(gè)參數(shù)是以點(diǎn)P為中心的鄰域內(nèi)最少點(diǎn)的數(shù)量[11]。

基于本模型需求和專(zhuān)業(yè)的業(yè)務(wù)知識(shí),模型設(shè)置的半徑為200 m,鄰域內(nèi)最少點(diǎn)數(shù)量設(shè)置為1,從而可以將具有相同頻點(diǎn)和PCI且距離較近的基站覆蓋中心點(diǎn)聚類(lèi)成一個(gè)新的中心點(diǎn)。將基站覆蓋中心點(diǎn)經(jīng)緯度與中國(guó)電信MR數(shù)據(jù)提供的小區(qū)經(jīng)緯度作距離核對(duì),該模型預(yù)測(cè)出中國(guó)電信室外共有155 244個(gè)基站覆蓋中心點(diǎn)。對(duì)于廣州市區(qū)統(tǒng)計(jì)出基站覆蓋中心點(diǎn)有83.6%落在主覆蓋小區(qū)對(duì)應(yīng)方向角附近150 m以內(nèi),符合實(shí)際業(yè)務(wù)規(guī)則。

DBSCAN算法的偽代碼思想如下:

(1)選取鄰域半徑為200 m,鄰域內(nèi)最少點(diǎn)數(shù)為1;

(2)隨機(jī)選取一點(diǎn)為中心點(diǎn),計(jì)算相同頻點(diǎn)和PCI下的主覆蓋小區(qū)中心點(diǎn)的距離,若滿足條件,則加入該鄰域,并以新加入的點(diǎn)為中心判斷其余點(diǎn)是否滿足條件,直到遍歷完所有點(diǎn),計(jì)算出該鄰域新的中心點(diǎn),并把屬于該鄰域的點(diǎn)從原數(shù)據(jù)中刪除;

(3)從剩余的點(diǎn)中隨機(jī)選取一點(diǎn)為新的中心,重復(fù)第(2)步直到原數(shù)據(jù)中所有點(diǎn)都被重新歸類(lèi)完畢為止。

3   運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比分析

通過(guò)上述模型,采用相同的方法可以預(yù)測(cè)出異網(wǎng)基站覆蓋中心點(diǎn)的位置及其數(shù)量,預(yù)測(cè)出運(yùn)營(yíng)商A室外有231 948個(gè)基站覆蓋中心點(diǎn)、運(yùn)營(yíng)商B室外有92 668個(gè)基站覆蓋中心點(diǎn)。將三家運(yùn)營(yíng)商的基站覆蓋中心點(diǎn)預(yù)測(cè)結(jié)果顯示在百度地圖上,以廣州兩個(gè)區(qū)域Ⅰ、Ⅱ?yàn)槔唧w如圖2和圖3所示:

圖2    區(qū)域Ⅰ運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比

圖3    區(qū)域Ⅱ運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比

其中,扇形表示運(yùn)營(yíng)商真實(shí)的主覆蓋小區(qū)所在的位置;圓形表示用模型預(yù)測(cè)出來(lái)的基站覆蓋中心點(diǎn)所在的位置;黃色表示運(yùn)營(yíng)商A、藍(lán)色表示運(yùn)營(yíng)商B、紅色表示運(yùn)營(yíng)商C。

從圖2和圖3可以看出,預(yù)測(cè)得到的基站覆蓋中心點(diǎn)跟真實(shí)的小區(qū)相距較近,能夠直觀地描繪出三家運(yùn)營(yíng)商的覆蓋區(qū)域及覆蓋密度。通過(guò)這種直觀的比較,不僅可以掌握異網(wǎng)的大致網(wǎng)絡(luò)分布,而且也易于了解哪些區(qū)域是本網(wǎng)盲區(qū)、哪些區(qū)域需要加強(qiáng)覆蓋,為網(wǎng)絡(luò)建設(shè)規(guī)劃和智慧網(wǎng)優(yōu)提供強(qiáng)有力的支撐。

4   結(jié)束語(yǔ)

本文通過(guò)對(duì)MR數(shù)據(jù)的挖掘分析,預(yù)測(cè)出運(yùn)營(yíng)商的基站覆蓋中心點(diǎn),可以全面掌握運(yùn)營(yíng)商主覆蓋小區(qū)的大致分布和覆蓋密度,為全面評(píng)估網(wǎng)絡(luò)覆蓋程度提供有力支撐,也為掌握異網(wǎng)的網(wǎng)絡(luò)規(guī)劃和發(fā)展規(guī)模提供理論依據(jù)。后續(xù)將對(duì)全集團(tuán)的MR數(shù)據(jù)做相同的挖掘分析,為全集團(tuán)的網(wǎng)絡(luò)規(guī)劃、智慧網(wǎng)優(yōu)、優(yōu)化布局提供全方位智能化分析方法,進(jìn)一步提升網(wǎng)絡(luò)資源投放效率。

參考文獻(xiàn):

[1] 左超,耿慶鵬,劉旭峰. 基于大數(shù)據(jù)的電信業(yè)務(wù)發(fā)展策略研究[J]. 郵電設(shè)計(jì)技術(shù), 2013(10): 1-4.

[2] 顧芳,劉旭峰,左超. 大數(shù)據(jù)背景下運(yùn)營(yíng)商移動(dòng)互聯(lián)網(wǎng)發(fā)展策略研究[J]. 郵電設(shè)計(jì)技術(shù), 2012(8): 21-24.

[3] Ester M, Kriegel H P, Sander J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[J]. Knowlegdge Discovety Data Mining, 1996: 226-231.

[4] 彭寧嵩,楊杰,劉志,等. Mean-Shift跟蹤算法中核函數(shù)窗寬的自動(dòng)選取[J]. 軟件學(xué)報(bào), 2005,16(9): 1542-1550.

[5] 何中勝,劉宗田,莊燕濱. 基于數(shù)據(jù)分區(qū)的并行DBSCAN算法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2006,27(1): 114-116.

[6] 熊忠陽(yáng),孫思,張玉芳,等. 一種基于劃分的不同參數(shù)值的DBSCAN算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2005(9): 2319-2321.

[7] 榮秋生,顏君彪,郭國(guó)強(qiáng). 基于DBSCAN聚類(lèi)算法的研究與實(shí)現(xiàn)[J]. 計(jì)算機(jī)應(yīng)用, 2004,24(4): 45-46.

[8] 王桂芝. 基于密度聚類(lèi)分析的相關(guān)算法研究[J]. 電腦知識(shí)與技術(shù), 2013(30): 6714-6716.

[9] D Comaniciu, P Meer. Mean shift: a robust approach toward feature space analysis[J]. Journal of Image and Signal Processing, 2002,24(5): 603-619.

[10] RT Collins. Mean-shift blob tracking through scale space[J]. Computer Vision and Pattern Recognition, 2003: 234.

[11] 韓利釗,錢(qián)雪忠,羅靖,等. 基于區(qū)域劃分的DBSCAN多密度聚類(lèi)算法[J/OL]. [2017-06-14]. http://www.arocmag.com/article/02-2018-06-047.html.★

作者簡(jiǎn)介

唐忠林:工程師,碩士畢業(yè)于華南理工大學(xué),現(xiàn)任職于中國(guó)電信股份有限公司廣東研究院,從事大數(shù)據(jù)挖掘、算法模型等工作。

許盛宏:工程師,學(xué)士畢業(yè)于重慶郵電學(xué)院,現(xiàn)任職于中國(guó)電信股份有限公司廣東研究院,從事核心網(wǎng)研究及支撐工作。

譚志遠(yuǎn):工程師,學(xué)士畢業(yè)于華南理工大學(xué),現(xiàn)任職于中國(guó)電信股份有限公司廣東研究院,從事大數(shù)據(jù)數(shù)據(jù)庫(kù)、數(shù)據(jù)平臺(tái)管理、云計(jì)算等技術(shù)研究及支撐工作。

給作者點(diǎn)贊
0 VS 0
寫(xiě)得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門(mén)文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141