前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了談數(shù)據(jù)分析支持片區(qū)用戶(hù)服務(wù)范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。
摘要:數(shù)據(jù)建模是數(shù)據(jù)挖掘的重要步驟,而高品質(zhì)的數(shù)據(jù)是模型成立的堅(jiān)實(shí)基礎(chǔ)。為了保持和保護(hù)原始數(shù)據(jù)的原貌不變,同時(shí)減少干擾因素對(duì)分析結(jié)果的影響,建立中間數(shù)據(jù)庫(kù)是有效、便捷的方案。特征寬表與關(guān)聯(lián)數(shù)據(jù)疊加形成多維度交織的關(guān)系凸顯特診數(shù)據(jù)是本文闡述的建模思路,中間數(shù)據(jù)庫(kù)的建設(shè)使得終端個(gè)體特征寬表、終端群體特征寬表成為可能,最終實(shí)現(xiàn)數(shù)據(jù)挖掘成果。
關(guān)鍵詞:中間數(shù)據(jù)庫(kù)終端個(gè)體特征寬表終端群體特征寬表
1前言
數(shù)據(jù)倉(cāng)庫(kù)、網(wǎng)管系統(tǒng)、統(tǒng)計(jì)報(bào)表在廣電行業(yè)運(yùn)營(yíng)服務(wù)中的使用已非常成熟。為了更好發(fā)揮各個(gè)支撐系統(tǒng)的實(shí)際作用,支持好片區(qū)用戶(hù)服務(wù)開(kāi)展,全新的、符合需求的數(shù)據(jù)建模方式的研究試驗(yàn)工作相繼展開(kāi)。
2試驗(yàn)環(huán)境
選取一個(gè)在網(wǎng)PON業(yè)務(wù)板卡下的覆蓋范圍為10000戶(hù)的區(qū)域作為試驗(yàn)分析對(duì)象,該覆蓋范圍以PON+EoC的組網(wǎng),覆蓋小區(qū)有多層、高層等多種房屋類(lèi)型(接入網(wǎng)設(shè)計(jì)風(fēng)格多樣),主要觀察對(duì)象為使用TVOS2.0交互機(jī)頂盒的用戶(hù)。
3試驗(yàn)用數(shù)據(jù)平臺(tái)模型
該數(shù)據(jù)平臺(tái)用于建模試驗(yàn)及驗(yàn)證,為簡(jiǎn)潔、高效,僅搭建了數(shù)據(jù)倉(cāng)庫(kù)所必須需要使用的幾個(gè)部分。數(shù)據(jù)平臺(tái)模型示意圖如圖1所示。
4平臺(tái)基本情況
4.1數(shù)據(jù)源
(1)業(yè)務(wù)數(shù)據(jù)來(lái)自公司已建成的數(shù)據(jù)倉(cāng)庫(kù)資源,該部分?jǐn)?shù)據(jù)已經(jīng)過(guò)清洗處理,數(shù)據(jù)品質(zhì)較高可直接使用(包括用戶(hù)基本信息、產(chǎn)品信息、業(yè)務(wù)變更、報(bào)修信息等)。(2)終端數(shù)據(jù)來(lái)自交互型機(jī)頂盒(STB)與寬帶終端(EoC)的網(wǎng)管采集數(shù)據(jù)。由于終端上線與開(kāi)機(jī)的情況受到用戶(hù)使用習(xí)慣的影響,該部分?jǐn)?shù)據(jù)經(jīng)過(guò)去“空”、去“零”、異常去除等多種方式存入試驗(yàn)用數(shù)據(jù)倉(cāng)庫(kù)。(3)網(wǎng)絡(luò)拓?fù)浼熬W(wǎng)管數(shù)據(jù)該部分?jǐn)?shù)據(jù)描述了每組STB+EoC終端所在的廣播網(wǎng)和寬帶網(wǎng)絡(luò)關(guān)聯(lián)網(wǎng)元關(guān)系,與每個(gè)可管理網(wǎng)元的運(yùn)行數(shù)據(jù)(性能采樣及告警等)。(4)其他關(guān)聯(lián)數(shù)據(jù)資源包括實(shí)驗(yàn)覆蓋范圍內(nèi)可能使用的各種網(wǎng)元及終端的硬件、軟件版本、業(yè)務(wù)產(chǎn)品關(guān)聯(lián)的業(yè)務(wù)邏輯、網(wǎng)絡(luò)規(guī)劃策略等,網(wǎng)絡(luò)主動(dòng)維護(hù)改擴(kuò)建等。
4.2處理層
(1)數(shù)據(jù)倉(cāng)庫(kù)用于存儲(chǔ)清洗后的數(shù)據(jù)源。(2)中間庫(kù)用于對(duì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)預(yù)處理。根據(jù)建模的需求將不同數(shù)據(jù)預(yù)先整合,既提升整個(gè)平臺(tái)的性能,也有效減少數(shù)據(jù)倉(cāng)庫(kù)中的冗余數(shù)量,能有效保護(hù)源數(shù)據(jù)的原貌。(3)試驗(yàn)?zāi)P捅敬卧囼?yàn)的關(guān)鍵部分,下文詳述。
4.3展現(xiàn)層
根據(jù)片區(qū)服務(wù)的需求以三種形成展現(xiàn)方式使用。(1)可查詢(xún)定制清單。(2)定制報(bào)表。(3)可視化綜合分析。
5需要解決的問(wèn)題和解決方案
最常見(jiàn)并實(shí)用的需求如單個(gè)用戶(hù)的歷史記錄分析。人工解讀單個(gè)用戶(hù)/終端數(shù)據(jù)非常簡(jiǎn)單,但面對(duì)百萬(wàn)級(jí)的用戶(hù)終端數(shù)量而言人工是不現(xiàn)實(shí)的,計(jì)算機(jī)面對(duì)單個(gè)用戶(hù)/終端的數(shù)據(jù)多樣性特點(diǎn)難度極大。綜合片區(qū)服務(wù)一些需求的特點(diǎn)和人工解讀單個(gè)用戶(hù)/終端數(shù)據(jù)方法。提出在中間庫(kù)建立終端個(gè)體特征寬表和終端群體特征寬表的設(shè)想,以這兩個(gè)寬表為基礎(chǔ),疊加關(guān)聯(lián)數(shù)據(jù)(如用戶(hù)報(bào)修、網(wǎng)絡(luò)報(bào)修,網(wǎng)絡(luò)改建、升級(jí),系統(tǒng)告警、用戶(hù)行為等),將特征數(shù)據(jù)凸顯出來(lái)。終端個(gè)體特征寬表主要解決因用戶(hù)使用習(xí)慣造成的采樣記錄的數(shù)量問(wèn)題。將在線的每個(gè)終端的日數(shù)據(jù)記錄收斂成一條,寬表的特征信息包含用戶(hù)基本信息、網(wǎng)絡(luò)拓?fù)潢P(guān)系、性能指標(biāo)等每項(xiàng)都設(shè)定收斂策略。終端群體特征寬表則主要解決指定/選定范圍群體數(shù)據(jù)集合問(wèn)題。在指定/選定范圍內(nèi)終端硬件型號(hào)差異、關(guān)聯(lián)網(wǎng)絡(luò)、網(wǎng)元差異、產(chǎn)品差異等原因都會(huì)導(dǎo)致數(shù)據(jù)無(wú)法收斂、離散無(wú)序、偏差極大等多因素混雜的狀況,使得特征數(shù)據(jù)淹沒(méi)。采樣逐項(xiàng)進(jìn)行閾值設(shè)定和偏差補(bǔ)償、校驗(yàn)弱化混雜因素作用的方式解決集合問(wèn)題。
6試驗(yàn)成果
6.1網(wǎng)絡(luò)衰減特征
網(wǎng)絡(luò)衰減問(wèn)題是接入網(wǎng)運(yùn)行及維護(hù)中最基本的指標(biāo),也是試驗(yàn)中最難處理的數(shù)據(jù)。該項(xiàng)數(shù)據(jù)存在記錄數(shù)量巨大,波動(dòng)不明顯,偶發(fā)數(shù)據(jù)容易被淹沉等問(wèn)題。試驗(yàn)通過(guò)個(gè)性寬表與群體寬表的對(duì)比,網(wǎng)絡(luò)拓?fù)涞男切徒Y(jié)構(gòu)關(guān)聯(lián)關(guān)系,展現(xiàn)出某個(gè)群體(個(gè)體)與整體數(shù)據(jù)的偏差。以偏差量由大到小排列,提取用戶(hù)地址信息歸類(lèi)。經(jīng)片區(qū)服務(wù)人員驗(yàn)證。用戶(hù)網(wǎng)絡(luò)隱患基本能指向到戶(hù)內(nèi)、樓內(nèi)、PON口下、光節(jié)點(diǎn)下等幾個(gè)層級(jí)。該模型可初步定型。
6.2終端軟件版本管理
終端個(gè)人寬表中軟件版本與軟件版本升級(jí)關(guān)聯(lián)識(shí)別出未升級(jí)成功用戶(hù)。片區(qū)服務(wù)驗(yàn)證發(fā)現(xiàn)存在。(1)機(jī)頂盒硬件故障(更換后經(jīng)廠商維修存儲(chǔ)器部分受損)。(2)網(wǎng)絡(luò)不穩(wěn)定導(dǎo)致反復(fù)升級(jí),后期實(shí)驗(yàn)中將加入寬帶穩(wěn)定性參數(shù)。(3)CPU負(fù)核過(guò)高。由于升級(jí)軟件BUG,導(dǎo)致升級(jí)后CPU負(fù)核過(guò)高,經(jīng)升級(jí)軟件修復(fù),現(xiàn)象消除。模型基本有效,可供軟件升級(jí)專(zhuān)項(xiàng)使用。
6.3寬帶用戶(hù)使用體驗(yàn)
寬帶用戶(hù)反映網(wǎng)速慢、網(wǎng)卡是最常見(jiàn)的報(bào)障現(xiàn)象。從用戶(hù)群相寬表的寬帶數(shù)據(jù)與用戶(hù)業(yè)務(wù)數(shù)據(jù)比對(duì)發(fā)現(xiàn),其關(guān)聯(lián)性并不完全吻合。用戶(hù)體驗(yàn)與同一EoC頭端共有用戶(hù)使用情況,與同一PON口共有用戶(hù)使用相關(guān)聯(lián),晚間高峰時(shí)間網(wǎng)絡(luò)資源不足的現(xiàn)象有特征數(shù)據(jù)出現(xiàn),但不明顯。由于試驗(yàn)范圍與暴滿(mǎn)需擴(kuò)容案例,該模型將擴(kuò)大試驗(yàn)進(jìn)一步驗(yàn)證。視擴(kuò)大試驗(yàn)驗(yàn)證情況完善模型。
6.4交互應(yīng)用情況
交互應(yīng)用與用戶(hù)使用習(xí)慣關(guān)聯(lián)的試驗(yàn),試驗(yàn)數(shù)據(jù)中表現(xiàn)出用戶(hù)交互使用時(shí)CPU負(fù)核的變化。但在與用戶(hù)產(chǎn)品等相關(guān)數(shù)據(jù)關(guān)聯(lián)時(shí)未發(fā)現(xiàn)特征數(shù)據(jù),也未發(fā)現(xiàn)其他特征,模型試驗(yàn)失敗。試驗(yàn)通過(guò)五個(gè)模型的試探,三個(gè)達(dá)到了預(yù)期的成果,一項(xiàng)可繼續(xù)擴(kuò)展,一項(xiàng)失敗。經(jīng)過(guò)這五項(xiàng)的試驗(yàn),證明以網(wǎng)絡(luò)拓?fù)錇橹骶€,以個(gè)體特征、群體特征二個(gè)寬表為基礎(chǔ),疊加各種維度的數(shù)據(jù)可以顯現(xiàn)出運(yùn)營(yíng)服務(wù)所需要的特征數(shù)據(jù)。這些數(shù)據(jù)能夠給到服務(wù)具體的幫助。
7結(jié)束語(yǔ)
上述試驗(yàn)只是建模思路的初步探索的第一階段,后期將向二個(gè)方向推進(jìn)。方向一,將成功建模的實(shí)驗(yàn)擴(kuò)大范圍驗(yàn)證,完善并推廣使用,對(duì)仍有問(wèn)題和失敗的模型調(diào)整補(bǔ)充;疊加新的數(shù)據(jù)維度尋找新的特征數(shù)據(jù)。方向二,選取有特殊片區(qū)服務(wù)需求和資深專(zhuān)家給到的片區(qū)服務(wù)建議用數(shù)據(jù)模型顯示出來(lái),供片區(qū)使用。
作者:徐沁 單位:東方有線網(wǎng)絡(luò)有限公司
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)