固網漏話用戶數據分析論文

時間:2022-03-27 04:07:45

導語:固網漏話用戶數據分析論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

固網漏話用戶數據分析論文

1數據挖掘和知識獲取

數據挖掘是在數據庫中進行知識發現的重要方法,是從大量的表面數據中提取隱藏在其中的知識的過程。近年來,該技術發展迅速,已應用到各個領域。本文主要介紹固話漏話用戶數據挖掘和分析。

2數據挖掘技術應用于電信用戶數據研究

2.1固網用戶數據的組成和結構

對于企業來說,大量的用戶數據不僅有利于客戶關系管理(CRM),同時也是獲得用戶知識的源泉。從用戶知識發現的過程中可以看到,用戶數據的質量會對知識發現的結果產生直接的影響,所以用戶數據準備也是一項很重要的步驟。從商業系統中提取出高質量的用戶數據就成為一項最主要的工作。固網企業的用戶數據包括用戶基本信息、用戶賬單信息以及客服信息。數據倉庫就是根據這種方式來組織的。

2.2知識發現的方法和過程

用戶知識發現概括如下:根據提出的商業目標,分析大量的用戶數據,找出隱藏的和未知的規律或者豐富已知的規律,進而提出模型;最后要將數據挖掘和分析的結果轉化成有商業意義的方法,然后采取進一步的行動。用戶知識發現必須遵循以下幾個步驟:商業理解,數據理解,數據準備,分類模型,評估應用。

2.3數據挖掘建立用戶分類模型

近年來,“以客戶為中心”的電信市場開始強調為不同用戶提供個性化服務,其前提條件就是用戶分類。這也說明了過去的消費行為也預示了未來的消費傾向。

(1)商業理解

對用戶的理解不僅是理解電信市場的開始,也是理解客戶關系管理的開始。在電信企業中對用戶的理解包括:用戶種類,不同類中用戶的本質屬性區別,用戶偏好,不同類別之間的用戶如何通信等。

(2)用戶數據準備

對用戶分類的研究主要是從用戶屬性中得到用戶特征和行為習慣。主要數據來源于用戶賬單信息,同時也需要從商業系統中得到一些用戶的基本屬性信息。

(3)用戶分類模型

本文使用聚類分析對用戶進行細分以建立分類模型。聚類分析是把大量數據點的集合根據最大化類內相似性、最小化類間相似性的原則進行聚類或分組,使得每個類中的數據之間最大限度地相似、而不同類中的數據之間最大限度地不同。

3固網漏話用戶數據分析

3.1關于固網漏話用戶數據分析的商業理解

通過各種渠道調查,對固網漏話用戶數據分析的目標可以概括為以下幾點:

(1)對用戶通話次數、時間段等分析,找出特征,以此來尋找目標用戶;

(2)對用戶開通漏話保護業務前后的ARPU值分析比較,分析收益的對比;

(3)對目標用戶數據分析,從用戶分類的角度來管理,設計針對性的服務,提升用戶滿意度。

3.2系統用戶數據準備

數據準備的過程:明確目標;制定計劃;分析變量的獲取;數據收集和獲??;數據集成。根據當前客戶關系管理基本狀況和數據挖掘的目的,涉及到的人口屬性變量有:性別、年齡、住址、用戶職業、婚否、學歷、薪資等。用戶分類結束之后,再使用描述變量來進行分析說明。本文選用某市電信公司運營支持系統和經營分析系統的數據,從中選取了基本客戶基本信息表、客戶詳細話表、賬單及繳費信息表、產品信息表、業務使用清單等原始數據。數據挖掘工具選擇SPSSClementine。在使用該工具進行挖掘之前,需要對數據進行清洗:

(1)刪掉不滿足要求的數據:選擇普通的用戶;選擇狀態正常的用戶;選擇入網時間較長的用戶,使數據有完整的用戶周期;

(2)去掉異常數據:比如用于測試的號碼;

(3)去掉極端值:不具備普遍性的極值容易產生噪聲。

3.3固網漏話用戶數據分析結果

考慮到不同分類建立的有效性和簡便性,以及固話用戶和數據源的特點,本文采用常見的K-means算法,其高可靠性、高精準性以及低復雜度使其成為主流的聚類算法。本文選用SPSSClementine作為數據挖掘工具進行K-means聚類分析。獲取原始數據并進行預處理之后,選擇參與聚類的細分變量,輸入簇的個數k,選擇k=7,然后點擊“聚類”按鈕,使用K-means算法對固網漏話用戶數據進行聚類。經過正常值選擇、極值處理等一系列的數據清洗工作,最后用于研究的記錄有251284條。

3.4分析結果和解釋

93%的遇忙話務都出現在8∶00~18∶00的工作時段,這說明該時段遇忙話務較多,話務量流失嚴重,特別需要遇忙話務的解決方法。而這一時間段遇忙話務量最多的就是政企用戶,這些話務量流失對政企用戶將造成巨大的損失:30000政企用戶一個月遇忙話務損失達到260萬次,本網超過120萬次,每個月預計損失20萬;以電信中等發達省份為例:符合條件的政企高端用戶約為60萬;每年度損失的潛在業務收入為50000萬。經過分析,得到該市各地區已開通和未開通漏話保護業務的用戶分布,如圖4所示。C區屬于政務新區,未開通漏話業務的用戶較多,而F區屬于工業園區,企業較多,很多用戶已開通漏話保護業務,但是還有大量用戶未開通該業務,所以C區和F區應該作為該業務的重點推廣地區。綜上分析,固網漏話業務是一個非常有潛力的業務,解決漏話問題是提高用戶滿意度和忠誠度的重要途徑。根據上文的分析,在8∶00~18∶00時間段,用戶遇忙話務量非常多,在這段時間內,企業需要更多的漏話接入服務器,而在其他時間段可以減少接入服務器以節約成本。而在不同的地區,用戶數量和精準用戶的數量也不同,應該選擇精準用戶較為集中的地區優先推廣漏話保護業務。由于精準高端用戶帶來的收益遠遠超過普通用戶,所以要對經過篩選的精準用戶采取針對性措施,比如在C區和F區大力宣傳,以各種形式讓精準客戶看到該業務帶來的收益,還可以電話推廣為精準用戶提供信息。

4結論

本文將聚類挖掘方法應用到固網漏話用戶數據分析中,采用SPSSClementine工具進行數據挖掘。漏話保護系統主要針對政企高端用戶提出,主要目的是為了提高通話接通率,以提高政企用戶的效益,達到用戶和運營商的共贏。而對用戶數據的分析,是為了運營商可以更好地服務于政企客戶,為企業帶來更多的利益,從根本上改善固網漏話問題。

作者:孫駿單位:南京郵電大學