基于檢索網(wǎng)站熱度分析的 用戶換機意向預測模型-焦點消息

發(fā)布時間:2023-04-27 14:38:45  |  來源:通信世界全媒體  

(CWW)在互聯(lián)網(wǎng)時代,手機已成為人們?nèi)粘I钪胁豢苫蛉钡耐ㄐ藕蛫蕵饭ぞ摺τ陔娦胚\營商而言,通信服務與手機配套銷售是重要業(yè)務領域,而如何高效、高質(zhì)地識別有購機需求的用戶并開展營銷,是運營商在數(shù)字化轉(zhuǎn)型趨勢下實現(xiàn)高質(zhì)量、精細化運營的業(yè)務場景之一。以某運營商的數(shù)據(jù)為例,每月有更換手機行為的用戶占比為3%~4%。因此,掌握哪些用戶有潛在換機需求、用戶喜歡的手機類型及可接受的價位等信息,準確定位用戶需求并開展針對性營銷,不僅有利于運營商擴大用戶市場規(guī)模,節(jié)約營銷成本;也有利于提升服務質(zhì)量,使用戶獲得更好的感知。

現(xiàn)有用戶換機意向預測模型的不足


(相關資料圖)

當前對具有購機意向用戶的識別,主要采用數(shù)據(jù)分析及機器學習建模等方式,基于用戶上網(wǎng)行為等運營商數(shù)據(jù),從海量終端用戶中篩選出有換機意愿的用戶。從目前研究方向來看,大致可分為偏理論研究和偏應用研究兩類。其中,偏理論研究側(cè)重于對不同算法、數(shù)據(jù)處理方法的探索,以提升模型預測的精準度;而偏應用的研究則聚焦于建模方式,希望建立更接近于真實應用場景的模型。兩類研究的最終目的都是在業(yè)務拓展中提升營銷精準度、降低營銷成本。

綜合現(xiàn)有研究成果來看,無論是偏理論的研究還是偏應用的研究,用戶換機預測模型的建立都需要采集至少一個月的用戶樣本數(shù)據(jù),并根據(jù)抽象出的標簽屬性進行畫像建模。這意味著從數(shù)據(jù)采集到利用模型預測出換機用戶,通常情況下較用戶產(chǎn)生換機意向滯后1個多月;而在實際營銷場景中,1個月內(nèi)用戶大概率已經(jīng)通過其他渠道完成購機。因此,現(xiàn)有預測模型在營銷實踐中,往往因時效性的限制而使應用效果受到影響。

針對上述問題,本文提出一種基于檢索網(wǎng)站熱度分析的用戶換機意向預測模型,該方案能夠?qū)⒂袚Q機意向用戶的識別周期由30日縮短至2日以內(nèi),較業(yè)內(nèi)傳統(tǒng)預測模型查準率提升6.1PP以上。模型投產(chǎn)后外呼接通轉(zhuǎn)化率提升26%,因而具有良好的應用推廣價值。

基于檢索網(wǎng)站熱度分析預測模型的建立

換機用戶的定義

在現(xiàn)有研究中,對換機用戶的判斷主要基于終端的國際移動設備識別碼(InternationalMobileEquipmentIdentity,IMEI)變更。但在業(yè)務實踐中,一些用戶的IMEI變更可能為假性換機信號,例如用戶終端的IMEI發(fā)生短期臨時性改變,或在信息采集過程中存在偶發(fā)性的錯誤。為助力終端營銷,用戶

換機意向預測模型需剔除假性換機信號,識別真正具有換機意愿的用戶。故本文將換機行為定義為:用戶在當月發(fā)生IMEI變更及機型變更,并在次月仍然使用新IMEI或新機型。與之相應的技術性定義如下。

{[IMEI__A(M-1)≠IMEI__B(M)]and[MODEL__A(M-1)≠MODEL__B(M)]}

and

{[IMEI_B(M)=IMEI_B(M+1)]or[MODEL_B(M)=MODEL_B(M+1)]}

其中用戶使用的舊終端標記為A,其IMEI標記為IMEI__A,機型標記為MODEL__A;更換的新終端標記為B,其IMEI標記為IMEI__B,機型標記為MODEL__B;當月標記為M,上月及次月分別為M-1和M+1。

模型設計原理

為提升換機用戶識別的時效性,本文將用戶換機行為的路徑明確為:產(chǎn)生換機想法—確定預算—檢索在售機型—確定預購機型—對比價格—購買新手機。從中可以發(fā)現(xiàn),用戶產(chǎn)生購機意向的早期信號較直觀地體現(xiàn)在相關檢索和訪問記錄中。

目前對用戶上網(wǎng)瀏覽內(nèi)容的識別主要采用深度數(shù)據(jù)包檢測(DeepPacket Inspection,DPI)技術。用戶上網(wǎng)檢索在售手機信息時,搜索內(nèi)容將以相應規(guī)則協(xié)議的形式,通過URL編碼體現(xiàn)在用戶訪問的網(wǎng)址中,或通過用戶終端發(fā)起請求的網(wǎng)址記錄呈現(xiàn)。因此,可通過DPI技術解析用戶上網(wǎng)日志中涉及換機的內(nèi)容,定位具有換機意向的用戶,具體示例見表1。

表1 檢索訪問vivo官網(wǎng)URL示例表2部分網(wǎng)站關鍵詞訪問量統(tǒng)計

URL優(yōu)先級規(guī)則庫

為挖掘用戶在各類網(wǎng)頁及APP上檢索換機相關信息的記錄,本文整理主流搜索引擎、電商網(wǎng)站等相關網(wǎng)址域名,按照檢索訪問行為統(tǒng)計各域名下搜索手機、訪問下單頁等URL信息,并提取關鍵詞轉(zhuǎn)化為正則表達式,獲取購機相關URL規(guī)則共69條。

因運營商用戶上網(wǎng)日志數(shù)據(jù)量巨大,單日壓縮后約10~12TB,為提升解析效率,本模型采用網(wǎng)址熱度優(yōu)先級排序法及無效URL過濾法。

1.網(wǎng)址熱度優(yōu)先級排序法

分析各域名關鍵詞數(shù)量及訪問熱度(如表2所示),對URL進行優(yōu)先級排序,然后對用戶上網(wǎng)日志從高優(yōu)先級至低優(yōu)先級依次匹配,并提取匹配到的URL記錄。按照上述方法整理URL優(yōu)先級規(guī)則庫案例,如表3所示。

表2 部分網(wǎng)站關鍵詞訪問量統(tǒng)計

表3URL優(yōu)先級規(guī)則庫案例

2.無效URL過濾法

在按照正則表達式匹配域名的過程中,存在大量與購機無關的URL信息,需在解析過程中進行剔除。以百度為例,百度定位記錄占百度域名記錄總數(shù)的13.15%,URL對于用戶購機行為無參考意義,故需要進行過濾。本方案最終整理剔除無效URL28條。

模型建立步驟

本文所述用戶換機意向預測模型的建立步驟如下(如圖1所示)。

圖1 基于檢索網(wǎng)站熱度分析的預測模型流程示意

第一步:域名正則表達式匹配。

1.域名匹配。輸入用戶上網(wǎng)日志數(shù)據(jù),基于URL優(yōu)先級規(guī)則庫,按照優(yōu)先級依次匹配域名,若匹配成功則提取該上網(wǎng)日志數(shù)據(jù)記入待過濾數(shù)據(jù)表A,并跳過后續(xù)規(guī)則,啟動下一條上網(wǎng)日志匹配;若69條規(guī)則均未匹配成功則剔除該上網(wǎng)日志數(shù)據(jù)。

2.無效URL過濾。將待過濾數(shù)據(jù)表A中的上網(wǎng)日志記錄,基于28條無效URL規(guī)則進行過濾剔除,并將剔除后數(shù)據(jù)集記為待解析數(shù)據(jù)集B。

第二步:意向換機行為識別。

1.關鍵詞提取。對待解析數(shù)據(jù)集B,匹配檢索或訪問關鍵詞并提取對應信息,例如檢索內(nèi)容及商品編碼,并將提取內(nèi)容記入待解析數(shù)據(jù)集C。

2.換機意向識別。用待解析數(shù)據(jù)集C的記錄匹配手機品牌,若匹配成功則打標對應用戶換機意向為“是”,并將匹配上的手機品牌打標為用戶偏好品牌;否則打標用戶換機意向為“否”。

3.預測結(jié)果輸出。輸出換機意向標記為“是”的用戶群及其偏好的手機品牌,作為換機預測結(jié)果集D。

對基于檢索網(wǎng)站熱度分析預測模型應用效果的評估

數(shù)據(jù)說明

本文抽取2022年3月某一天的上網(wǎng)日志數(shù)據(jù)作為實驗數(shù)據(jù)集,建模預測用戶是否將發(fā)生換機行為,并基于預測結(jié)果核驗用戶是否在2022年4月發(fā)生換機行為,據(jù)此評估模型效果。

經(jīng)統(tǒng)計某運營商各主流手機品牌用戶量,發(fā)現(xiàn)蘋果、華為、OPPO及vivo終端用戶總占比為69.65%(詳見表4),故本文最終選取上述4個手機品牌用于換機行為預測。

表4 終端品牌用戶占比

模型結(jié)果

根據(jù)上述數(shù)據(jù)集最終得到預測換機用戶7058人(品牌分布見表5),本文將從模型效果、時效性及應用效果3個維度進行整體評估。

表5 基于正則表達式的用戶換機預測結(jié)果

1.模型效果評估

因不同數(shù)據(jù)集正負樣本比等情況會影響最終模型應用效果,故本文主要通過對比不同換機預測模型在同一數(shù)據(jù)集的表現(xiàn),評估模型效果。本文引入查準率作為模型應用效果評估指標,查準率主要用于衡量模型的準確性,以換機模型為例,查準率的定義為:查準率=預測換機且實際換機的用戶數(shù)/預測換機的用戶數(shù)。

經(jīng)建模分析,本文提出的DPI預測方法查準率為17%,較其他方法查準率提升6.1PP以上(見表6),即該模型預測查準率較好。

表6 預測模型效果對比

2.時效性評估

業(yè)務營銷使用的傳統(tǒng)規(guī)則模型及l(fā)ightGBM模型,需采集至少1個月的用戶數(shù)據(jù)方可進行換機預測。而本文使用的DPI方法僅需累計1日數(shù)據(jù),并基于現(xiàn)有資源運算14小時即可得到換機預測結(jié)果,與傳統(tǒng)方法相比,預測周期從30日縮短至2日以內(nèi)。

3.營銷效果

針對模型輸出的潛在換機用戶,根據(jù)其品牌選擇偏好匹配相應的終端政策,并將結(jié)果反饋給業(yè)務營銷人員,以便對用戶開展精準營銷。實際營銷效果統(tǒng)計顯示,模型預測目標接轉(zhuǎn)率可達1.45%,較非模型預測的1.15%提升約26%,模型應用效果良好。

總結(jié)與展望

本文提出一種基于檢索網(wǎng)站熱度分析的用戶換機意向預測模型,結(jié)合業(yè)務營銷需求及用戶品牌使用情況,選取4個手機品牌進行模型測試與評估,進而驗證了該方案在模型準確性、時效性及業(yè)務應用效果等方面均有所提升。當然,本文所提出的建模方法仍存在改進和完善的空間。一方面,可以通過補充并解析更多購機相關平臺及購機行為URL,如各平臺下單、分享商品等行為,擴大換機用戶識別范圍并提升模型查全率;另一方面,不斷拓展手機品牌及具體機型,為精準匹配用戶偏好并開展營銷提供支撐。后續(xù)我們將不斷完善購機行為解析體系,以適應不斷變化的終端市場,助力高質(zhì)量、高效率的用戶服務運營。

關鍵詞:

 

網(wǎng)站介紹  |  版權說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權所有 郵箱聯(lián)系:920 891 263@qq.com