基于檢索網(wǎng)站熱度分析的 用戶(hù)換機(jī)意向預(yù)測(cè)模型-焦點(diǎn)消息

發(fā)布時(shí)間:2023-04-27 14:38:45  |  來(lái)源:通信世界全媒體  

(CWW)在互聯(lián)網(wǎng)時(shí)代,手機(jī)已成為人們?nèi)粘I钪胁豢苫蛉钡耐ㄐ藕蛫蕵?lè)工具。對(duì)于電信運(yùn)營(yíng)商而言,通信服務(wù)與手機(jī)配套銷(xiāo)售是重要業(yè)務(wù)領(lǐng)域,而如何高效、高質(zhì)地識(shí)別有購(gòu)機(jī)需求的用戶(hù)并開(kāi)展?fàn)I銷(xiāo),是運(yùn)營(yíng)商在數(shù)字化轉(zhuǎn)型趨勢(shì)下實(shí)現(xiàn)高質(zhì)量、精細(xì)化運(yùn)營(yíng)的業(yè)務(wù)場(chǎng)景之一。以某運(yùn)營(yíng)商的數(shù)據(jù)為例,每月有更換手機(jī)行為的用戶(hù)占比為3%~4%。因此,掌握哪些用戶(hù)有潛在換機(jī)需求、用戶(hù)喜歡的手機(jī)類(lèi)型及可接受的價(jià)位等信息,準(zhǔn)確定位用戶(hù)需求并開(kāi)展針對(duì)性營(yíng)銷(xiāo),不僅有利于運(yùn)營(yíng)商擴(kuò)大用戶(hù)市場(chǎng)規(guī)模,節(jié)約營(yíng)銷(xiāo)成本;也有利于提升服務(wù)質(zhì)量,使用戶(hù)獲得更好的感知。

現(xiàn)有用戶(hù)換機(jī)意向預(yù)測(cè)模型的不足


(相關(guān)資料圖)

當(dāng)前對(duì)具有購(gòu)機(jī)意向用戶(hù)的識(shí)別,主要采用數(shù)據(jù)分析及機(jī)器學(xué)習(xí)建模等方式,基于用戶(hù)上網(wǎng)行為等運(yùn)營(yíng)商數(shù)據(jù),從海量終端用戶(hù)中篩選出有換機(jī)意愿的用戶(hù)。從目前研究方向來(lái)看,大致可分為偏理論研究和偏應(yīng)用研究?jī)深?lèi)。其中,偏理論研究側(cè)重于對(duì)不同算法、數(shù)據(jù)處理方法的探索,以提升模型預(yù)測(cè)的精準(zhǔn)度;而偏應(yīng)用的研究則聚焦于建模方式,希望建立更接近于真實(shí)應(yīng)用場(chǎng)景的模型。兩類(lèi)研究的最終目的都是在業(yè)務(wù)拓展中提升營(yíng)銷(xiāo)精準(zhǔn)度、降低營(yíng)銷(xiāo)成本。

綜合現(xiàn)有研究成果來(lái)看,無(wú)論是偏理論的研究還是偏應(yīng)用的研究,用戶(hù)換機(jī)預(yù)測(cè)模型的建立都需要采集至少一個(gè)月的用戶(hù)樣本數(shù)據(jù),并根據(jù)抽象出的標(biāo)簽屬性進(jìn)行畫(huà)像建模。這意味著從數(shù)據(jù)采集到利用模型預(yù)測(cè)出換機(jī)用戶(hù),通常情況下較用戶(hù)產(chǎn)生換機(jī)意向滯后1個(gè)多月;而在實(shí)際營(yíng)銷(xiāo)場(chǎng)景中,1個(gè)月內(nèi)用戶(hù)大概率已經(jīng)通過(guò)其他渠道完成購(gòu)機(jī)。因此,現(xiàn)有預(yù)測(cè)模型在營(yíng)銷(xiāo)實(shí)踐中,往往因時(shí)效性的限制而使應(yīng)用效果受到影響。

針對(duì)上述問(wèn)題,本文提出一種基于檢索網(wǎng)站熱度分析的用戶(hù)換機(jī)意向預(yù)測(cè)模型,該方案能夠?qū)⒂袚Q機(jī)意向用戶(hù)的識(shí)別周期由30日縮短至2日以?xún)?nèi),較業(yè)內(nèi)傳統(tǒng)預(yù)測(cè)模型查準(zhǔn)率提升6.1PP以上。模型投產(chǎn)后外呼接通轉(zhuǎn)化率提升26%,因而具有良好的應(yīng)用推廣價(jià)值。

基于檢索網(wǎng)站熱度分析預(yù)測(cè)模型的建立

換機(jī)用戶(hù)的定義

在現(xiàn)有研究中,對(duì)換機(jī)用戶(hù)的判斷主要基于終端的國(guó)際移動(dòng)設(shè)備識(shí)別碼(InternationalMobileEquipmentIdentity,IMEI)變更。但在業(yè)務(wù)實(shí)踐中,一些用戶(hù)的IMEI變更可能為假性換機(jī)信號(hào),例如用戶(hù)終端的IMEI發(fā)生短期臨時(shí)性改變,或在信息采集過(guò)程中存在偶發(fā)性的錯(cuò)誤。為助力終端營(yíng)銷(xiāo),用戶(hù)

換機(jī)意向預(yù)測(cè)模型需剔除假性換機(jī)信號(hào),識(shí)別真正具有換機(jī)意愿的用戶(hù)。故本文將換機(jī)行為定義為:用戶(hù)在當(dāng)月發(fā)生IMEI變更及機(jī)型變更,并在次月仍然使用新IMEI或新機(jī)型。與之相應(yīng)的技術(shù)性定義如下。

{[IMEI__A(M-1)≠I(mǎi)MEI__B(M)]and[MODEL__A(M-1)≠M(fèi)ODEL__B(M)]}

and

{[IMEI_B(M)=IMEI_B(M+1)]or[MODEL_B(M)=MODEL_B(M+1)]}

其中用戶(hù)使用的舊終端標(biāo)記為A,其IMEI標(biāo)記為IMEI__A,機(jī)型標(biāo)記為MODEL__A;更換的新終端標(biāo)記為B,其IMEI標(biāo)記為IMEI__B,機(jī)型標(biāo)記為MODEL__B;當(dāng)月標(biāo)記為M,上月及次月分別為M-1和M+1。

模型設(shè)計(jì)原理

為提升換機(jī)用戶(hù)識(shí)別的時(shí)效性,本文將用戶(hù)換機(jī)行為的路徑明確為:產(chǎn)生換機(jī)想法—確定預(yù)算—檢索在售機(jī)型—確定預(yù)購(gòu)機(jī)型—對(duì)比價(jià)格—購(gòu)買(mǎi)新手機(jī)。從中可以發(fā)現(xiàn),用戶(hù)產(chǎn)生購(gòu)機(jī)意向的早期信號(hào)較直觀地體現(xiàn)在相關(guān)檢索和訪問(wèn)記錄中。

目前對(duì)用戶(hù)上網(wǎng)瀏覽內(nèi)容的識(shí)別主要采用深度數(shù)據(jù)包檢測(cè)(DeepPacket Inspection,DPI)技術(shù)。用戶(hù)上網(wǎng)檢索在售手機(jī)信息時(shí),搜索內(nèi)容將以相應(yīng)規(guī)則協(xié)議的形式,通過(guò)URL編碼體現(xiàn)在用戶(hù)訪問(wèn)的網(wǎng)址中,或通過(guò)用戶(hù)終端發(fā)起請(qǐng)求的網(wǎng)址記錄呈現(xiàn)。因此,可通過(guò)DPI技術(shù)解析用戶(hù)上網(wǎng)日志中涉及換機(jī)的內(nèi)容,定位具有換機(jī)意向的用戶(hù),具體示例見(jiàn)表1。

表1 檢索訪問(wèn)vivo官網(wǎng)URL示例表2部分網(wǎng)站關(guān)鍵詞訪問(wèn)量統(tǒng)計(jì)

URL優(yōu)先級(jí)規(guī)則庫(kù)

為挖掘用戶(hù)在各類(lèi)網(wǎng)頁(yè)及APP上檢索換機(jī)相關(guān)信息的記錄,本文整理主流搜索引擎、電商網(wǎng)站等相關(guān)網(wǎng)址域名,按照檢索訪問(wèn)行為統(tǒng)計(jì)各域名下搜索手機(jī)、訪問(wèn)下單頁(yè)等URL信息,并提取關(guān)鍵詞轉(zhuǎn)化為正則表達(dá)式,獲取購(gòu)機(jī)相關(guān)URL規(guī)則共69條。

因運(yùn)營(yíng)商用戶(hù)上網(wǎng)日志數(shù)據(jù)量巨大,單日壓縮后約10~12TB,為提升解析效率,本模型采用網(wǎng)址熱度優(yōu)先級(jí)排序法及無(wú)效URL過(guò)濾法。

1.網(wǎng)址熱度優(yōu)先級(jí)排序法

分析各域名關(guān)鍵詞數(shù)量及訪問(wèn)熱度(如表2所示),對(duì)URL進(jìn)行優(yōu)先級(jí)排序,然后對(duì)用戶(hù)上網(wǎng)日志從高優(yōu)先級(jí)至低優(yōu)先級(jí)依次匹配,并提取匹配到的URL記錄。按照上述方法整理URL優(yōu)先級(jí)規(guī)則庫(kù)案例,如表3所示。

表2 部分網(wǎng)站關(guān)鍵詞訪問(wèn)量統(tǒng)計(jì)

表3URL優(yōu)先級(jí)規(guī)則庫(kù)案例

2.無(wú)效URL過(guò)濾法

在按照正則表達(dá)式匹配域名的過(guò)程中,存在大量與購(gòu)機(jī)無(wú)關(guān)的URL信息,需在解析過(guò)程中進(jìn)行剔除。以百度為例,百度定位記錄占百度域名記錄總數(shù)的13.15%,URL對(duì)于用戶(hù)購(gòu)機(jī)行為無(wú)參考意義,故需要進(jìn)行過(guò)濾。本方案最終整理剔除無(wú)效URL28條。

模型建立步驟

本文所述用戶(hù)換機(jī)意向預(yù)測(cè)模型的建立步驟如下(如圖1所示)。

圖1 基于檢索網(wǎng)站熱度分析的預(yù)測(cè)模型流程示意

第一步:域名正則表達(dá)式匹配。

1.域名匹配。輸入用戶(hù)上網(wǎng)日志數(shù)據(jù),基于URL優(yōu)先級(jí)規(guī)則庫(kù),按照優(yōu)先級(jí)依次匹配域名,若匹配成功則提取該上網(wǎng)日志數(shù)據(jù)記入待過(guò)濾數(shù)據(jù)表A,并跳過(guò)后續(xù)規(guī)則,啟動(dòng)下一條上網(wǎng)日志匹配;若69條規(guī)則均未匹配成功則剔除該上網(wǎng)日志數(shù)據(jù)。

2.無(wú)效URL過(guò)濾。將待過(guò)濾數(shù)據(jù)表A中的上網(wǎng)日志記錄,基于28條無(wú)效URL規(guī)則進(jìn)行過(guò)濾剔除,并將剔除后數(shù)據(jù)集記為待解析數(shù)據(jù)集B。

第二步:意向換機(jī)行為識(shí)別。

1.關(guān)鍵詞提取。對(duì)待解析數(shù)據(jù)集B,匹配檢索或訪問(wèn)關(guān)鍵詞并提取對(duì)應(yīng)信息,例如檢索內(nèi)容及商品編碼,并將提取內(nèi)容記入待解析數(shù)據(jù)集C。

2.換機(jī)意向識(shí)別。用待解析數(shù)據(jù)集C的記錄匹配手機(jī)品牌,若匹配成功則打標(biāo)對(duì)應(yīng)用戶(hù)換機(jī)意向?yàn)椤笆恰?,并將匹配上的手機(jī)品牌打標(biāo)為用戶(hù)偏好品牌;否則打標(biāo)用戶(hù)換機(jī)意向?yàn)椤胺瘛薄?/p>

3.預(yù)測(cè)結(jié)果輸出。輸出換機(jī)意向標(biāo)記為“是”的用戶(hù)群及其偏好的手機(jī)品牌,作為換機(jī)預(yù)測(cè)結(jié)果集D。

對(duì)基于檢索網(wǎng)站熱度分析預(yù)測(cè)模型應(yīng)用效果的評(píng)估

數(shù)據(jù)說(shuō)明

本文抽取2022年3月某一天的上網(wǎng)日志數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)集,建模預(yù)測(cè)用戶(hù)是否將發(fā)生換機(jī)行為,并基于預(yù)測(cè)結(jié)果核驗(yàn)用戶(hù)是否在2022年4月發(fā)生換機(jī)行為,據(jù)此評(píng)估模型效果。

經(jīng)統(tǒng)計(jì)某運(yùn)營(yíng)商各主流手機(jī)品牌用戶(hù)量,發(fā)現(xiàn)蘋(píng)果、華為、OPPO及vivo終端用戶(hù)總占比為69.65%(詳見(jiàn)表4),故本文最終選取上述4個(gè)手機(jī)品牌用于換機(jī)行為預(yù)測(cè)。

表4 終端品牌用戶(hù)占比

模型結(jié)果

根據(jù)上述數(shù)據(jù)集最終得到預(yù)測(cè)換機(jī)用戶(hù)7058人(品牌分布見(jiàn)表5),本文將從模型效果、時(shí)效性及應(yīng)用效果3個(gè)維度進(jìn)行整體評(píng)估。

表5 基于正則表達(dá)式的用戶(hù)換機(jī)預(yù)測(cè)結(jié)果

1.模型效果評(píng)估

因不同數(shù)據(jù)集正負(fù)樣本比等情況會(huì)影響最終模型應(yīng)用效果,故本文主要通過(guò)對(duì)比不同換機(jī)預(yù)測(cè)模型在同一數(shù)據(jù)集的表現(xiàn),評(píng)估模型效果。本文引入查準(zhǔn)率作為模型應(yīng)用效果評(píng)估指標(biāo),查準(zhǔn)率主要用于衡量模型的準(zhǔn)確性,以換機(jī)模型為例,查準(zhǔn)率的定義為:查準(zhǔn)率=預(yù)測(cè)換機(jī)且實(shí)際換機(jī)的用戶(hù)數(shù)/預(yù)測(cè)換機(jī)的用戶(hù)數(shù)。

經(jīng)建模分析,本文提出的DPI預(yù)測(cè)方法查準(zhǔn)率為17%,較其他方法查準(zhǔn)率提升6.1PP以上(見(jiàn)表6),即該模型預(yù)測(cè)查準(zhǔn)率較好。

表6 預(yù)測(cè)模型效果對(duì)比

2.時(shí)效性評(píng)估

業(yè)務(wù)營(yíng)銷(xiāo)使用的傳統(tǒng)規(guī)則模型及l(fā)ightGBM模型,需采集至少1個(gè)月的用戶(hù)數(shù)據(jù)方可進(jìn)行換機(jī)預(yù)測(cè)。而本文使用的DPI方法僅需累計(jì)1日數(shù)據(jù),并基于現(xiàn)有資源運(yùn)算14小時(shí)即可得到換機(jī)預(yù)測(cè)結(jié)果,與傳統(tǒng)方法相比,預(yù)測(cè)周期從30日縮短至2日以?xún)?nèi)。

3.營(yíng)銷(xiāo)效果

針對(duì)模型輸出的潛在換機(jī)用戶(hù),根據(jù)其品牌選擇偏好匹配相應(yīng)的終端政策,并將結(jié)果反饋給業(yè)務(wù)營(yíng)銷(xiāo)人員,以便對(duì)用戶(hù)開(kāi)展精準(zhǔn)營(yíng)銷(xiāo)。實(shí)際營(yíng)銷(xiāo)效果統(tǒng)計(jì)顯示,模型預(yù)測(cè)目標(biāo)接轉(zhuǎn)率可達(dá)1.45%,較非模型預(yù)測(cè)的1.15%提升約26%,模型應(yīng)用效果良好。

總結(jié)與展望

本文提出一種基于檢索網(wǎng)站熱度分析的用戶(hù)換機(jī)意向預(yù)測(cè)模型,結(jié)合業(yè)務(wù)營(yíng)銷(xiāo)需求及用戶(hù)品牌使用情況,選取4個(gè)手機(jī)品牌進(jìn)行模型測(cè)試與評(píng)估,進(jìn)而驗(yàn)證了該方案在模型準(zhǔn)確性、時(shí)效性及業(yè)務(wù)應(yīng)用效果等方面均有所提升。當(dāng)然,本文所提出的建模方法仍存在改進(jìn)和完善的空間。一方面,可以通過(guò)補(bǔ)充并解析更多購(gòu)機(jī)相關(guān)平臺(tái)及購(gòu)機(jī)行為URL,如各平臺(tái)下單、分享商品等行為,擴(kuò)大換機(jī)用戶(hù)識(shí)別范圍并提升模型查全率;另一方面,不斷拓展手機(jī)品牌及具體機(jī)型,為精準(zhǔn)匹配用戶(hù)偏好并開(kāi)展?fàn)I銷(xiāo)提供支撐。后續(xù)我們將不斷完善購(gòu)機(jī)行為解析體系,以適應(yīng)不斷變化的終端市場(chǎng),助力高質(zhì)量、高效率的用戶(hù)服務(wù)運(yùn)營(yíng)。

關(guān)鍵詞:

 

網(wǎng)站介紹  |  版權(quán)說(shuō)明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號(hào):京ICP備2022016840號(hào)-16 營(yíng)業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com