音樂流媒體的用戶流失預(yù)測分析
發(fā)布時間:2020-12-03 07:46
隨著更多極具競爭力產(chǎn)品不斷地涌入市場,用戶有著更高的主動性去選擇其感興趣的音樂流媒體服務(wù),導(dǎo)致各平臺必將面臨用戶流失問題加劇的危險。然而,一方面由于音樂流媒體的用戶記錄數(shù)據(jù)更新速度較快,一個模型并不能產(chǎn)生永久的效用。另一方面,針對不同行業(yè)、不同特征的數(shù)據(jù)集,用戶流失預(yù)警模型具有不同的表現(xiàn)形態(tài),不能一概而論。所以,要保證用戶流失預(yù)警體系的實時性,必須對新業(yè)務(wù)和新數(shù)據(jù)集進(jìn)行新的研究。綜上所述,有必要針對音樂流媒體的用戶流失預(yù)測問題展開研究,確保準(zhǔn)確預(yù)測訂閱業(yè)務(wù)中付費(fèi)用戶流失,這對平臺長期成功至關(guān)重要。針對上述問題,考慮到某個音樂流媒體服務(wù)平臺對付費(fèi)用戶流失預(yù)測的需求,本文選取了2015年1月1日至2017年2月28日該平臺生成的用戶記錄數(shù)據(jù)作為原始數(shù)據(jù)。通過數(shù)據(jù)挖掘的相關(guān)方法對訂閱用戶在當(dāng)前會員資格到期后的30天內(nèi)是否會流失的問題進(jìn)行了研究。在研究內(nèi)容上,本文主要從分類分析和聚類分析兩個角度,展開音樂流媒體用戶流失預(yù)測模型分析、用戶流失原因及用戶細(xì)分模型分析兩個方面的討論研究。首先,在流失預(yù)測模型分析方面。利用Python軟件,對各數(shù)據(jù)集初步清洗后進(jìn)行單變量和多變量對比的特征分析,探索音樂...
【文章來源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【部分圖文】:
-means算法流程圖
圖 2 性別變量、流失變量分布圖.2 多變量對比分析各個變量進(jìn)行獨(dú)立的統(tǒng)計分析后,接下來探索變量相互間的特性。通過比較各變對應(yīng)的流失標(biāo)簽變量的總數(shù),可以較為直觀地了解各變量與流失標(biāo)簽的關(guān)系以及體分布情況。具體結(jié)果如下:1)各城市的用戶流失情況對比、不同性別下用戶流失情況對比下圖 3 中的左圖可知,來自編碼為 1 的城市的用戶最多,同時所占的流失比例也以初步認(rèn)為編碼 1 的城市對流失預(yù)測具有很大的影響。從圖 3 中的右圖中可以看男女?dāng)?shù)量相當(dāng),其中的流失人數(shù)也相當(dāng),說明年齡字段點用戶流失預(yù)測影響不大前對年齡字段對變量分析結(jié)果,可以明確可以在建模時刪除性別變量。
教宓撓沒Я魘гげ夥治?2圖 2 性別變量、流失變量分布圖3.3.2 多變量對比分析對各個變量進(jìn)行獨(dú)立的統(tǒng)計分析后,接下來探索變量相互間的特性。通過比較各變量取值下對應(yīng)的流失標(biāo)簽變量的總數(shù),可以較為直觀地了解各變量與流失標(biāo)簽的關(guān)系以及數(shù)據(jù)的大體分布情況。具體結(jié)果如下:(1)各城市的用戶流失情況對比、不同性別下用戶流失情況對比從下圖 3 中的左圖可知,來自編碼為 1 的城市的用戶最多,同時所占的流失比例也最大。可以初步認(rèn)為編碼 1 的城市對流失預(yù)測具有很大的影響。從圖 3 中的右圖中可以看到用戶的男女?dāng)?shù)量相當(dāng),其中的流失人數(shù)也相當(dāng),說明年齡字段點用戶流失預(yù)測影響不大,結(jié)合之前對年齡字段對變量分析結(jié)果,可以明確可以在建模時刪除性別變量。圖 3 各城市用戶流失情況對比圖及不同性別下用戶流失情況對比圖(2)不同訂閱支付方式下和不同注冊方式下用戶流失情況對比由下圖 4 中的左圖可知,編碼為 41 的訂閱支付方式最受用戶歡迎,而且其中的流失用戶數(shù)量與其他支付方式區(qū)別不大,編碼為 38 的支付方式用戶流失占比最大。從圖 4 中
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林與RFM模型的財險客戶分類管理研究[J]. 閆春,孫海棠,李亞琪. 科技與經(jīng)濟(jì). 2018(01)
[2]基于客戶價值的客戶行為特征分類模型探討[J]. 朱明英,邢豫,王海霞,王保中. 現(xiàn)代計算機(jī)(專業(yè)版). 2017(01)
[3]基于新三維客戶細(xì)分模型的線上會員客戶價值研究[J]. 葉志龍,黃章樹. 統(tǒng)計與信息論壇. 2016(05)
[4]基于組合預(yù)測的電信客戶流失預(yù)測[J]. 陳曄,覃曉群. 計算機(jī)與數(shù)字工程. 2015(04)
[5]基于代價敏感決策樹的客戶價值細(xì)分(英文)[J]. 鄒鵬,莫佳卉,江亦華,葉強(qiáng). 管理科學(xué). 2011(02)
[6]基于錯分類成本的AdaBoost客戶流失預(yù)測模型研究[J]. 唐邁. 中國商界(上半月). 2010(11)
[7]基于聚類分析的客戶細(xì)分研究[J]. 季越江,呂佳. 辦公自動化. 2009(08)
[8]聚類算法在銀行客戶細(xì)分中的應(yīng)用[J]. 花海洋,趙懷慈. 計算機(jī)工程. 2008(24)
[9]聚類分析在客戶細(xì)分中的研究與應(yīng)用[J]. 趙喜倉,崔冬梅,竇志紅. 江蘇商論. 2007(08)
[10]數(shù)據(jù)挖掘方法在用戶流失預(yù)測分析中的應(yīng)用[J]. 劉光遠(yuǎn),苑森淼,董立巖. 計算機(jī)工程與應(yīng)用. 2007(09)
博士論文
[1]基于半監(jiān)督和集成學(xué)習(xí)的不平衡數(shù)據(jù)特征選擇和分類[D]. 房曉南.山東師范大學(xué) 2016
碩士論文
[1]基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)消費(fèi)者價值研究[D]. 魏秀安.哈爾濱商業(yè)大學(xué) 2017
[2]基于支持向量機(jī)的不平衡數(shù)據(jù)分類算法研究[D]. 劉東啟.浙江大學(xué) 2017
[3]基于數(shù)據(jù)挖掘的網(wǎng)購用戶流失預(yù)測研究[D]. 郭成蹊.吉林大學(xué) 2016
[4]基于RFM改進(jìn)模型的互聯(lián)網(wǎng)金融平臺用戶細(xì)分研究[D]. 吳曉雪.北京交通大學(xué) 2016
[5]移動通信網(wǎng)用戶流失預(yù)測[D]. 尹丹丹.中國科學(xué)技術(shù)大學(xué) 2016
[6]網(wǎng)絡(luò)客戶流失預(yù)測算法研究[D]. 馬文斌.廣西師范大學(xué) 2016
[7]高維數(shù)據(jù)集上的降維算法及其應(yīng)用[D]. 肖招娣.華南理工大學(xué) 2013
[8]網(wǎng)購客戶流失的實證分析[D]. 馮倩.西南財經(jīng)大學(xué) 2013
[9]基于數(shù)據(jù)挖掘的客戶流失預(yù)測實證研究[D]. 司學(xué)峰.北京工業(yè)大學(xué) 2009
本文編號:2896217
【文章來源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【部分圖文】:
-means算法流程圖
圖 2 性別變量、流失變量分布圖.2 多變量對比分析各個變量進(jìn)行獨(dú)立的統(tǒng)計分析后,接下來探索變量相互間的特性。通過比較各變對應(yīng)的流失標(biāo)簽變量的總數(shù),可以較為直觀地了解各變量與流失標(biāo)簽的關(guān)系以及體分布情況。具體結(jié)果如下:1)各城市的用戶流失情況對比、不同性別下用戶流失情況對比下圖 3 中的左圖可知,來自編碼為 1 的城市的用戶最多,同時所占的流失比例也以初步認(rèn)為編碼 1 的城市對流失預(yù)測具有很大的影響。從圖 3 中的右圖中可以看男女?dāng)?shù)量相當(dāng),其中的流失人數(shù)也相當(dāng),說明年齡字段點用戶流失預(yù)測影響不大前對年齡字段對變量分析結(jié)果,可以明確可以在建模時刪除性別變量。
教宓撓沒Я魘гげ夥治?2圖 2 性別變量、流失變量分布圖3.3.2 多變量對比分析對各個變量進(jìn)行獨(dú)立的統(tǒng)計分析后,接下來探索變量相互間的特性。通過比較各變量取值下對應(yīng)的流失標(biāo)簽變量的總數(shù),可以較為直觀地了解各變量與流失標(biāo)簽的關(guān)系以及數(shù)據(jù)的大體分布情況。具體結(jié)果如下:(1)各城市的用戶流失情況對比、不同性別下用戶流失情況對比從下圖 3 中的左圖可知,來自編碼為 1 的城市的用戶最多,同時所占的流失比例也最大。可以初步認(rèn)為編碼 1 的城市對流失預(yù)測具有很大的影響。從圖 3 中的右圖中可以看到用戶的男女?dāng)?shù)量相當(dāng),其中的流失人數(shù)也相當(dāng),說明年齡字段點用戶流失預(yù)測影響不大,結(jié)合之前對年齡字段對變量分析結(jié)果,可以明確可以在建模時刪除性別變量。圖 3 各城市用戶流失情況對比圖及不同性別下用戶流失情況對比圖(2)不同訂閱支付方式下和不同注冊方式下用戶流失情況對比由下圖 4 中的左圖可知,編碼為 41 的訂閱支付方式最受用戶歡迎,而且其中的流失用戶數(shù)量與其他支付方式區(qū)別不大,編碼為 38 的支付方式用戶流失占比最大。從圖 4 中
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林與RFM模型的財險客戶分類管理研究[J]. 閆春,孫海棠,李亞琪. 科技與經(jīng)濟(jì). 2018(01)
[2]基于客戶價值的客戶行為特征分類模型探討[J]. 朱明英,邢豫,王海霞,王保中. 現(xiàn)代計算機(jī)(專業(yè)版). 2017(01)
[3]基于新三維客戶細(xì)分模型的線上會員客戶價值研究[J]. 葉志龍,黃章樹. 統(tǒng)計與信息論壇. 2016(05)
[4]基于組合預(yù)測的電信客戶流失預(yù)測[J]. 陳曄,覃曉群. 計算機(jī)與數(shù)字工程. 2015(04)
[5]基于代價敏感決策樹的客戶價值細(xì)分(英文)[J]. 鄒鵬,莫佳卉,江亦華,葉強(qiáng). 管理科學(xué). 2011(02)
[6]基于錯分類成本的AdaBoost客戶流失預(yù)測模型研究[J]. 唐邁. 中國商界(上半月). 2010(11)
[7]基于聚類分析的客戶細(xì)分研究[J]. 季越江,呂佳. 辦公自動化. 2009(08)
[8]聚類算法在銀行客戶細(xì)分中的應(yīng)用[J]. 花海洋,趙懷慈. 計算機(jī)工程. 2008(24)
[9]聚類分析在客戶細(xì)分中的研究與應(yīng)用[J]. 趙喜倉,崔冬梅,竇志紅. 江蘇商論. 2007(08)
[10]數(shù)據(jù)挖掘方法在用戶流失預(yù)測分析中的應(yīng)用[J]. 劉光遠(yuǎn),苑森淼,董立巖. 計算機(jī)工程與應(yīng)用. 2007(09)
博士論文
[1]基于半監(jiān)督和集成學(xué)習(xí)的不平衡數(shù)據(jù)特征選擇和分類[D]. 房曉南.山東師范大學(xué) 2016
碩士論文
[1]基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)消費(fèi)者價值研究[D]. 魏秀安.哈爾濱商業(yè)大學(xué) 2017
[2]基于支持向量機(jī)的不平衡數(shù)據(jù)分類算法研究[D]. 劉東啟.浙江大學(xué) 2017
[3]基于數(shù)據(jù)挖掘的網(wǎng)購用戶流失預(yù)測研究[D]. 郭成蹊.吉林大學(xué) 2016
[4]基于RFM改進(jìn)模型的互聯(lián)網(wǎng)金融平臺用戶細(xì)分研究[D]. 吳曉雪.北京交通大學(xué) 2016
[5]移動通信網(wǎng)用戶流失預(yù)測[D]. 尹丹丹.中國科學(xué)技術(shù)大學(xué) 2016
[6]網(wǎng)絡(luò)客戶流失預(yù)測算法研究[D]. 馬文斌.廣西師范大學(xué) 2016
[7]高維數(shù)據(jù)集上的降維算法及其應(yīng)用[D]. 肖招娣.華南理工大學(xué) 2013
[8]網(wǎng)購客戶流失的實證分析[D]. 馮倩.西南財經(jīng)大學(xué) 2013
[9]基于數(shù)據(jù)挖掘的客戶流失預(yù)測實證研究[D]. 司學(xué)峰.北京工業(yè)大學(xué) 2009
本文編號:2896217
本文鏈接:http://www.lk138.cn/guanlilunwen/tongjijuecelunwen/2896217.html
最近更新
教材專著