基于網(wǎng)上拍賣的最終成交價格預測
發(fā)布時間:2024-06-30 11:16
由于網(wǎng)上拍賣的流行,對網(wǎng)上拍賣商品最終成交價格的預測,就顯得尤為重要.通過預測,投標者和賣家都可以獲得有用的信息,更好的掌握拍賣動態(tài)和規(guī)則,使拍賣得以順利進行.就本文而言,我們使用Ebay上的歷史拍賣數(shù)據(jù)對最終成交價格進行了預測,將最終成交價格分為連續(xù)型價格和離散型價格.對于連續(xù)型價格的預測,為了消除屬性之間的相關性,需要先構(gòu)建新的屬性,然后使用多元逐步回歸對所有屬性進行選擇,最終選出對最終成交價格影響較大的屬性,利用回歸樹建立預測模型,將最終成交價格分為只包含300美元以下部分和包含所有成交價格兩部分分別進行預測,我們發(fā)現(xiàn)這樣可以提高模型準確率又不損失數(shù)據(jù)集的有用信息.文章采用均方誤差根和平均絕對百分比誤差作為衡量指標與當下幾個流行的機器學習算法(本文選用多元線性回歸模型,多層感知機模型,K最近鄰模型)進行比較;對于離散型價格的預測,我們將其看成一個分類問題,使用極端梯度提升(XGBoost)建立模型并進行預測,同時將該模型與邏輯斯蒂回歸模型(Logistic Regression)進行比較,使用準確率作為衡量指標,通過十次迭代之后,取最后一次的準確率為模型準確率的最終結(jié)果,最后得出...
【文章頁數(shù)】:44 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3998695
【文章頁數(shù)】:44 頁
【學位級別】:碩士
【部分圖文】:
圖3.1Microsoft-BoxEbay拍賣頁面3.2數(shù)據(jù)預處理
州大學碩士學位論文基于網(wǎng)上拍賣的最終成交價格預測圖3.1Microsoft-BoxEbay拍賣頁面3.2數(shù)據(jù)預處理3.2.1數(shù)據(jù)的重編碼這一小節(jié),我們首先對原有數(shù)據(jù)進行重新編碼.因為數(shù)據(jù)集中條件這一列是字符串形式的,所以在建模之前將數(shù)據(jù)集中的“條件”變量重新編碼為0,1....
圖3.2SalePrice與Time的關系圖
州大學碩士學位論文基于網(wǎng)上拍賣的最終成交價格預測圖3.2SalePrice與Time的關系圖3.2.2缺失值處理因為此數(shù)據(jù)集中“郵費”這一屬性包含缺失值,所以在進行建模之前,要對缺失值進行填充.本文選取K最近鄰法填充缺失值,因為基于K個最近鄰的缺失值填充算法考慮到了屬性上下....
圖3.3買賣雙方對應關系圖
i},很顯然,m和n之間存在著一對多的關系,它們之間的關系可以通過圖3.3清晰的看出.13
圖4.5每個回歸模型的RMSE(t1)2(t1)
圖4.5每個回歸模型的RMSEgi=y(t1)l(yi,y(t1)),hi=2y(t1)l(yi,y(t1)),由于前t-1棵樹的預測分數(shù)與y的殘差對目標函數(shù)優(yōu)化不影響,將其直接去掉,將目標函數(shù)簡化為:(t)=n∑i=1[gi×ft(xi)+1....
本文編號:3998695
本文鏈接:http://www.lk138.cn/guanlilunwen/tongjijuecelunwen/3998695.html
上一篇:基于趨勢性度量的有序聚類方法探討
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著