中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當前位置:主頁 > 科技論文 > 自動化論文 >

基于粗糙集的鐵路列車客票收入知識發(fā)現(xiàn)及預測模型研究

發(fā)布時間:2020-04-09 07:09
【摘要】:為了更合理地提高鐵路客票收入,分配運輸資源,管理部門會根據(jù)既有列車客票收入情況、開行情況、沿途車站發(fā)送旅客人數(shù)等因素形成一張收入決策表,依據(jù)此對新開行列車客票收入進行預測,這樣既可以更合理地為鐵路局下達下一階段的客運收入指標,也為管理部門有效地進行成本控制和客運組織提供了保障。但是,隨著我國高速鐵路網(wǎng)絡(luò)建設(shè)的飛速發(fā)展,列車開行情況更加復雜多樣。面對新的形式,相關(guān)管理人員仍然憑借經(jīng)驗或人工干預的方式對影響客票收入的因素進行處理,再根據(jù)這些處理的結(jié)果對客票收入進行預測。實踐證明,其結(jié)果已經(jīng)不能滿足預算工作的需要。目前,基于粗糙集理論方法的知識發(fā)現(xiàn)模型已被應(yīng)用于多個領(lǐng)域,并且取得了比較顯著的效果。但是,應(yīng)用于旅客列車客票收入知識發(fā)現(xiàn)和預測仍處于起步階段。由于影響鐵路客票收入的因素較多,數(shù)據(jù)類型復雜、具有非線性、高噪音等特征,因此,本文提出了一個基于粗糙集的客票收入知識發(fā)現(xiàn)和預測模型,利用其挖掘出客票收入知識背后潛在的規(guī)則,形成一套能夠?qū)推笔杖脒M行有效預測的知識發(fā)現(xiàn)模型系統(tǒng),在理論和實際應(yīng)用方面都具有重要意義。本文將列車整體和沿途各站客票收入作為研究對象,在模型中構(gòu)建了數(shù)據(jù)預處理、基于粗糙集的知識發(fā)現(xiàn)、收入預測等三個模塊。在第一個模塊中,針對客票收入知識發(fā)現(xiàn)的數(shù)據(jù)特點,提出了一種“K-means-CACC”算法對目標變量進行離散化處理,此算法避免了非監(jiān)督離散化方法忽略數(shù)據(jù)分布信息、區(qū)間邊界確定不具有代表性等缺點。在第二個模塊中,基于粗糙集理論方法計算條件屬性對決策屬性的依賴程度,采用基于核屬性的啟發(fā)式約簡算法將初始決策表中的冗余屬性進行約簡;采用隨機森林算法構(gòu)建客票收入知識發(fā)現(xiàn)規(guī)則,此方法避免了關(guān)聯(lián)分析方法無法計算出規(guī)則和產(chǎn)生矛盾規(guī)則的問題。最后,基于上述生成的知識規(guī)則庫,本文提出了“粗糙集-集成學習”模型對客票收入進行預測,此模型將深度神經(jīng)網(wǎng)絡(luò)長短期記憶法LSTM(Long short-term Memory)、XGBoost(Extreme Gradient Boosting)算法和基于誤差區(qū)間交集的目標選取算法作為個體學習器分別進行收入預測,再按照Stacking集成算法進行融合。在論文的最后,針對各模塊中提出和利用的方法,依據(jù)實際客票營銷數(shù)據(jù)進行了有效性驗證。驗證結(jié)果表明,上述方法能夠有效地形成簡明、易于理解的決策表并且較現(xiàn)行方法能夠更精確地對客票收入進行預測。
【圖文】:

論域,邊界域,不確定,包價


RXxUxXR| (公式 2-3 所示,邊界域可以定義為: BNXRXRXR (域表示論域邊界的不確定域,即不能確定屬于邊界域的那些元素被確切地 或 X 的補集?梢砸瓿稣搮^(qū)域的概念,如公式 2-4 所示,正區(qū)域可以被定義為: POSXRXR (示知識能完全屬于集合 X 。式 2-5 所示,負區(qū)域可以被定義為: NEGXURXR (示知識不確定屬于集合 。,,X 為U 的子集,即 X U,根據(jù)R 的描述來劃分集合 X 。設(shè) Rx 表示包價類,其中 x為論域U 元素。當 RXRX 時,就稱 X 就是粗糙的。

過程圖,知識發(fā)現(xiàn),過程,決策屬性


圖 2-2 基于粗糙集理論方法的知識發(fā)現(xiàn)過程Figure 2-2 Knowledge Discovery Process Based on Rough Set Theory準備和預處理據(jù)準備是指用戶在數(shù)據(jù)準備階段根據(jù)業(yè)務(wù)需求抽取數(shù)據(jù),形成待處理數(shù)是指消除待處理數(shù)據(jù)中的冗余,錯誤,噪聲,重復等數(shù)據(jù)。對于本文討論集理論方法的要求,需要將連續(xù)性數(shù)據(jù)通過相關(guān)算法轉(zhuǎn)化為離散型數(shù)據(jù)化決策表過數(shù)據(jù)準備和預處理,根據(jù)業(yè)務(wù)需求,在數(shù)據(jù)表中定義條件屬性和決策)構(gòu)成初始決策表。在表中,決策屬性是知識發(fā)現(xiàn)的目標,條件屬性是對決策屬性產(chǎn)生影響的因素。定性度量量自然現(xiàn)象的不確定性程度稱為不確定性度量。如前面論述的一樣,粗能夠處理具有不精確和不確定性問題的數(shù)學工具。如何度量利用粗糙集
【學位授予單位】:中國鐵道科學研究院
【學位級別】:博士
【學位授予年份】:2018
【分類號】:U293.22

【參考文獻】

相關(guān)期刊論文 前10條

1 蘇志達;祝躍飛;劉龍;;基于深度學習的安卓惡意應(yīng)用檢測[J];計算機應(yīng)用;2017年06期

2 韋曉路;徐寬;;基于非相關(guān)發(fā)明專利文獻的潛在知識關(guān)聯(lián)分析研究述評[J];圖書館學研究;2015年10期

3 張鈺莎;蔣盛益;;連續(xù)屬性離散化算法研究綜述[J];計算機應(yīng)用與軟件;2014年08期

4 李海霞;;基于可變精度粗糙集模型的有導師機器學習[J];東莞理工學院學報;2014年03期

5 李曉龍;張兆翔;王蘊紅;劉慶杰;;深度學習在航拍場景分類中的應(yīng)用[J];計算機科學與探索;2014年03期

6 何超;張玉峰;;基于語義關(guān)聯(lián)分析的商務(wù)情報分析算法研究[J];情報雜志;2013年04期

7 張建華;祁力鈞;冀榮華;王虎;黃士凱;王沛;;基于粗糙集和BP神經(jīng)網(wǎng)絡(luò)的棉花病害識別[J];農(nóng)業(yè)工程學報;2012年07期

8 王翰釗;李景文;;基于神經(jīng)網(wǎng)絡(luò)知識發(fā)現(xiàn)的GIS決策支持系統(tǒng)[J];測繪與空間地理信息;2012年02期

9 李明;劉魯;苗蕊;朱延秋;;基于貝葉斯信念網(wǎng)絡(luò)的多案例庫檢索方法[J];北京工業(yè)大學學報;2012年01期

10 高爽;冬雷;高陽;廖曉鐘;;基于粗糙集理論的中長期風速預測[J];中國電機工程學報;2012年01期



本文編號:2620460

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/2620460.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9acca***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com