基于數(shù)據(jù)挖掘的油田工程造價管理系統(tǒng)的設計與實現(xiàn)
發(fā)布時間:2020-12-07 16:25
近十幾年來,隨著計算科技的進步,大幅度提高了人們利用信息技術生產和搜集數(shù)據(jù)的能力,海量的數(shù)據(jù)庫軟件被用于商業(yè)管理、政府辦公、科學研究和工程開發(fā)等等領域,這一勢頭仍將持續(xù)發(fā)展下去。于是,一個新的挑戰(zhàn)被提了出來。在這所謂的信息爆炸的時代,信息過量幾乎成為人人需要面對的問題。因此,面對“人們被數(shù)據(jù)淹沒,同時卻仍然感到知識饑餓”的挑戰(zhàn),數(shù)據(jù)挖掘(Data Mining)技術應運而生,并得以蓬勃發(fā)展,越來越顯示出其強大的生命力。數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。有了這一概念之后,相應的軟件實現(xiàn)也孕育而生了,像SQL Server,Oracle等商業(yè)軟件都先后實現(xiàn)數(shù)據(jù)挖掘的相關算法。有了數(shù)據(jù)庫的支持剩下的工作就是把它和業(yè)務系統(tǒng)實現(xiàn)融合以完成具體的應用系統(tǒng)。本文首先分析遼河油田概預算管理中心的管理現(xiàn)狀,找出了現(xiàn)行管理辦法的弊端,并和中心的管理層和實際操作人員進行了有效的溝通,最終確定系統(tǒng)的功能需求。然后分析了現(xiàn)階段的軟件結構,發(fā)現(xiàn)B/S這種軟件實現(xiàn)結構迅速的代替了老式的C/S的軟件結構。接著分析了數(shù)據(jù)挖掘...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘產生因素圖示
圖 1-2 數(shù)據(jù)挖掘所涉及的學科接下來分析一下數(shù)據(jù)挖掘未來的發(fā)展方向是什么,將會呈現(xiàn)出何種趨勢?歸納起來主要有七個方面的內容:[2]1. 數(shù)據(jù)挖掘的行業(yè)標準化。首先是數(shù)據(jù)挖掘語言的標準化,數(shù)據(jù)挖掘語言將會像 SQL 語言一樣走向形式化和標準化。經過標準化了的數(shù)據(jù)挖掘語言有助于數(shù)據(jù)挖掘系統(tǒng)的開發(fā)、多個數(shù)據(jù)挖掘系統(tǒng)的功能相互轉換以及促進數(shù)據(jù)挖掘系統(tǒng)的普及使用。其次是數(shù)據(jù)挖掘組織將會成立,數(shù)據(jù)挖掘組織將有由各相關廠商聯(lián)合構成,預測模型標記語言的 XML 將有可能成為他們共同采用的一種格式來描述常見的預測模型,例如邏輯回歸分析、決策樹以及神經網(wǎng)絡模型等等。他們的目標在于創(chuàng)造出一種模型,讓其它數(shù)據(jù)探勘,以及商業(yè)智能應用程序能夠直接采用,而不需要重新手動建立程序代碼。另一個目的是讓這些使用即 XML 來描述的模型,能夠安全、實時地添加到 7×24 小時持續(xù)運作的系統(tǒng)之中。2. 數(shù)據(jù)挖掘算法的改進。這主要體現(xiàn)在可伸縮的數(shù)據(jù)挖掘算法上。與傳統(tǒng)的數(shù)據(jù)分析方法相比,數(shù)據(jù)挖掘必須能夠有效處理大量數(shù)據(jù),而且盡可能是交互式的。由于數(shù)據(jù)的激增,針對單獨或集成的數(shù)據(jù)挖掘功能的可伸縮算法顯得十分重
數(shù)據(jù)的清洗、轉換,并作為轉化之后數(shù)據(jù)的存儲載體。OLAP 作為獲取信息的分技術,也是不可缺少的,它實現(xiàn)對數(shù)據(jù)倉庫中所存儲數(shù)據(jù)的查詢、分析,使其為有用的信息。同時,DM 工具可以獲取數(shù)據(jù)倉庫中隱藏的有用信息[16]。以關數(shù)據(jù)庫為基礎構建完善的數(shù)據(jù)倉庫,可以為聯(lián)機分析處理和數(shù)據(jù)挖掘提供良好數(shù)據(jù)載體。2.2 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘,有時還譯作數(shù)據(jù)開采,一種公認的定義是 W.J.Frawley,GPiateShapiro 等人提出的:數(shù)據(jù)挖掘,就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的識,這些知識是隱含的、事先未知的、潛在有用的信息,提取的知識可表示為念(Concepts)、規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式。此定義把據(jù)挖掘的對象僅定義為數(shù)據(jù)庫,廣義地講:數(shù)據(jù)挖掘是在一些事實或觀察的集合尋找模式的決策支持過程。也就是說,數(shù)據(jù)挖掘的對象不僅是數(shù)據(jù)庫,也可以文件系統(tǒng),或其它任何數(shù)據(jù)集合[17],典型的 DM 系統(tǒng)流程如圖 2~2 所示。
本文編號:2903558
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘產生因素圖示
圖 1-2 數(shù)據(jù)挖掘所涉及的學科接下來分析一下數(shù)據(jù)挖掘未來的發(fā)展方向是什么,將會呈現(xiàn)出何種趨勢?歸納起來主要有七個方面的內容:[2]1. 數(shù)據(jù)挖掘的行業(yè)標準化。首先是數(shù)據(jù)挖掘語言的標準化,數(shù)據(jù)挖掘語言將會像 SQL 語言一樣走向形式化和標準化。經過標準化了的數(shù)據(jù)挖掘語言有助于數(shù)據(jù)挖掘系統(tǒng)的開發(fā)、多個數(shù)據(jù)挖掘系統(tǒng)的功能相互轉換以及促進數(shù)據(jù)挖掘系統(tǒng)的普及使用。其次是數(shù)據(jù)挖掘組織將會成立,數(shù)據(jù)挖掘組織將有由各相關廠商聯(lián)合構成,預測模型標記語言的 XML 將有可能成為他們共同采用的一種格式來描述常見的預測模型,例如邏輯回歸分析、決策樹以及神經網(wǎng)絡模型等等。他們的目標在于創(chuàng)造出一種模型,讓其它數(shù)據(jù)探勘,以及商業(yè)智能應用程序能夠直接采用,而不需要重新手動建立程序代碼。另一個目的是讓這些使用即 XML 來描述的模型,能夠安全、實時地添加到 7×24 小時持續(xù)運作的系統(tǒng)之中。2. 數(shù)據(jù)挖掘算法的改進。這主要體現(xiàn)在可伸縮的數(shù)據(jù)挖掘算法上。與傳統(tǒng)的數(shù)據(jù)分析方法相比,數(shù)據(jù)挖掘必須能夠有效處理大量數(shù)據(jù),而且盡可能是交互式的。由于數(shù)據(jù)的激增,針對單獨或集成的數(shù)據(jù)挖掘功能的可伸縮算法顯得十分重
數(shù)據(jù)的清洗、轉換,并作為轉化之后數(shù)據(jù)的存儲載體。OLAP 作為獲取信息的分技術,也是不可缺少的,它實現(xiàn)對數(shù)據(jù)倉庫中所存儲數(shù)據(jù)的查詢、分析,使其為有用的信息。同時,DM 工具可以獲取數(shù)據(jù)倉庫中隱藏的有用信息[16]。以關數(shù)據(jù)庫為基礎構建完善的數(shù)據(jù)倉庫,可以為聯(lián)機分析處理和數(shù)據(jù)挖掘提供良好數(shù)據(jù)載體。2.2 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘,有時還譯作數(shù)據(jù)開采,一種公認的定義是 W.J.Frawley,GPiateShapiro 等人提出的:數(shù)據(jù)挖掘,就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的識,這些知識是隱含的、事先未知的、潛在有用的信息,提取的知識可表示為念(Concepts)、規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式。此定義把據(jù)挖掘的對象僅定義為數(shù)據(jù)庫,廣義地講:數(shù)據(jù)挖掘是在一些事實或觀察的集合尋找模式的決策支持過程。也就是說,數(shù)據(jù)挖掘的對象不僅是數(shù)據(jù)庫,也可以文件系統(tǒng),或其它任何數(shù)據(jù)集合[17],典型的 DM 系統(tǒng)流程如圖 2~2 所示。
本文編號:2903558
本文鏈接:http://www.lk138.cn/guanlilunwen/chengbenguanlilunwen/2903558.html