公安決策支持系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用與研究
【摘要】 隨著Internet的迅速發(fā)展和廣泛普及,人們對信息的需求量越來越多,各種方便、快捷的信息管理系統(tǒng)成了人們生活中不可缺少的工具。同時也為公安民警辦案和信息研判與偵破案件提供了一定的新思路和新方法,即在實(shí)際案件偵破過程中利用信息管理工具和互聯(lián)網(wǎng)技術(shù)對公安部門的案件信息進(jìn)行管理。因此,在我國的公安工作系統(tǒng)中對各類案件信息進(jìn)行管理已經(jīng)成為公安信息化未來發(fā)展的總體趨勢。本文擬要對數(shù)據(jù)挖掘技術(shù)在公安部門的應(yīng)用進(jìn)行研究,運(yùn)用數(shù)據(jù)挖掘技術(shù)來進(jìn)行開發(fā)的系統(tǒng)和公安部門傳統(tǒng)的信息管理系統(tǒng)是不同的,它不僅具有信息處理能力,還能對系統(tǒng)中的信息和數(shù)據(jù)進(jìn)行分析,然后根據(jù)分析的結(jié)果來為公安民警辦案提供決策依據(jù)。通過數(shù)據(jù)挖掘技術(shù),可以將公安部門日常處理的案件進(jìn)行統(tǒng)計和分類,根據(jù)分析的結(jié)果來對公安部門的新發(fā)案件進(jìn)行早期的預(yù)處理,這樣可以在案件處理過程中少走彎路,大大節(jié)省了警力,提高辦案效率。本文研究的主要問題是如何在公安部門中應(yīng)用數(shù)據(jù)挖掘技術(shù)來實(shí)施決策支持系統(tǒng),使得公安部門的案件管理和嫌疑人管理合理化。本文主要工作為:對數(shù)據(jù)挖掘技術(shù)和相關(guān)的開發(fā)技術(shù)進(jìn)行分析;對公安決策支持系統(tǒng)的實(shí)施進(jìn)行需求分析、設(shè)計和實(shí)現(xiàn)。這一部分是這個論文的重點(diǎn),通過詳細(xì)的設(shè)計,最終實(shí)現(xiàn)了公安決策支持系統(tǒng);分析數(shù)據(jù)挖掘技術(shù)公安決策支持系統(tǒng)中的作用,并且通過分析,得出數(shù)據(jù)挖掘的主要作用是不同的案件和嫌疑人進(jìn)行分類和分析,最終根據(jù)不同的案件類型采取相應(yīng)的偵破和處理方案。本文研究的重點(diǎn)主要有如下幾點(diǎn):(1)對系統(tǒng)的需求、設(shè)計和實(shí)現(xiàn)進(jìn)行了詳細(xì)的分析和論述,應(yīng)用面向?qū)ο蟮睦碚撏瓿闪苏麄軟件生命周期的所有開發(fā)工作。(2)設(shè)計并實(shí)現(xiàn)了一個功能比較全面的公安決策支持系統(tǒng),能夠有效地將公安部門案件的管理的功能集成在一起。(3)該系統(tǒng)能夠?qū)崿F(xiàn)公安決策支持管理的流程優(yōu)化,公安部門的管理層可以通過該系統(tǒng)對案件的偵破情況進(jìn)行管理,并可以根據(jù)結(jié)果進(jìn)行高層決策。(4)該系統(tǒng)在公安部門案件管理中的運(yùn)用,基本上實(shí)現(xiàn)了公安部門案件管理和其他管理工作的整合。(5)對數(shù)據(jù)挖掘的決策樹算法進(jìn)行研究,然后提出一種改進(jìn)的決策樹算法,通過該算法可以完成對公安部門涉及案件的嫌疑人和案件的海量數(shù)據(jù)進(jìn)行挖掘,通過挖掘得到的信息對嫌疑人和案件進(jìn)行分類。(6)本系統(tǒng)建立的公安決策支持模型是基于Web的,所以系統(tǒng)可以在不同的物理位置使用,完成分布式的數(shù)據(jù)分析和處理業(yè)務(wù)。(7)本系統(tǒng)實(shí)現(xiàn)的公安決策系統(tǒng)的數(shù)據(jù)挖掘過程能夠?qū)?shù)據(jù)進(jìn)行事先的清洗、轉(zhuǎn)換和提取,這樣就降低了后續(xù)的數(shù)據(jù)挖掘的難度。
第 1 章 緒論
本文主要是利用數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)規(guī)則性,從公安系統(tǒng)若干已處理的案件中尋找這些案件的規(guī)律和特點(diǎn),并以此為基礎(chǔ)對其他類似案件的特點(diǎn)進(jìn)行分析,這樣就能得出不同類型案件的某些主要特征。通過對公安部門這些案件的相關(guān)數(shù)據(jù)進(jìn)行分析,我們得到對案件的分析結(jié)果并對不同案件的發(fā)生規(guī)律進(jìn)行分析和統(tǒng)計。由于公安機(jī)關(guān)需要處理的案件是大量的、繁雜的,所以我們在進(jìn)行這些案件數(shù)據(jù)分析的過程中需要面對的主要問題是數(shù)據(jù)量巨大、數(shù)據(jù)結(jié)構(gòu)不完整、需要對數(shù)據(jù)進(jìn)行選擇、轉(zhuǎn)換、歸一等復(fù)雜處理,再利用分析結(jié)果對案件的作案人員、發(fā)案地點(diǎn)等信息進(jìn)行分析及目標(biāo)鎖定,發(fā)現(xiàn)案件作案人的特點(diǎn)、生活軌跡以及案件本身的特點(diǎn),進(jìn)一步為破案打下基礎(chǔ)。
本文主要的研究內(nèi)容如下所示:
(1)對當(dāng)前用于公安系統(tǒng)內(nèi)進(jìn)行決策支持系統(tǒng)的研究背景和意義進(jìn)行分析;
(2)對數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)知識和公安決策系統(tǒng)的特點(diǎn)進(jìn)行分析;
(3)詳細(xì)設(shè)計公安決策系統(tǒng)的方案。主要包括系統(tǒng)開發(fā)平臺的選擇、數(shù)據(jù)倉庫技術(shù)的應(yīng)用、決策系統(tǒng)的設(shè)計目的與設(shè)計手段等內(nèi)容,其中最核心的內(nèi)容是設(shè)計一個工具決策系統(tǒng)的實(shí)施模型;
(4)對數(shù)據(jù)挖掘的過程進(jìn)行詳細(xì)分析。具體的過程是利用關(guān)聯(lián)性分析等工具,對進(jìn)行挖掘的數(shù)據(jù)先進(jìn)行處理,然后利用聚類算法等對處理的結(jié)果進(jìn)行分析,分析的最終結(jié)果是得出一個可以供公安機(jī)關(guān)辦案民警決策的方案。
..........
第 2 章 數(shù)據(jù)挖掘技術(shù)簡介
2.1 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)倉庫是一種結(jié)構(gòu)化數(shù)據(jù)環(huán)境,并利用數(shù)據(jù)倉庫進(jìn)行決策支持和聯(lián)機(jī)事物分析。數(shù)據(jù)倉庫技術(shù)是可以從數(shù)據(jù)庫中獲得數(shù)據(jù)從而進(jìn)行處理,數(shù)據(jù)倉庫的特點(diǎn)是面向主題的、集成的、時變性和非易失性[4]。公安部門的案件信息量繁雜,信息量巨大,因此對于案件的基礎(chǔ)數(shù)據(jù)處理也是海量的,有一部分?jǐn)?shù)據(jù)對于決策有用,而有一部分則是無用數(shù)據(jù),在進(jìn)行決策的時候就需要利用數(shù)據(jù)來進(jìn)行數(shù)據(jù)挖掘,但是這種數(shù)據(jù)是分布在不同物理位置的,大量的,傳統(tǒng)的數(shù)據(jù)庫對于這種數(shù)據(jù)已經(jīng)顯得力不從心。這主要體現(xiàn)在如下幾個方面:
1.在數(shù)據(jù)的分析處理中,其分析模式和數(shù)據(jù)的事務(wù)處理模式不同,分析模式需要大量數(shù)據(jù),而且運(yùn)行時間長,同時需要大量的系統(tǒng)資源。
2.決策分析必須以大量的歷史數(shù)據(jù)為依托,但是數(shù)據(jù)庫中一般只存儲短期數(shù)據(jù),即使有些歷史數(shù)據(jù)得以保存,通常也不能得到充分利用。
2.2 決策樹算法基本理論
目前,一般利用決策樹算法進(jìn)行分類,使用決策樹算法也可以進(jìn)行數(shù)據(jù)挖掘,通過數(shù)據(jù)挖掘和分析來實(shí)現(xiàn)對數(shù)據(jù)的分類,通過分類來建立一種模型或者規(guī)則,從而通過建立的決策樹對數(shù)據(jù)進(jìn)行分類處理。 決策樹算法的作用和流程圖類似,每個決策樹中的內(nèi)部節(jié)點(diǎn)是一個特征值,筆耕文化傳播,每個從根到葉子節(jié)點(diǎn)的分支表示一個最終的輸出過程,而每個葉子節(jié)點(diǎn)就表示分類得到的一個結(jié)果集[5]。具體的決策樹算法流程如圖2.1所示。從圖2-1可以看出,首先對數(shù)據(jù)集進(jìn)行預(yù)處理,然后對得到的訓(xùn)練集進(jìn)行歸納建立決策樹,接下來通過對決策樹的剪枝等操作來提取相應(yīng)的分類規(guī)則,通過分類規(guī)則來建立規(guī)則集,然后通過規(guī)則集的預(yù)測得到新的數(shù)據(jù)集。一般都采用遞歸的方式來建立決策樹,采用的是自頂向下的生成算法。生成決策樹的過程中需要比較每個內(nèi)部節(jié)點(diǎn),然后根據(jù)得到的結(jié)果確定應(yīng)該具體生成哪個分支,經(jīng)過這樣的反復(fù)比較最終形成葉子節(jié)點(diǎn)。所以,從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的途徑就是一條決策樹的生成規(guī)則。
第3 章 公安決策支持系統(tǒng)的需求分析....................... 11
3.1 業(yè)務(wù)需求 ......................................... 11
3.2 非業(yè)務(wù)需求 ....................................... 11
第4 章 公安決策支持系統(tǒng)設(shè)計............................. 14
4.1 系統(tǒng)總體設(shè)計 ..................................... 14
第5 章 公安決策支持系統(tǒng)的實(shí)現(xiàn)........................... 27
5.1 基于OLAP 的案件數(shù)據(jù)的分析 ........................ 27
5.2 公安決策數(shù)據(jù)的預(yù)處理過程 ......................... 27
第 5 章 公安決策支持系統(tǒng)的實(shí)現(xiàn)
5.1 基于 OLAP 的案件數(shù)據(jù)的分析
對于公安決策支持系統(tǒng)實(shí)現(xiàn)的數(shù)據(jù)的分析情況,我們可以選擇不同的維度來進(jìn)行 OLAP 的操作。例如,嫌疑人、發(fā)案的時間及地點(diǎn)是一個三維數(shù)組,利用OLAP 可以對不同地區(qū)的嫌疑人的進(jìn)行案件偵破的情況分析,同時還可以按時間維進(jìn)行下鉆,看看不同地區(qū)的嫌疑人在不同時間內(nèi)的犯案情況。 系統(tǒng)的嫌疑人犯案量,案件管理人員可以在時間和嫌疑人維上進(jìn)行 OLAP操作,例如,我們可以查看公安決策支持系統(tǒng)中記錄不同嫌疑人的犯案的情況,同時還可以下鉆時間維,判斷不同的嫌疑人在不同時間內(nèi)的犯案情況。 為基于嫌疑人維具體數(shù)據(jù)進(jìn)行分析,可以分別顯示基于嫌疑人的犯案數(shù)據(jù)和基于地區(qū)的犯案數(shù)據(jù),對系統(tǒng)的任何一組數(shù)據(jù)進(jìn)行雙擊操作就可進(jìn)入下一維,從而實(shí)現(xiàn)多維數(shù)據(jù)的下鉆、切片等功能。
5.2 公安決策數(shù)據(jù)的預(yù)處理過程
前面提到不完整的,含噪聲的數(shù)據(jù)對于數(shù)據(jù)挖掘的結(jié)果有很大影響。數(shù)據(jù)不完整的原因有很多,人工輸入錯誤、數(shù)據(jù)傳輸錯誤、數(shù)據(jù)收集設(shè)備故障等都有可能會使得數(shù)據(jù)不完整。而且嫌疑人或者案件信息也可能不詳細(xì):例如嫌疑人的學(xué)歷信息、收入信息、案件的發(fā)生地構(gòu)等,這些都對嫌疑人和案件的分類有很大影響。這些信息往往在最初數(shù)據(jù)錄入的時候,案件辦理人員認(rèn)為不太重要,或者信息采集不全造成相關(guān)信息的缺失,所以數(shù)據(jù)庫中沒有這些數(shù)據(jù)信息。還有的信息填入數(shù)據(jù)時為空了,這些缺失的和空缺的信息對數(shù)據(jù)庫的數(shù)據(jù)產(chǎn)生存在一定干擾,若要數(shù)據(jù)挖掘能準(zhǔn)確有效地進(jìn)行就必須要對數(shù)據(jù)進(jìn)行清洗。具體的數(shù)據(jù)清洗的過程如圖5.1所示。
........
第 6 章 總結(jié)與展望
本文重點(diǎn)分析了 OLAP 和數(shù)據(jù)挖掘技術(shù)在公安決策支持系統(tǒng)中的應(yīng)用,本文建立的公安決策支持模型是基于 Web 的。另外本文在系統(tǒng)中還采用決策樹算法分析了公安系統(tǒng)的嫌疑人和案件的分類方法,以輔助公安部門進(jìn)行針對性的決策。通過 OLAP 和數(shù)據(jù)挖掘技術(shù),將公安部門的案件信息和嫌疑人信息從多角度、多側(cè)面展現(xiàn)出來,以供公安部門決策者使用。決策者通過這些數(shù)據(jù)能全面掌握案件和嫌疑人的情況,有針對性的采用不同的數(shù)據(jù)挖掘算法和技術(shù),利用案件和嫌疑人的基礎(chǔ)信息、案件數(shù)據(jù)和其他輔助數(shù)據(jù)對其進(jìn)行細(xì)致分析,使系統(tǒng)的運(yùn)營和管理決策更加科學(xué)、合理。
.........
參考文獻(xiàn):
[1] 于蕭榕,郭昌言,陳剛. 基于Sql Server的銷售管理系統(tǒng)的開發(fā)應(yīng)用[J]. 電腦知識與技術(shù). 2011(13)
[2] 司錫才,陳玉坤,李志剛. 數(shù)據(jù)關(guān)聯(lián)算法的研究[J]. 哈爾濱工程大學(xué)學(xué)報. 2007(07)
[3] 張錫芳,黃上騰. 軟件工程中的測試流程模型與管理[J]. 計算機(jī)應(yīng)用與軟件. 2005(08)
[4] 張文生. .NET平臺下MVC設(shè)計模式的實(shí)現(xiàn)[J]. 中國科技信息. 2005(11)
[5] 王光宏,蔣平. 數(shù)據(jù)挖掘綜述[J]. 同濟(jì)大學(xué)學(xué)報(自然科學(xué)版). 2004(02)
[6] 楊芙清,梅宏,李克勤. 軟件復(fù)用與軟件構(gòu)件技術(shù)[J]. 電子學(xué)報. 1999(02)
本文編號:11617
本文鏈接:http://www.lk138.cn/kejilunwen/jisuanjikexuelunwen/11617.html