當(dāng)前位置：主頁 > 科技論文 > 計(jì)算機(jī)應(yīng)用論文 >

司法糾紛數(shù)據(jù)的語義理解及可視分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間：2024-06-28 21:39

　　隨著信息化時(shí)代的發(fā)展,現(xiàn)有的傳統(tǒng)司法糾紛處理系統(tǒng)沒有辦法滿足時(shí)代的要求,其數(shù)據(jù)繁雜,且無法得到有效利用。以往的大量有效數(shù)據(jù)堆積,不能對(duì)未來的司法糾紛處理以及政府的決策問題產(chǎn)生正面影響。為了解決這一難題,本文通過技術(shù)手段將埋藏于海量數(shù)據(jù)當(dāng)中的社會(huì)難點(diǎn)熱點(diǎn)問題從繁雜冗余的信息中分離出來,具體分析某一時(shí)間某一地點(diǎn)的民眾糾紛問題,以實(shí)現(xiàn)社會(huì)問題的深度挖掘。同時(shí),本文運(yùn)用可視分析技術(shù),將上述數(shù)據(jù)以交互式可視圖表的方式進(jìn)行呈現(xiàn),讓市政相關(guān)工作人員可以直觀迅速地從中得到有效的參考信息。為了實(shí)現(xiàn)上述目標(biāo),本文設(shè)計(jì)了一個(gè)基于加權(quán)TF-IDF算法實(shí)現(xiàn)司法糾紛文本數(shù)據(jù)分類的方法,并實(shí)現(xiàn)了基于該方法的一套司法糾紛數(shù)據(jù)可視分析系統(tǒng)。該系統(tǒng)旨在實(shí)現(xiàn)對(duì)糾紛調(diào)解記錄這類司法短文本數(shù)據(jù)實(shí)現(xiàn)自動(dòng)分類,并運(yùn)用可視分析技術(shù)進(jìn)行呈現(xiàn),在保證數(shù)據(jù)準(zhǔn)確性的同時(shí)幫助用戶直觀準(zhǔn)確地了解到當(dāng)前社會(huì)的糾紛態(tài)勢,從而可以發(fā)現(xiàn)隱藏的社會(huì)熱點(diǎn)問題。該系統(tǒng)從原始的糾紛調(diào)解數(shù)據(jù)入手,通過數(shù)據(jù)標(biāo)注,模型訓(xùn)練,自動(dòng)分類,最后進(jìn)行可視化展示。本文將上述步驟分為三個(gè)部分。(1)自然語言處理。通過某市真實(shí)的糾紛數(shù)據(jù)的語料數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,中文分詞,半自動(dòng)文...

【文章頁數(shù)】：63 頁

【學(xué)位級(jí)別】：碩士

【部分圖文】：

圖1-1PLSA模型和LDA模型的盤子表示法比較

題的先驗(yàn)分布（每個(gè)訓(xùn)練文本的主題分布相對(duì)獨(dú)立），它的參數(shù)隨訓(xùn)練文本的個(gè)數(shù)呈線性增長，且無法應(yīng)用于測試文本。一個(gè)更加完善的主題模型為LDA模型[15](LatentDirichletAllocationModel)被提出并得到應(yīng)用。LDA模型從貝葉斯的角度為兩個(gè)多項(xiàng)式分布添加了狄利....

圖1-2由IBMWCG繪制的詞云WordCloudFigure1-2.ExampleofaWordCloudgeneratedbyIBMWCG

司法糾紛數(shù)據(jù)的語義理解及可視分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)5(1)基于詞頻的文本可視化作為最常見的基于詞頻的可視化，詞云自然不可能被忽視。詞云WordCloud是一種關(guān)鍵詞的直觀視覺描述，用于聚合用戶生成的網(wǎng)站標(biāo)簽或者文本內(nèi)容。標(biāo)簽內(nèi)容通常是單獨(dú)的詞語，排列順序靈活多變，取決于用戶想表達(dá)的....

圖2-1脫敏后的原始數(shù)據(jù)

司法糾紛數(shù)據(jù)的語義理解及可視分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)11中找到最大概率路徑，并基于該路徑基于單詞頻率找到最大分割組合。圖2-1脫敏后的原始數(shù)據(jù)Figure2-1.Theoriginaldatawithmasking同時(shí)，由于漢語的表達(dá)習(xí)慣，在分詞中需要注意停用詞的干擾。停用詞指的是樣....

圖2-2基于滾雪球的關(guān)鍵詞提取模型

啟動(dòng)；第二部分為知識(shí)挖掘部分，用于持續(xù)統(tǒng)計(jì)滾雪球模型迭代循環(huán)的過程，不停進(jìn)行抽取和模板之間自我引導(dǎo)式子的迭代，直到達(dá)到閾值，人工停止或者無法產(chǎn)生新的信息為止。第三部分為后續(xù)處理部分，即將得到的結(jié)果用于之后的工作中。在本文的工作中，輸出及后處理部分負(fù)責(zé)將輸出轉(zhuǎn)變?yōu)榭梢允褂玫闹R(shí)或者....

本文編號(hào)：3996699

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://lk138.cn/kejilunwen/shengwushengchang/3996699.html

上一篇：基于語義的航空技術(shù)標(biāo)準(zhǔn)知識(shí)管理研究
下一篇：基于卷積神經(jīng)網(wǎng)絡(luò)的心臟右心室圖像分割

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

司法糾紛數(shù)據(jù)的語義理解及可視分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)