中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

司法糾紛數據的語義理解及可視分析系統(tǒng)的設計與實現

發(fā)布時間:2024-06-28 21:39
  隨著信息化時代的發(fā)展,現有的傳統(tǒng)司法糾紛處理系統(tǒng)沒有辦法滿足時代的要求,其數據繁雜,且無法得到有效利用。以往的大量有效數據堆積,不能對未來的司法糾紛處理以及政府的決策問題產生正面影響。為了解決這一難題,本文通過技術手段將埋藏于海量數據當中的社會難點熱點問題從繁雜冗余的信息中分離出來,具體分析某一時間某一地點的民眾糾紛問題,以實現社會問題的深度挖掘。同時,本文運用可視分析技術,將上述數據以交互式可視圖表的方式進行呈現,讓市政相關工作人員可以直觀迅速地從中得到有效的參考信息。為了實現上述目標,本文設計了一個基于加權TF-IDF算法實現司法糾紛文本數據分類的方法,并實現了基于該方法的一套司法糾紛數據可視分析系統(tǒng)。該系統(tǒng)旨在實現對糾紛調解記錄這類司法短文本數據實現自動分類,并運用可視分析技術進行呈現,在保證數據準確性的同時幫助用戶直觀準確地了解到當前社會的糾紛態(tài)勢,從而可以發(fā)現隱藏的社會熱點問題。該系統(tǒng)從原始的糾紛調解數據入手,通過數據標注,模型訓練,自動分類,最后進行可視化展示。本文將上述步驟分為三個部分。(1)自然語言處理。通過某市真實的糾紛數據的語料數據,經過數據清洗,中文分詞,半自動文...

【文章頁數】:63 頁

【學位級別】:碩士

【部分圖文】:

圖1-1PLSA模型和LDA模型的盤子表示法比較

圖1-1PLSA模型和LDA模型的盤子表示法比較

題的先驗分布(每個訓練文本的主題分布相對獨立),它的參數隨訓練文本的個數呈線性增長,且無法應用于測試文本。一個更加完善的主題模型為LDA模型[15](LatentDirichletAllocationModel)被提出并得到應用。LDA模型從貝葉斯的角度為兩個多項式分布添加了狄利....


圖1-2由IBMWCG繪制的詞云WordCloudFigure1-2.ExampleofaWordCloudgeneratedbyIBMWCG

圖1-2由IBMWCG繪制的詞云WordCloudFigure1-2.ExampleofaWordCloudgeneratedbyIBMWCG

司法糾紛數據的語義理解及可視分析系統(tǒng)的設計與實現5(1)基于詞頻的文本可視化作為最常見的基于詞頻的可視化,詞云自然不可能被忽視。詞云WordCloud是一種關鍵詞的直觀視覺描述,用于聚合用戶生成的網站標簽或者文本內容。標簽內容通常是單獨的詞語,排列順序靈活多變,取決于用戶想表達的....


圖2-1脫敏后的原始數據

圖2-1脫敏后的原始數據

司法糾紛數據的語義理解及可視分析系統(tǒng)的設計與實現11中找到最大概率路徑,并基于該路徑基于單詞頻率找到最大分割組合。圖2-1脫敏后的原始數據Figure2-1.Theoriginaldatawithmasking同時,由于漢語的表達習慣,在分詞中需要注意停用詞的干擾。停用詞指的是樣....


圖2-2基于滾雪球的關鍵詞提取模型

圖2-2基于滾雪球的關鍵詞提取模型

啟動;第二部分為知識挖掘部分,用于持續(xù)統(tǒng)計滾雪球模型迭代循環(huán)的過程,不停進行抽取和模板之間自我引導式子的迭代,直到達到閾值,人工停止或者無法產生新的信息為止。第三部分為后續(xù)處理部分,即將得到的結果用于之后的工作中。在本文的工作中,輸出及后處理部分負責將輸出轉變?yōu)榭梢允褂玫闹R或者....



本文編號:3996699

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/3996699.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶77b86***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com