中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 社科論文 > 圖書檔案論文 >

關(guān)聯(lián)型實(shí)體名稱數(shù)據(jù)語(yǔ)義聚合研究

發(fā)布時(shí)間:2020-10-22 15:52
   關(guān)聯(lián)型實(shí)體名稱數(shù)據(jù)是采用關(guān)聯(lián)數(shù)據(jù)的發(fā)布形式,表示各種實(shí)體命名性指稱的數(shù)據(jù),包括對(duì)應(yīng)實(shí)體的主題和外部特征信息,蘊(yùn)含著豐富的語(yǔ)義性和復(fù)雜的關(guān)聯(lián)性,對(duì)研究數(shù)據(jù)挖掘和重塑知識(shí)體系具有重要的價(jià)值。當(dāng)前,眾多語(yǔ)義知識(shí)庫(kù)對(duì)個(gè)人、機(jī)構(gòu)、地點(diǎn)等實(shí)體數(shù)據(jù)的構(gòu)建都是基于開放和關(guān)聯(lián)的;在同一個(gè)知識(shí)庫(kù)中,不同名稱數(shù)據(jù)表征的實(shí)體之間擁有較強(qiáng)的相關(guān)性,它們潛在的關(guān)系往往不止是為用戶展示的單一關(guān)聯(lián),而是更多的表征數(shù)據(jù)多維特征及數(shù)據(jù)價(jià)值,然而潛在關(guān)系的缺失嚴(yán)重影響了知識(shí)庫(kù)的整體水平和數(shù)據(jù)質(zhì)量;在不同知識(shí)庫(kù)中,針對(duì)客觀世界同一指向的實(shí)體對(duì)象在構(gòu)建方法、表達(dá)形式、描述范圍及揭示深度上表現(xiàn)出明顯的區(qū)別,致使數(shù)據(jù)間的異構(gòu)性強(qiáng)、共享程度難、數(shù)據(jù)利用率低,暴露出信息超載和信息污染等導(dǎo)致信息生態(tài)失衡的問(wèn)題,加重了用戶在網(wǎng)絡(luò)環(huán)境下的認(rèn)知負(fù)擔(dān)。語(yǔ)義聚合成為解決上述問(wèn)題的有效途徑,既能動(dòng)態(tài)關(guān)聯(lián)和組織“知識(shí)碎片”,為發(fā)現(xiàn)新知識(shí)提供明確的方向和思路,又能消除多源異構(gòu)數(shù)據(jù)的差異,重新形成有機(jī)的、緊密的數(shù)據(jù)聚合模式,以滿足多元的知識(shí)需求和服務(wù)。本文分別基于同源數(shù)據(jù)和跨源數(shù)據(jù)對(duì)數(shù)據(jù)語(yǔ)義聚合問(wèn)題進(jìn)行了理論探討和實(shí)證研究,主要圍繞以下幾個(gè)方面開展:(1)分析了目前幾個(gè)典型知識(shí)庫(kù)中實(shí)體名稱數(shù)據(jù)的總體建設(shè)情況和差異問(wèn)題,通過(guò)比較闡述了各自的優(yōu)勢(shì)和特征,為明晰語(yǔ)義聚合問(wèn)題提供了現(xiàn)實(shí)需求。在此基礎(chǔ)上明確了關(guān)聯(lián)型實(shí)體名稱數(shù)據(jù)內(nèi)涵和特點(diǎn),提出了關(guān)聯(lián)型實(shí)體名稱數(shù)據(jù)的通用關(guān)聯(lián)模型。(2)通過(guò)歸納語(yǔ)義聚合的實(shí)現(xiàn)方法及應(yīng)用場(chǎng)景,據(jù)此作為聚合研究的理論基礎(chǔ),探討了本文選取的兩個(gè)聚合依據(jù),即利用數(shù)據(jù)的關(guān)聯(lián)性實(shí)現(xiàn)同源數(shù)據(jù)聚合,利用數(shù)據(jù)的語(yǔ)義性實(shí)現(xiàn)跨數(shù)據(jù)源聚合,并據(jù)此設(shè)計(jì)了語(yǔ)義聚合整體框架。(3)基于因果鏈求解方法和關(guān)聯(lián)規(guī)則技術(shù),分別以民國(guó)四大家族人物數(shù)據(jù)集和諾貝爾文學(xué)獎(jiǎng)作家數(shù)據(jù)集,實(shí)現(xiàn)了采用單一人物關(guān)系和多種實(shí)體關(guān)系的同源語(yǔ)義聚合實(shí)驗(yàn);基于對(duì)GADES相似度測(cè)度方法及字符串編輯距離算法的改良,以源于Wikidata和YAGO的兩組諾貝爾文學(xué)獎(jiǎng)作家數(shù)據(jù)集為對(duì)象,實(shí)現(xiàn)了強(qiáng)調(diào)語(yǔ)義性的跨數(shù)據(jù)源匹配聚合實(shí)現(xiàn),從而為以集群整體數(shù)據(jù)挖掘特征、建立關(guān)聯(lián)、發(fā)現(xiàn)資源、消除數(shù)據(jù)的多源異構(gòu)差異提供參考。
【學(xué)位單位】:山西大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:G254
【部分圖文】:

關(guān)聯(lián)規(guī)則挖掘,示例,頻繁項(xiàng)集


第二章 實(shí)體名稱數(shù)據(jù)與語(yǔ)義聚合年份_1920”,保留其余的項(xiàng)構(gòu)成 1-頻繁項(xiàng)集 L1;當(dāng) k=2 時(shí),將 L1中的項(xiàng)兩兩連接產(chǎn)生長(zhǎng)度等于 2 的項(xiàng),計(jì)算項(xiàng)的支持度,同理,確定滿足最小支持度閾值的項(xiàng),構(gòu)成 2-頻繁項(xiàng)集 L2;以此類推,L3中僅包含一個(gè)長(zhǎng)度為 3 的項(xiàng),不能產(chǎn)生 4-頻繁項(xiàng)集,停止掃描指令,合并所有的 Lk(k=1,2,3),即為真正的頻繁項(xiàng)集。

整體框架,實(shí)體名,實(shí)體關(guān)系


本文設(shè)計(jì)了基于關(guān)聯(lián)型實(shí)體名稱數(shù)據(jù)語(yǔ)義聚合整體框架,如圖2.6 所示,首先基于因果鏈求解理論及實(shí)體關(guān)系測(cè)度方法,運(yùn)用單一關(guān)系實(shí)現(xiàn)同源實(shí)體名稱數(shù)據(jù)的語(yǔ)義聚合;再?gòu)亩喾N實(shí)體關(guān)系考慮,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)將實(shí)體關(guān)聯(lián)引申為左右為不同實(shí)體類型數(shù)據(jù)的各類規(guī)則,并對(duì)聚合規(guī)則進(jìn)行詳細(xì)的分析;最后抽取跨數(shù)據(jù)源的實(shí)體名稱數(shù)據(jù),通過(guò)模式層映射及實(shí)體相似匹配算法將指向同一對(duì)象的實(shí)體名稱整合在一起,對(duì)異源異構(gòu)數(shù)據(jù)進(jìn)行語(yǔ)義聚合實(shí)踐。圖 2.6 語(yǔ)義聚合整體框架

人物關(guān)系,知識(shí)表達(dá)模型,許廣平,魯迅


并通過(guò)多個(gè)人物節(jié)點(diǎn)揭示出潛在的人物隱性關(guān)系。例如,在圖3.1 所示的配偶關(guān)系中,以“魯迅”為主節(jié)點(diǎn),“許廣平”為值節(jié)點(diǎn),由圖可知共有兩條人物關(guān)系因果鏈,分別是“‘魯迅’→‘許廣平’”和“‘魯迅’→‘周海
【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 牟冬梅;王萍;張艷俠;;基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源語(yǔ)義聚合策略[J];情報(bào)資料工作;2015年05期

2 高廣尚;張智雄;;關(guān)系數(shù)據(jù)庫(kù)中實(shí)體解析研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2015年Z1期

3 王穎;張智雄;孫輝;雷楓;;國(guó)史知識(shí)的語(yǔ)義揭示與組織方法研究[J];中國(guó)圖書館學(xué)報(bào);2015年04期

4 孫建軍;徐芳;;基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建[J];圖書館;2015年07期

5 趙森棟;劉挺;;因果關(guān)系及其在社會(huì)媒體上的應(yīng)用研究綜述[J];軟件學(xué)報(bào);2014年12期

6 邱均平;方國(guó)平;;高校圖書館語(yǔ)義化館藏資源深度聚合模式及其應(yīng)用研究[J];圖書館學(xué)研究;2014年21期

7 翟東升;張欣琦;張杰;;Derwent專利本體設(shè)計(jì)與構(gòu)建[J];情報(bào)科學(xué);2013年12期

8 何超;張玉峰;;基于本體的館藏?cái)?shù)字資源語(yǔ)義聚合與可視化研究[J];情報(bào)理論與實(shí)踐;2013年10期

9 游毅;成全;;試論基于關(guān)聯(lián)數(shù)據(jù)的館藏資源聚合模式[J];情報(bào)理論與實(shí)踐;2013年01期

10 賀德方;曾建勛;;基于語(yǔ)義的館藏資源深度聚合研究[J];中國(guó)圖書館學(xué)報(bào);2012年04期



本文編號(hào):2851801

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/tushudanganlunwen/2851801.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ca3a9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com