關(guān)聯(lián)型實(shí)體名稱數(shù)據(jù)語(yǔ)義聚合研究
【學(xué)位單位】:山西大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:G254
【部分圖文】:
第二章 實(shí)體名稱數(shù)據(jù)與語(yǔ)義聚合年份_1920”,保留其余的項(xiàng)構(gòu)成 1-頻繁項(xiàng)集 L1;當(dāng) k=2 時(shí),將 L1中的項(xiàng)兩兩連接產(chǎn)生長(zhǎng)度等于 2 的項(xiàng),計(jì)算項(xiàng)的支持度,同理,確定滿足最小支持度閾值的項(xiàng),構(gòu)成 2-頻繁項(xiàng)集 L2;以此類推,L3中僅包含一個(gè)長(zhǎng)度為 3 的項(xiàng),不能產(chǎn)生 4-頻繁項(xiàng)集,停止掃描指令,合并所有的 Lk(k=1,2,3),即為真正的頻繁項(xiàng)集。
本文設(shè)計(jì)了基于關(guān)聯(lián)型實(shí)體名稱數(shù)據(jù)語(yǔ)義聚合整體框架,如圖2.6 所示,首先基于因果鏈求解理論及實(shí)體關(guān)系測(cè)度方法,運(yùn)用單一關(guān)系實(shí)現(xiàn)同源實(shí)體名稱數(shù)據(jù)的語(yǔ)義聚合;再?gòu)亩喾N實(shí)體關(guān)系考慮,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)將實(shí)體關(guān)聯(lián)引申為左右為不同實(shí)體類型數(shù)據(jù)的各類規(guī)則,并對(duì)聚合規(guī)則進(jìn)行詳細(xì)的分析;最后抽取跨數(shù)據(jù)源的實(shí)體名稱數(shù)據(jù),通過(guò)模式層映射及實(shí)體相似匹配算法將指向同一對(duì)象的實(shí)體名稱整合在一起,對(duì)異源異構(gòu)數(shù)據(jù)進(jìn)行語(yǔ)義聚合實(shí)踐。圖 2.6 語(yǔ)義聚合整體框架
并通過(guò)多個(gè)人物節(jié)點(diǎn)揭示出潛在的人物隱性關(guān)系。例如,在圖3.1 所示的配偶關(guān)系中,以“魯迅”為主節(jié)點(diǎn),“許廣平”為值節(jié)點(diǎn),由圖可知共有兩條人物關(guān)系因果鏈,分別是“‘魯迅’→‘許廣平’”和“‘魯迅’→‘周海
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 牟冬梅;王萍;張艷俠;;基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源語(yǔ)義聚合策略[J];情報(bào)資料工作;2015年05期
2 高廣尚;張智雄;;關(guān)系數(shù)據(jù)庫(kù)中實(shí)體解析研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2015年Z1期
3 王穎;張智雄;孫輝;雷楓;;國(guó)史知識(shí)的語(yǔ)義揭示與組織方法研究[J];中國(guó)圖書館學(xué)報(bào);2015年04期
4 孫建軍;徐芳;;基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建[J];圖書館;2015年07期
5 趙森棟;劉挺;;因果關(guān)系及其在社會(huì)媒體上的應(yīng)用研究綜述[J];軟件學(xué)報(bào);2014年12期
6 邱均平;方國(guó)平;;高校圖書館語(yǔ)義化館藏資源深度聚合模式及其應(yīng)用研究[J];圖書館學(xué)研究;2014年21期
7 翟東升;張欣琦;張杰;;Derwent專利本體設(shè)計(jì)與構(gòu)建[J];情報(bào)科學(xué);2013年12期
8 何超;張玉峰;;基于本體的館藏?cái)?shù)字資源語(yǔ)義聚合與可視化研究[J];情報(bào)理論與實(shí)踐;2013年10期
9 游毅;成全;;試論基于關(guān)聯(lián)數(shù)據(jù)的館藏資源聚合模式[J];情報(bào)理論與實(shí)踐;2013年01期
10 賀德方;曾建勛;;基于語(yǔ)義的館藏資源深度聚合研究[J];中國(guó)圖書館學(xué)報(bào);2012年04期
本文編號(hào):2851801
本文鏈接:http://www.lk138.cn/tushudanganlunwen/2851801.html