數(shù)據(jù)驅(qū)動(dòng)的細(xì)粒度中文屬性對(duì)齊方法
[Abstract]:In order to improve the accuracy of attribute relationship recognition among Chinese open source data sets, a data-driven fine-grained alignment method is proposed to identify the synonyms, inclusions and correlations among attributes by using the extension of attributes and the domain of definition. Methods firstly, the data types of attributes are determined by statistical theory, and the method of calculating the similarity of attributes is given. On this basis, attribute relationship recognition is modeled as a multi-classification problem, and effective features are extracted to describe different relationships and to be used in the construction of stochastic forest model. The experimental results show that the accuracy of attribute data type discrimination in this method is 94.60.The F1 values of synonym, inclusion and correlation recognition are 71.37.3% and 59.9%, respectively. Compared with traditional methods which only focus on synonymous attributes fine-grained attribute alignment not only improves the accuracy of synonymous attribute recognition but also recognizes mutually contained and related attributes which proves its effectiveness in Chinese open source data sets.
【作者單位】: 中科院空間信息處理與應(yīng)用系統(tǒng)技術(shù)重點(diǎn)實(shí)驗(yàn)室;中國科學(xué)院電子學(xué)研究所;中國科學(xué)院大學(xué);
【基金】:國家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)資助項(xiàng)目(2012AA011005)
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張愛平;張小紅;;屬性值為語言區(qū)間的多屬性決策方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年07期
2 崔勇;高巖;王福利;王子敬;;模糊信息系統(tǒng)屬性值的重要性度量[J];河南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年04期
3 李中華,施麗華,李玉茜;屬性的增量賦值[J];計(jì)算機(jī)工程;1993年01期
4 ;第六章 多屬性索引法[J];計(jì)算機(jī)工程與應(yīng)用;1981年Z2期
5 關(guān)欣;衣曉;何友;周一宇;;一種區(qū)間屬性值離散化的新方法[J];宇航學(xué)報(bào);2009年03期
6 張艷芹;張虹;楊習(xí)貝;;區(qū)間屬性值信息系統(tǒng)的不確定性度量[J];計(jì)算機(jī)應(yīng)用與軟件;2009年01期
7 程顯毅;施Oz;沈?qū)W華;田宇賀;;屬性和屬性值組合的概念模板[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期
8 林宏康;范成賢;史開泉;;倒向P-推理與屬性剩余發(fā)現(xiàn)-應(yīng)用[J];計(jì)算機(jī)科學(xué);2011年10期
9 坐看云起;《天使》人物屬性攻略[J];網(wǎng)絡(luò)與信息;2002年11期
10 洪帆,饒雙宜,段素娟;基于屬性的權(quán)限—角色分配模型[J];計(jì)算機(jī)應(yīng)用;2004年S2期
相關(guān)會(huì)議論文 前2條
1 王宇;方濱興;吳博;宋林海;郭巖;;結(jié)合屬性分布特征的模式匹配算法[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 張亮;胡學(xué)鋼;;多層次屬性值下概念格的動(dòng)態(tài)轉(zhuǎn)化[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2006年
相關(guān)重要報(bào)紙文章 前4條
1 重慶 韓濤;中望CAD中塊屬性的制作[N];電腦報(bào);2004年
2 7Star;教你做RM壓縮程序[N];電腦報(bào);2003年
3 北京郵電大學(xué) 張劍;通過DOM操作數(shù)據(jù)(下)[N];計(jì)算機(jī)世界;2001年
4 ;查找替換的技巧[N];中國電腦教育報(bào);2001年
相關(guān)碩士學(xué)位論文 前10條
1 張麗芬;一種基于混合QOS的服務(wù)選擇方法[D];華中師范大學(xué);2015年
2 于芳芳;基于屬性的權(quán)限訪問控制研究與應(yīng)用[D];河北工業(yè)大學(xué);2015年
3 高乙童;大數(shù)據(jù)時(shí)效性關(guān)鍵技術(shù)的研究[D];哈爾濱工業(yè)大學(xué);2016年
4 陳祖軍;基于偽近鄰及區(qū)間距離的不完備數(shù)據(jù)聚類方法[D];大連理工大學(xué);2016年
5 趙爽;基于敏感屬性值語義的個(gè)性化匿名方法研究[D];天津財(cái)經(jīng)大學(xué);2015年
6 徐海堂;屬性證書及應(yīng)用研究[D];中國人民解放軍信息工程大學(xué);2005年
7 童先群;基于屬性值信息熵的KNN算法改進(jìn)研究[D];漳州師范學(xué)院;2010年
8 張秀麗;符號(hào)屬性值的相似度學(xué)習(xí)及屬性重要性研究[D];河北大學(xué);2011年
9 張朝勝;領(lǐng)域本體概念實(shí)例、屬性及屬性值提取研究[D];昆明理工大學(xué);2011年
10 雷玉霞;基于本體的軍事知識(shí)聯(lián)通[D];中國科學(xué)院研究生院(軟件研究所);2002年
,本文編號(hào):2325361
本文鏈接:http://www.lk138.cn/kejilunwen/ruanjiangongchenglunwen/2325361.html