面向知識圖譜的表示學(xué)習(xí)研究
發(fā)布時(shí)間:2020-08-04 19:25
【摘要】:隨著科技的發(fā)展,我們逐漸進(jìn)入一個(gè)信息化,智能化時(shí)代。海量新的數(shù)據(jù)和信息每天都以不同的形式產(chǎn)生,移動互聯(lián)網(wǎng)已成為目前最有效便捷的信息獲取平臺,如何從海量數(shù)據(jù)中獲取有效信息已成為眾多領(lǐng)域面臨的主要難題。因此,面向知識圖譜的表示學(xué)習(xí)成為了人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。知識圖譜是關(guān)于現(xiàn)實(shí)世界中存在的“實(shí)體”以及實(shí)體間復(fù)雜語義“關(guān)系”的圖結(jié)構(gòu)。表示學(xué)習(xí)旨在將實(shí)體和關(guān)系投影到一個(gè)連續(xù)的低維向量空間,然后將知識分析推廣為數(shù)值計(jì)算。近年來,研究者們提出了以TransE為代表的多種表示學(xué)習(xí)模型來表示知識圖譜中實(shí)體與關(guān)系,并取得了顯著的成果。然而,TransE在進(jìn)行復(fù)雜關(guān)系建模和多源信息融合時(shí),仍存在許多局限性。針對上述分析,本文主要研究內(nèi)容如下:(1)針對現(xiàn)有TrasnE模型對復(fù)雜關(guān)系進(jìn)行建模時(shí)的局限性問題,提出一種基于多翻譯原則的表示學(xué)習(xí)方法。首先,訓(xùn)練過程中不斷調(diào)整模型參數(shù)。其次,根據(jù)不同的關(guān)系類別,設(shè)置不同的翻譯原則,有效地解決了對復(fù)雜關(guān)系建模時(shí)的局限性。(2)現(xiàn)有表示學(xué)習(xí)模型通常使用同一步長對不同復(fù)雜程度的實(shí)體和關(guān)系進(jìn)行訓(xùn)練,不能很好地區(qū)分不同復(fù)雜程度的關(guān)系。為均衡步長對不同復(fù)雜程度的關(guān)系和實(shí)體的影響,根據(jù)實(shí)體和關(guān)系的復(fù)雜度設(shè)置一個(gè)動態(tài)步長以解決知識圖譜異質(zhì)性和不均衡性所帶來的影響。(3)針對當(dāng)前模型未能充分利用與知識相關(guān)信息的問題,提出一種融合實(shí)體和關(guān)系的文本描述信息的表示學(xué)習(xí)方法。通過新型標(biāo)記方案對實(shí)體和關(guān)系聯(lián)合抽取,并設(shè)置一個(gè)平衡因子融合文本描述信息與結(jié)構(gòu)化信息以更好的表示知識圖譜中的數(shù)據(jù)。
【學(xué)位授予單位】:桂林電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:G434
【圖文】:
第一章 緒論§1.1 研究背景及意義隨著當(dāng)今社會迅猛發(fā)展,我們逐漸進(jìn)入一個(gè)信息化,智能化時(shí)代。海量新的數(shù)據(jù)和信息每天都以不同的形式產(chǎn)生,來勢洶涌的信息與知識有時(shí)使人無所適從。移動互聯(lián)網(wǎng)已成為當(dāng)今社會最有效便捷的信息獲取平臺,用戶對真實(shí)信息獲取的需求日益迫切,如何從海量數(shù)據(jù)中獲取有效信息已成為眾多領(lǐng)域面臨的主要難題。知識圖譜(Knowledge Graph, KG)由此應(yīng)運(yùn)而生,并以驚人的速度發(fā)展。Google 公司于 2012 年 5 月將知識圖譜引入搜索引擎[1-2],開啟了大規(guī)模知識圖譜的研究和應(yīng)用的熱潮。與基于關(guān)鍵詞搜索的傳統(tǒng)搜索引擎不同,知識圖譜可以有效地查找復(fù)雜的關(guān)聯(lián)信息,從語義層面上體會用戶意圖,改善查詢質(zhì)量。如圖 1.1,若在Google 的搜索框里輸入喬布斯,頁面右側(cè)將會出現(xiàn)喬布斯的相關(guān)信息,如出生年月、身高、配偶、子女,教育背景等。
本文編號:2780985
【學(xué)位授予單位】:桂林電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:G434
【圖文】:
第一章 緒論§1.1 研究背景及意義隨著當(dāng)今社會迅猛發(fā)展,我們逐漸進(jìn)入一個(gè)信息化,智能化時(shí)代。海量新的數(shù)據(jù)和信息每天都以不同的形式產(chǎn)生,來勢洶涌的信息與知識有時(shí)使人無所適從。移動互聯(lián)網(wǎng)已成為當(dāng)今社會最有效便捷的信息獲取平臺,用戶對真實(shí)信息獲取的需求日益迫切,如何從海量數(shù)據(jù)中獲取有效信息已成為眾多領(lǐng)域面臨的主要難題。知識圖譜(Knowledge Graph, KG)由此應(yīng)運(yùn)而生,并以驚人的速度發(fā)展。Google 公司于 2012 年 5 月將知識圖譜引入搜索引擎[1-2],開啟了大規(guī)模知識圖譜的研究和應(yīng)用的熱潮。與基于關(guān)鍵詞搜索的傳統(tǒng)搜索引擎不同,知識圖譜可以有效地查找復(fù)雜的關(guān)聯(lián)信息,從語義層面上體會用戶意圖,改善查詢質(zhì)量。如圖 1.1,若在Google 的搜索框里輸入喬布斯,頁面右側(cè)將會出現(xiàn)喬布斯的相關(guān)信息,如出生年月、身高、配偶、子女,教育背景等。
【參考文獻(xiàn)】
相關(guān)博士學(xué)位論文 前1條
1 王楨;基于嵌入模型的知識圖譜補(bǔ)全[D];中山大學(xué);2017年
本文編號:2780985
本文鏈接:http://www.lk138.cn/jiaoyulunwen/jykj/2780985.html
最近更新
教材專著