中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當前位置:主頁 > 社科論文 > 新聞傳播論文 >

基于網(wǎng)絡新聞的知識圖譜構(gòu)建與研究

發(fā)布時間:2024-07-07 09:34
  由于Web2.0時代的到來,互聯(lián)網(wǎng)從信息共享時代步入了信息共建時代,網(wǎng)絡新聞的迅速發(fā)展極大的改變了人們在生活中獲取新聞信息的媒介和習慣。在大數(shù)據(jù)時代的今天,我們要對互聯(lián)網(wǎng)上日益遞增的新聞數(shù)據(jù)進行高效率的全網(wǎng)檢索常常都會因其海量、高復雜性、非結(jié)構(gòu)性的特點而受阻。為了提升用戶與互聯(lián)網(wǎng)之間的互動體驗,實現(xiàn)更高質(zhì)量檢索,最終實現(xiàn)能夠預測出互聯(lián)網(wǎng)用戶所需信息的目的,知識圖譜便應運而生。本文在爬取到的網(wǎng)絡新聞數(shù)據(jù)基礎上提取了單一主題新聞中的實體,通過算法調(diào)整實體關(guān)系網(wǎng)絡各個實體之間的關(guān)系,從而構(gòu)建各個新聞事件下的知識圖譜。首先對獲取到的原始新聞數(shù)據(jù)進行簡單的處理,獲得初步的實體和相關(guān)關(guān)系,然后基于初始關(guān)系網(wǎng)絡的三元封閉原理,建立了實體間“穩(wěn)定”這一關(guān)系的概念,并計算每條邊的“穩(wěn)定”占總圖中的“穩(wěn)定”比例,以此為依據(jù)建立評估實體之間關(guān)系的權(quán)重的指標。再使用優(yōu)化的Kruskal算法來獲得部分主題新聞的知識圖譜,本文中稱為基礎型知識圖譜(Basic Knowledge Graph,后簡稱BKG)。針對相同的新聞事件,在不同媒介和不同時間點抓取到的數(shù)據(jù),可構(gòu)建出實體種類相異的BKG,而由于不同的新聞數(shù)據(jù)所...

【文章頁數(shù)】:56 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 課題研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 論文組織結(jié)構(gòu)
2 背景知識
    2.1 數(shù)據(jù)集的獲取
        2.1.1 爬蟲程序的設計
        2.1.2 實體及關(guān)系的獲取
    2.2 三元閉包原理
        2.2.1 三元閉包原理的背景
        2.2.2 三元閉包的內(nèi)容
    2.3 實體間的相似度
    2.4 本章小結(jié)
3 知識圖譜的構(gòu)建流程
    3.1 Kruskal算法
        3.1.1 最小生成樹的Kruskal算法
        3.1.2 優(yōu)化的Kruskal算法
    3.2 基礎型知識圖譜的構(gòu)建
        3.2.1 實體關(guān)系的量化
        3.2.2 使用優(yōu)化的Kruskal算法構(gòu)建BKG
    3.3 基礎型知識圖譜的合并
    3.4 構(gòu)建方案的實現(xiàn)和分析
    3.5 本章小結(jié)
4 圖譜構(gòu)建及效果評估
    4.1 圖譜的總體設計
        4.1.1 圖譜的流程設計
        4.1.2 圖譜的生成環(huán)境
    4.2 BKG的構(gòu)建與融合
        4.2.1 數(shù)據(jù)的獲取
        4.2.2 實體及初步關(guān)系的提取
        4.2.3 實體關(guān)系的量化
        4.2.4 BKG的融合
    4.3 BKG的展示與評估
    4.4 本章小結(jié)
5 總結(jié)與展望
參考文獻
致謝
附錄1 攻讀碩士學位期間參與的項目和發(fā)表的論文



本文編號:4003508

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/xinwenchuanbolunwen/4003508.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9b684***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com