網(wǎng)絡(luò)環(huán)境中知識脈絡(luò)分析服務(wù)的研究與實現(xiàn)
發(fā)布時間:2014-09-20 08:39
摘要:本文提出了在知識網(wǎng)絡(luò)分析的基礎(chǔ)上增加時序分析的維度,形成知識脈絡(luò) 分析的觀點。并介紹了如何運用共詞網(wǎng)絡(luò)、引文網(wǎng)絡(luò)等分析方法,實現(xiàn)知 識脈絡(luò)分析服務(wù)的方法。最后簡要總結(jié)了筆者在研究構(gòu)建萬方數(shù)據(jù)知識服 務(wù)平臺知識脈絡(luò)分析服務(wù)工作中的實踐。
關(guān)鍵詞: 知識網(wǎng)絡(luò) 知識脈絡(luò) 引文網(wǎng)絡(luò) 共詞網(wǎng)絡(luò) 時序分析
1 引言
在當前關(guān)于知識的多種定義中,《現(xiàn)代漢語詞典》中對知識的定義是一種 普遍可以接受的觀點,它將知識定義為是人類在改造世界的實踐中所獲得的認 識和經(jīng)驗的總和。人類認識和改造世界的過程中形成了各種知識,這些知識內(nèi) 容之間存在著內(nèi)在邏輯關(guān)系。特定知識內(nèi)容形成知識節(jié)點,若干知識節(jié)點內(nèi)在 的邏輯關(guān)聯(lián)便構(gòu)成的網(wǎng)絡(luò)化的知識體系,形成了知識網(wǎng)絡(luò)[1]。除此之外,國內(nèi) 外從事知識管理的學者從知識管理的角度,將知識網(wǎng)絡(luò)定義為一批人、資源以 及他們之間關(guān)系,為了知識創(chuàng)造、知識轉(zhuǎn)移,促進知識的利用。因此知識網(wǎng)絡(luò) 的內(nèi)涵和種類也很多。有學者將知識網(wǎng)絡(luò)分為大致四類:
1)知識主體間的網(wǎng)絡(luò):其實質(zhì)是知識在不同主體間流動或傳播的網(wǎng)絡(luò)。
2)知識與知識之間的網(wǎng)絡(luò):以知識為結(jié)點,以知識分類或語義分類為基礎(chǔ) 建立的知識與知識之間的關(guān)聯(lián)網(wǎng)絡(luò)。
3)知識存儲媒介之間的網(wǎng)絡(luò):主要指由文檔分類、索引等形成的知識網(wǎng) 絡(luò)。
4)多種類型的節(jié)點或關(guān)系構(gòu)成的知識網(wǎng)絡(luò):研究較多的是知識與人之間的 網(wǎng)絡(luò)。網(wǎng)絡(luò)的構(gòu)成要素涉及人、資源和關(guān)系等。[2]
本文所指的知識網(wǎng)絡(luò)以及知識脈絡(luò)的概念主要針對知識點直接的內(nèi)在邏輯 關(guān)系,是眾多知識網(wǎng)絡(luò)中的一種。即上述知識網(wǎng)絡(luò)分類中的第二種。
在這種知識網(wǎng)絡(luò)中,某個知識點作為一個知識網(wǎng)絡(luò)節(jié)點,和其他相關(guān)知識 點之間形成網(wǎng)絡(luò)關(guān)系,節(jié)點與節(jié)點之間的距離代表知識點之間關(guān)聯(lián)的緊密程 度。在這樣的知識網(wǎng)絡(luò)中,從任意知識節(jié)點出發(fā),都能找到和其臨近的其他知 識點。因為任何知識點都不可能是孤立的,甚至從任一知識點出發(fā),都能遍歷 整個知識網(wǎng)絡(luò)。但是這樣的知識網(wǎng)絡(luò)也存在一個問題,因為隨著時間的發(fā)展, 人類認知會進步,知識也會發(fā)展。因此不同年度的知識網(wǎng)絡(luò)應(yīng)該具有不同的形 狀。
基于這樣的認識,本文在知識網(wǎng)絡(luò)的基礎(chǔ)上增加了時序分析的維度,提出 了知識脈絡(luò)的概念。即為某一知識點在不同年代畫出一張知識網(wǎng)絡(luò)圖,不同年
關(guān)鍵詞: 知識網(wǎng)絡(luò) 知識脈絡(luò) 引文網(wǎng)絡(luò) 共詞網(wǎng)絡(luò) 時序分析
1 引言
在當前關(guān)于知識的多種定義中,《現(xiàn)代漢語詞典》中對知識的定義是一種 普遍可以接受的觀點,它將知識定義為是人類在改造世界的實踐中所獲得的認 識和經(jīng)驗的總和。人類認識和改造世界的過程中形成了各種知識,這些知識內(nèi) 容之間存在著內(nèi)在邏輯關(guān)系。特定知識內(nèi)容形成知識節(jié)點,若干知識節(jié)點內(nèi)在 的邏輯關(guān)聯(lián)便構(gòu)成的網(wǎng)絡(luò)化的知識體系,形成了知識網(wǎng)絡(luò)[1]。除此之外,國內(nèi) 外從事知識管理的學者從知識管理的角度,將知識網(wǎng)絡(luò)定義為一批人、資源以 及他們之間關(guān)系,為了知識創(chuàng)造、知識轉(zhuǎn)移,促進知識的利用。因此知識網(wǎng)絡(luò) 的內(nèi)涵和種類也很多。有學者將知識網(wǎng)絡(luò)分為大致四類:
1)知識主體間的網(wǎng)絡(luò):其實質(zhì)是知識在不同主體間流動或傳播的網(wǎng)絡(luò)。
2)知識與知識之間的網(wǎng)絡(luò):以知識為結(jié)點,以知識分類或語義分類為基礎(chǔ) 建立的知識與知識之間的關(guān)聯(lián)網(wǎng)絡(luò)。
3)知識存儲媒介之間的網(wǎng)絡(luò):主要指由文檔分類、索引等形成的知識網(wǎng) 絡(luò)。
4)多種類型的節(jié)點或關(guān)系構(gòu)成的知識網(wǎng)絡(luò):研究較多的是知識與人之間的 網(wǎng)絡(luò)。網(wǎng)絡(luò)的構(gòu)成要素涉及人、資源和關(guān)系等。[2]
本文所指的知識網(wǎng)絡(luò)以及知識脈絡(luò)的概念主要針對知識點直接的內(nèi)在邏輯 關(guān)系,是眾多知識網(wǎng)絡(luò)中的一種。即上述知識網(wǎng)絡(luò)分類中的第二種。
在這種知識網(wǎng)絡(luò)中,某個知識點作為一個知識網(wǎng)絡(luò)節(jié)點,和其他相關(guān)知識 點之間形成網(wǎng)絡(luò)關(guān)系,節(jié)點與節(jié)點之間的距離代表知識點之間關(guān)聯(lián)的緊密程 度。在這樣的知識網(wǎng)絡(luò)中,從任意知識節(jié)點出發(fā),都能找到和其臨近的其他知 識點。因為任何知識點都不可能是孤立的,甚至從任一知識點出發(fā),都能遍歷 整個知識網(wǎng)絡(luò)。但是這樣的知識網(wǎng)絡(luò)也存在一個問題,因為隨著時間的發(fā)展, 人類認知會進步,知識也會發(fā)展。因此不同年度的知識網(wǎng)絡(luò)應(yīng)該具有不同的形 狀。
基于這樣的認識,本文在知識網(wǎng)絡(luò)的基礎(chǔ)上增加了時序分析的維度,提出 了知識脈絡(luò)的概念。即為某一知識點在不同年代畫出一張知識網(wǎng)絡(luò)圖,不同年
代的網(wǎng)絡(luò)圖按順序鏈接起來,形成某一知識點在不同年代的知識網(wǎng)絡(luò)形狀演變 脈絡(luò)圖,簡稱為知識脈絡(luò)。
2 知識脈絡(luò)分析實例
知識脈絡(luò)在知識網(wǎng)絡(luò)的基礎(chǔ)上增加時序分析后,可以更為直觀地看出知識 點之間隨著時間的發(fā)展變化,如下面幾幅圖是根據(jù)萬方數(shù)據(jù)知識服務(wù)平臺所收 錄文獻資源分析的2004年、2007年、2009年三個年度“數(shù)字圖書館”知識點相 鄰知識點的分析。
圖 1 2004 年“數(shù)字圖書館”知識點的相鄰知識網(wǎng)絡(luò)節(jié)點
圖 2 2007 年“數(shù)字圖書館”知識點相鄰的知識網(wǎng)絡(luò)節(jié)點
圖 3 2009年 “數(shù)字圖書館”知識點相鄰的知識網(wǎng)絡(luò)節(jié)點
從以上幾幅圖中可以明顯地看出,隨著年度的變化,與“數(shù)字圖書館” 知識點相鄰知識點的變化情況。比如在2004年度中,與“數(shù)據(jù)圖書館”知識點 按緊密程度從大到小依次相鄰的知識點分別是:傳統(tǒng)圖書館、元數(shù)據(jù)、信息資 源、知識產(chǎn)權(quán)、信息服務(wù)等。表明該年度相關(guān)研究的熱點還聚焦在“數(shù)字圖書 館和傳統(tǒng)圖書館的差異”、“使用什么元數(shù)據(jù)方案構(gòu)建數(shù)字圖書館”、“數(shù)字 圖書館中信息資源的建設(shè)方案”、“數(shù)字圖書館信息資源的知識產(chǎn)權(quán)問題”以 及“數(shù)字圖書館中信息服務(wù)的建設(shè)”等方面。但到了2007年和2009年,與“數(shù) 字圖書館”依次相鄰的知識點發(fā)生了變化,信息服務(wù)逐漸成了研究熱點。這樣
2 知識脈絡(luò)分析實例
知識脈絡(luò)在知識網(wǎng)絡(luò)的基礎(chǔ)上增加時序分析后,可以更為直觀地看出知識 點之間隨著時間的發(fā)展變化,如下面幾幅圖是根據(jù)萬方數(shù)據(jù)知識服務(wù)平臺所收 錄文獻資源分析的2004年、2007年、2009年三個年度“數(shù)字圖書館”知識點相 鄰知識點的分析。
圖 1 2004 年“數(shù)字圖書館”知識點的相鄰知識網(wǎng)絡(luò)節(jié)點
圖 2 2007 年“數(shù)字圖書館”知識點相鄰的知識網(wǎng)絡(luò)節(jié)點
圖 3 2009年 “數(shù)字圖書館”知識點相鄰的知識網(wǎng)絡(luò)節(jié)點
從以上幾幅圖中可以明顯地看出,隨著年度的變化,與“數(shù)字圖書館” 知識點相鄰知識點的變化情況。比如在2004年度中,與“數(shù)據(jù)圖書館”知識點 按緊密程度從大到小依次相鄰的知識點分別是:傳統(tǒng)圖書館、元數(shù)據(jù)、信息資 源、知識產(chǎn)權(quán)、信息服務(wù)等。表明該年度相關(guān)研究的熱點還聚焦在“數(shù)字圖書 館和傳統(tǒng)圖書館的差異”、“使用什么元數(shù)據(jù)方案構(gòu)建數(shù)字圖書館”、“數(shù)字 圖書館中信息資源的建設(shè)方案”、“數(shù)字圖書館信息資源的知識產(chǎn)權(quán)問題”以 及“數(shù)字圖書館中信息服務(wù)的建設(shè)”等方面。但到了2007年和2009年,與“數(shù) 字圖書館”依次相鄰的知識點發(fā)生了變化,信息服務(wù)逐漸成了研究熱點。這樣
的變化,反應(yīng)了不同年度研究熱點和知識網(wǎng)絡(luò)的變化情況,也反應(yīng)了知識脈絡(luò) 的時序發(fā)展情況。根據(jù)這些變化,我們畫出“數(shù)字圖書館”知識點的知識脈絡(luò) 圖如下:
圖 4 “數(shù)字圖書館 ” 知識點知識脈絡(luò)圖
其中上方的曲線表明該知識點在不同年度的研究熱點的趨勢變化,年度下 方的關(guān)鍵詞表明在對應(yīng)年度和該知識點最相關(guān)的知識點。從上而下的順序代表 相關(guān)的程度從大到小的順序。
3 研究分析 知識脈絡(luò)的意義
知識脈絡(luò)從某個知識點出發(fā),結(jié)合時間維度形成的脈絡(luò)分析,對學術(shù)選 題、學術(shù)研究等方面均有一定參考意義。
1)知識脈絡(luò)從時間維度揭示了知識點的關(guān)注度,有助于學者了解學科發(fā)展 規(guī)律和研究選題。
2)知識脈絡(luò)基于時序揭示了知識點之間隨時間變化的演化關(guān)系,有助于發(fā) 現(xiàn)知識點之間的交叉、融合的演變關(guān)系,有助于學者發(fā)現(xiàn)新的研究方向、研究 趨勢和研究熱點。
4 知識脈絡(luò)的 構(gòu)建 方法
文獻是知識的載體,是知識網(wǎng)絡(luò)的構(gòu)建重要基礎(chǔ)素材;谖墨I構(gòu)建知識 網(wǎng)絡(luò)的方法許多文獻已經(jīng)有所介紹[3][4][5],基于這些方法發(fā)展構(gòu)建知識脈絡(luò) 的幾種可行方法如下:
1)共詞網(wǎng)絡(luò)分析法: 由文章關(guān)鍵詞及其共現(xiàn)關(guān)系形成的網(wǎng)絡(luò)稱為“共詞網(wǎng)絡(luò)”[3]。每篇文獻的
關(guān)鍵詞形成一組共現(xiàn),一個關(guān)鍵詞作為一個知識點,存在共現(xiàn)關(guān)系的關(guān)鍵詞作 為相關(guān)知識點。每共現(xiàn)一次,相應(yīng)的關(guān)系權(quán)重對應(yīng)增加。如此構(gòu)建形成知識網(wǎng)
絡(luò)。然后根據(jù)時間維度拆分,即可形成知識脈絡(luò)。
2)引文網(wǎng)絡(luò)分析法:
圖 4 “數(shù)字圖書館 ” 知識點知識脈絡(luò)圖
其中上方的曲線表明該知識點在不同年度的研究熱點的趨勢變化,年度下 方的關(guān)鍵詞表明在對應(yīng)年度和該知識點最相關(guān)的知識點。從上而下的順序代表 相關(guān)的程度從大到小的順序。
3 研究分析 知識脈絡(luò)的意義
知識脈絡(luò)從某個知識點出發(fā),結(jié)合時間維度形成的脈絡(luò)分析,對學術(shù)選 題、學術(shù)研究等方面均有一定參考意義。
1)知識脈絡(luò)從時間維度揭示了知識點的關(guān)注度,有助于學者了解學科發(fā)展 規(guī)律和研究選題。
2)知識脈絡(luò)基于時序揭示了知識點之間隨時間變化的演化關(guān)系,有助于發(fā) 現(xiàn)知識點之間的交叉、融合的演變關(guān)系,有助于學者發(fā)現(xiàn)新的研究方向、研究 趨勢和研究熱點。
4 知識脈絡(luò)的 構(gòu)建 方法
文獻是知識的載體,是知識網(wǎng)絡(luò)的構(gòu)建重要基礎(chǔ)素材;谖墨I構(gòu)建知識 網(wǎng)絡(luò)的方法許多文獻已經(jīng)有所介紹[3][4][5],基于這些方法發(fā)展構(gòu)建知識脈絡(luò) 的幾種可行方法如下:
1)共詞網(wǎng)絡(luò)分析法: 由文章關(guān)鍵詞及其共現(xiàn)關(guān)系形成的網(wǎng)絡(luò)稱為“共詞網(wǎng)絡(luò)”[3]。每篇文獻的
關(guān)鍵詞形成一組共現(xiàn),一個關(guān)鍵詞作為一個知識點,存在共現(xiàn)關(guān)系的關(guān)鍵詞作 為相關(guān)知識點。每共現(xiàn)一次,相應(yīng)的關(guān)系權(quán)重對應(yīng)增加。如此構(gòu)建形成知識網(wǎng)
絡(luò)。然后根據(jù)時間維度拆分,即可形成知識脈絡(luò)。
2)引文網(wǎng)絡(luò)分析法:
引文網(wǎng)絡(luò)即文獻之間的引用關(guān)系形成的網(wǎng)絡(luò)關(guān)系。通過分析一篇文章的相 關(guān)的知識點,并將這些知識點映射到引文網(wǎng)絡(luò)中。通過合并相同知識點整理形 成知識網(wǎng)絡(luò)。然后增加文獻發(fā)表時間,進而形成知識脈絡(luò)。
5 知識脈絡(luò)分析服務(wù)建設(shè)實踐
基于以上研究,筆者在萬方數(shù)據(jù)知識服務(wù)平臺產(chǎn)品中實現(xiàn)了知識脈絡(luò)分析 服務(wù)。該系統(tǒng)基于萬方數(shù)據(jù)知識服務(wù)平臺收錄的海量文獻資源,通過基于共詞 網(wǎng)絡(luò)和引文網(wǎng)絡(luò)的分析方法,對知識脈絡(luò)服務(wù)進行了完整實現(xiàn),服務(wù)地址為 http://trend.wanfangdata.com.cn。無論是共詞網(wǎng)絡(luò)還是引文網(wǎng)絡(luò)分析法,在 服務(wù)建設(shè)過程中遇到的一個困難是知識網(wǎng)絡(luò)和知識脈絡(luò)中的知識點節(jié)點數(shù)量巨 大,因此形成的網(wǎng)絡(luò)關(guān)系維度巨大,需要構(gòu)建良好數(shù)據(jù)結(jié)構(gòu)和高性能的算法才 能支持知識脈絡(luò)的構(gòu)建過程并滿足實際服務(wù)過程中的性能要求。筆者通過利用 相對高性能的數(shù)據(jù)結(jié)構(gòu)和算法的應(yīng)用,較好解決了這個問題。截止目前該服務(wù) 測試版已經(jīng)上線一年左右,當前日訪問量近十萬次,取得較好運營效果。當前 也正在根據(jù)用戶反饋和運營情況,進行再次設(shè)計研發(fā),爭取早日上線產(chǎn)品正式 版。
參考文獻
[1] 趙蓉英.知識網(wǎng)絡(luò)研究(Ⅱ)—知識網(wǎng)絡(luò)的概念、內(nèi)涵和特征.情報學報.2007,26(3):470-476
[2] 席運江,黨延忠,廖開際.組織知識系統(tǒng)的知識超網(wǎng)絡(luò)模型及應(yīng)用.管理科學學報,2009,12(3):12-21
[3] 王曉光.科學知識網(wǎng)絡(luò)的形成與演化(Ⅰ):共詞網(wǎng)絡(luò)方法的提出.情報學報.2009,28(4):599-605
[4] 李丹,俞竹超,樊治平.知識網(wǎng)絡(luò)的構(gòu)建過程分析,科學學研究,2002,20(6):620-623
[5] 彭錦.知識網(wǎng)絡(luò)架構(gòu)研究與原型系統(tǒng)設(shè)計[D].杭州:浙江大學,2005
本文編號:9084
本文鏈接:http://www.lk138.cn/kejilunwen/jisuanjikexuelunwen/9084.html
最近更新
教材專著