基于知識(shí)庫(kù)的中文網(wǎng)絡(luò)檢索工具——經(jīng)濟(jì)信息智能搜索引擎研究
發(fā)布時(shí)間:2023-11-06 14:34
本論文試圖從計(jì)算機(jī)技術(shù)和圖書(shū)情報(bào)學(xué)理論與實(shí)踐手段出發(fā),應(yīng)用文獻(xiàn)信息自動(dòng)標(biāo) 引和組織技術(shù)于網(wǎng)頁(yè)的加工處理過(guò)程上。在分析了中外搜索引擎的現(xiàn)狀與不足,搜索引 擎分類(lèi)主題一體化進(jìn)展以及網(wǎng)頁(yè)主要特征的基礎(chǔ)上,本文提出了針對(duì)中文網(wǎng)頁(yè)特征的信 息標(biāo)引和組織方案,并利用相關(guān)網(wǎng)絡(luò)技術(shù),構(gòu)建了一個(gè)實(shí)驗(yàn)性經(jīng)濟(jì)信息智能搜索引擎。 中文網(wǎng)頁(yè)的自動(dòng)標(biāo)引思想主要基于知識(shí)庫(kù)的概念進(jìn)行。知識(shí)庫(kù)實(shí)際上是一個(gè)基于《中 圖法》的專(zhuān)家知識(shí)系統(tǒng),包括了中圖法庫(kù)、漢表庫(kù)、分類(lèi)號(hào)—主題詞對(duì)應(yīng)庫(kù)、同義詞庫(kù)、 關(guān)鍵詞庫(kù)、停用詞庫(kù)和特例詞庫(kù)等若干數(shù)據(jù)庫(kù)。在確定網(wǎng)頁(yè)基本信息標(biāo)引源的基礎(chǔ)上, 中文網(wǎng)頁(yè)主題標(biāo)引運(yùn)用了基于詞頻的統(tǒng)計(jì)加權(quán)法;通過(guò)與分類(lèi)號(hào)—主題詞對(duì)應(yīng)庫(kù)主題詞 串的詞面相似度計(jì)算,進(jìn)一步完成中文網(wǎng)頁(yè)的賦號(hào)標(biāo)引,即分類(lèi)標(biāo)引。 隨后,本文利用Borland Delphi、Visual FoxPro等工具設(shè)計(jì)并開(kāi)發(fā)了一個(gè)包括中文網(wǎng) 頁(yè)文本信息提取、自動(dòng)抽詞、自動(dòng)主題與分類(lèi)標(biāo)引、標(biāo)引結(jié)果處理、知識(shí)庫(kù)維護(hù)等功能, 用以處理中文網(wǎng)頁(yè)信息的自動(dòng)標(biāo)引實(shí)驗(yàn)系統(tǒng);并簡(jiǎn)要介紹了系統(tǒng)的設(shè)計(jì)、工作流程、使 用方法及運(yùn)行條件。 根據(jù)分類(lèi)主題一體化發(fā)展方向,本文還設(shè)計(jì)了檢索型、目錄型及分類(lèi)主題一體化檢 索系統(tǒng),并提出基于集成詞表的不同引擎間類(lèi)目體系的兼容互換方案。 文章的最后對(duì)中文網(wǎng)頁(yè)自動(dòng)標(biāo)引系統(tǒng)從系統(tǒng)標(biāo)引效率、標(biāo)引準(zhǔn)確率等方面進(jìn)行了綜 合測(cè)評(píng),并客觀分析了系統(tǒng)存在的問(wèn)題和不足。與手工標(biāo)引相比,自動(dòng)標(biāo)引正確率達(dá)到 了80%以上。
頁(yè)數(shù):69
【學(xué)位級(jí)別】:碩士
文章目錄
前 言
第一章 搜索引擎研究現(xiàn)狀綜述
第一節(jié) 西文搜索引擎技術(shù)研究現(xiàn)狀
第二節(jié) 中文搜索引擎技術(shù)研究現(xiàn)狀
第三節(jié) 網(wǎng)絡(luò)目錄組織及分類(lèi)主題一體化研究進(jìn)展
第四節(jié) 中文搜索引擎存在問(wèn)題及發(fā)展方向
第五節(jié) 基于知識(shí)庫(kù)的經(jīng)濟(jì)信息智能搜索引擎構(gòu)建思路
第二章 知識(shí)庫(kù)的組成、功能與設(shè)計(jì)
第一節(jié) 知識(shí)庫(kù)的組成與功能
第二節(jié) 分類(lèi)號(hào)—主題詞(串)對(duì)應(yīng)數(shù)據(jù)庫(kù)的設(shè)計(jì)
第三節(jié) 同義數(shù)據(jù)庫(kù)的的設(shè)計(jì)
第四節(jié) 關(guān)鍵詞數(shù)據(jù)庫(kù)的設(shè)計(jì)
第五節(jié) 輔助用知識(shí)庫(kù)的設(shè)計(jì)
第三章 智能搜索引擎標(biāo)引組織機(jī)制的實(shí)現(xiàn)(一)
第一節(jié) 網(wǎng)頁(yè)的基本特征與文本信息標(biāo)引源
第二節(jié) 網(wǎng)頁(yè)文本信息主題標(biāo)引技術(shù)
第三節(jié) 網(wǎng)頁(yè)文本信息主題標(biāo)引方案
第四節(jié) 標(biāo)引方案的優(yōu)選及存在問(wèn)題
第四章 智能搜索引擎標(biāo)引組織機(jī)制的實(shí)現(xiàn)(二)
第一節(jié) 計(jì)算機(jī)自動(dòng)分類(lèi)技術(shù)
第二節(jié) 詞面相似度分類(lèi)算法
第三節(jié) 中文網(wǎng)頁(yè)的自動(dòng)分類(lèi)
第五章 智能搜索引擎標(biāo)引組織實(shí)驗(yàn)系統(tǒng)的設(shè)計(jì)與使用
第一節(jié) 標(biāo)引組織實(shí)驗(yàn)系統(tǒng)設(shè)計(jì)
第二節(jié) 中文網(wǎng)頁(yè)信息計(jì)算機(jī)標(biāo)引系統(tǒng)的使用
第六章 智能搜索引擎用戶(hù)檢索機(jī)制的實(shí)現(xiàn)與系統(tǒng)的設(shè)計(jì)
第一節(jié) 智能搜索引擎用戶(hù)檢索機(jī)制的實(shí)現(xiàn)
第二節(jié) 檢索實(shí)驗(yàn)系統(tǒng)的設(shè)計(jì)
第七章 網(wǎng)頁(yè)自動(dòng)標(biāo)引系統(tǒng)運(yùn)行性能測(cè)試及評(píng)價(jià)
第一節(jié) 網(wǎng)頁(yè)自動(dòng)標(biāo)引系統(tǒng)性能測(cè)試
第二節(jié) 網(wǎng)頁(yè)自動(dòng)標(biāo)引系統(tǒng)評(píng)價(jià)
附錄A 分類(lèi)知識(shí)庫(kù)記錄樣本
附錄B 手工標(biāo)引和自動(dòng)標(biāo)引(方案Ⅰ、Ⅱ、Ⅲ)結(jié)果
參考文獻(xiàn)
后 記
[1] Web頁(yè)面中文文本主題的自動(dòng)提取研究. 韓客松,王永成,滕偉.情報(bào)學(xué)報(bào),2001
[2] 分類(lèi)搜索引擎類(lèi)目體系研究. 馬張華.圖書(shū)情報(bào)工作,2001
[3] 統(tǒng)計(jì)分析法自動(dòng)標(biāo)引的改進(jìn). 趙云志.情報(bào)學(xué)報(bào),2000
[4] 中文文獻(xiàn)自動(dòng)分類(lèi)中的知識(shí)庫(kù)構(gòu)造及其仿人算法. 刁倩,張惠惠,王永成,何驥.情報(bào)學(xué)報(bào),2000
本文編號(hào):87728
本文鏈接:http://www.lk138.cn/kejilunwen/sousuoyinqinglunwen/87728.html
最近更新
教材專(zhuān)著