中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

WWW科技信息資源自動(dòng)標(biāo)引的理論與實(shí)踐研究

發(fā)布時(shí)間:2020-12-07 16:49
  隨著因特網(wǎng)的迅速發(fā)展和廣泛應(yīng)用,它逐漸成為目前最大的信息資源寶庫和最主要的信息交流渠道,由于因特網(wǎng)信息資源的顯著特點(diǎn)是量大而無序,故隨之出現(xiàn)了“數(shù)據(jù)豐富,知識(shí)貧乏”現(xiàn)象。現(xiàn)有的搜索引擎大多是基于關(guān)鍵字的全文檢索系統(tǒng),較少考慮信息的語義問題,因而不能夠滿足用戶的不同需求,廣大用戶也很難利用它們來獲取因特網(wǎng)中許多有價(jià)值的知識(shí)。為此,本論文針對(duì)WWW科技信息資源自動(dòng)標(biāo)引展開理論和實(shí)踐兩方面的研究,其主要研究目的如下:為處理因特網(wǎng)信息資源提供技術(shù)支持,為普通用戶檢索因特網(wǎng)信息資源提供便利,為建設(shè)中國數(shù)字圖書館提供新的研究思路。 論文提出了基于《中國分類主題詞表》的WWW科技信息資源自動(dòng)標(biāo)引系統(tǒng)(STAI)設(shè)計(jì)方案,該系統(tǒng)具有WWW網(wǎng)頁的格式自動(dòng)檢測(cè)與轉(zhuǎn)換、自動(dòng)分詞與自由詞標(biāo)引、自動(dòng)分類標(biāo)引和主題標(biāo)引等功能。STAI系統(tǒng)是一個(gè)自動(dòng)化程度較高的易用型軟件,該試驗(yàn)系統(tǒng)可以同時(shí)實(shí)現(xiàn)中英文網(wǎng)頁的自動(dòng)標(biāo)引,兼顧了如何結(jié)合自然語言與情報(bào)檢索語言二者在信息檢索方面各自的優(yōu)越性。在STAI系統(tǒng)設(shè)計(jì)和實(shí)踐過程中,本論文做出了一定的創(chuàng)新性嘗試。例如,采用了結(jié)構(gòu)化程序設(shè)計(jì)方法等先進(jìn)的程序設(shè)計(jì)思想,重視Activ... 

【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院文獻(xiàn)情報(bào)中心)北京市

【文章頁數(shù)】:130 頁

【學(xué)位級(jí)別】:博士

【文章目錄】:
第1章 引論
    1.1 研究背景
    1.2 研究目的
    1.3 研究意義
    1.4 主要技術(shù)難點(diǎn)
    1.5 論文的組織安排
第2章 書面漢語自動(dòng)分詞
    2.1 書面漢語自動(dòng)分詞概述
        2.1.1 書面漢語自動(dòng)分詞的研究意義
        2.1.2 書面漢語自動(dòng)分詞的難點(diǎn)
    2.2 書面漢語自動(dòng)分詞方法評(píng)介
        2.2.1 基于字符串匹配的分詞方法(機(jī)械匹配法)
        2.2.2 基于理解的分詞方法
        2.2.3 基于統(tǒng)計(jì)的分詞方法
        2.2.4 基于標(biāo)志的分詞方法
        2.2.5 基于神經(jīng)網(wǎng)絡(luò)的分詞方法
    2.3 主要書面漢語自動(dòng)分詞系統(tǒng)評(píng)介
第3章 文獻(xiàn)自動(dòng)標(biāo)引
    3.1 自動(dòng)標(biāo)引相關(guān)概念
        3.1.1 文獻(xiàn)標(biāo)引
        3.1.2 文獻(xiàn)自動(dòng)標(biāo)引
    3.2 英語文獻(xiàn)自動(dòng)標(biāo)引方法
    3.3 漢語文獻(xiàn)自動(dòng)標(biāo)引方法
第4章 文獻(xiàn)自動(dòng)分類
    4.1 文獻(xiàn)自動(dòng)分類概述
        4.1.1 文獻(xiàn)自動(dòng)分類的研究意義
        4.1.2 文獻(xiàn)自動(dòng)分類的主要方法
    4.2 自動(dòng)分類國外研究概況
    4.3 自動(dòng)分類國內(nèi)研究概況
        4.3.1 基于詞典法的中文自動(dòng)分類系統(tǒng)
        4.3.2 基于專家系統(tǒng)的中文自動(dòng)分類系統(tǒng)
        4.3.3 現(xiàn)有中文自動(dòng)分類系統(tǒng)存在的缺陷
    4.4 自動(dòng)分類的未來發(fā)展方向
第5章 STAI系統(tǒng)的總體設(shè)計(jì)思想
    5.1 STAI系統(tǒng)概述
    5.2 STAI系統(tǒng)的功能設(shè)計(jì)
        5.2.1 網(wǎng)頁格式的自動(dòng)檢測(cè)與轉(zhuǎn)換
        5.2.2 關(guān)鍵詞的自動(dòng)抽取
        5.2.3 WWW網(wǎng)頁的自動(dòng)標(biāo)引
    5.3 STAI系統(tǒng)的體系結(jié)構(gòu)設(shè)計(jì)
    5.4 STAI系統(tǒng)的開發(fā)環(huán)境
        5.4.1 STAI系統(tǒng)的軟件開發(fā)環(huán)境
        5.4.2 STAI系統(tǒng)的硬件開發(fā)環(huán)境
    5.5 STAI系統(tǒng)的數(shù)據(jù)庫設(shè)計(jì)
        5.5.1 STAI數(shù)據(jù)庫的概念設(shè)計(jì)
        5.5.2 STAI數(shù)據(jù)庫的邏輯設(shè)計(jì)
第6章 格式預(yù)處理模塊的實(shí)現(xiàn)
    6.1 BIG5/GB碼的自動(dòng)檢測(cè)和轉(zhuǎn)換
        6.1.1 BIG5/GB碼的自動(dòng)識(shí)別
        6.1.2 BIG5/GB碼的自動(dòng)轉(zhuǎn)換
    6.2 創(chuàng)建BIG5/GB內(nèi)碼自動(dòng)檢測(cè)和轉(zhuǎn)換ActiveX控件
        6.2.1 BIG5GBControl控件的創(chuàng)建步驟
        6.2.2 BIG5GBControl控件的實(shí)現(xiàn)情況
    6.3 因特網(wǎng)文檔格式的轉(zhuǎn)換
        6.3.1 因特網(wǎng)上的主要文檔格式
        6.3.2 將HTML格式自動(dòng)轉(zhuǎn)換成純文本格式的實(shí)現(xiàn)
第7章 自動(dòng)分詞與自由詞標(biāo)引模塊的實(shí)現(xiàn)
    7.1 自動(dòng)分詞與自出詞標(biāo)引模塊的主要設(shè)計(jì)思路
    7.2 構(gòu)造適用于書面漢語自動(dòng)分詞的機(jī)器詞典
        7.2.1 中文詞典概況
        7.2.2 構(gòu)建適用于WWW科技信息資源自動(dòng)標(biāo)引的中文分詞詞典
    7.3 自動(dòng)分詞與自由詞標(biāo)引模塊的實(shí)現(xiàn)情況分析
第8章 自動(dòng)分類和主題標(biāo)引模塊的實(shí)現(xiàn)
    8.1 自動(dòng)分類和主題標(biāo)引模塊的主要設(shè)計(jì)思路
        8.1.1 自動(dòng)分類和主題標(biāo)引模塊的技術(shù)難點(diǎn)
        8.1.2 自動(dòng)分類和主題標(biāo)引模塊的主要算法
    8.2 構(gòu)造用于自動(dòng)分類標(biāo)引和主題標(biāo)引的分類機(jī)器詞典
    8.3 自動(dòng)分類和主題標(biāo)引模塊的實(shí)現(xiàn)情況分析
第9章 結(jié)束語
    9.1 研究工作總結(jié)
    9.2 今后研究計(jì)劃
參考文獻(xiàn)
研究成果和發(fā)表文章目錄
致謝


【參考文獻(xiàn)】:
期刊論文
[1]國內(nèi)外數(shù)字圖書館研究現(xiàn)狀及未來走向[J]. 肖明,沈英.  現(xiàn)代圖書情報(bào)技術(shù). 2000(06)
[2]中國文獻(xiàn)分類學(xué)研究50年(1949-1999)[J]. 白國應(yīng).  中國圖書館學(xué)報(bào). 1999(05)
[3]中文信息自動(dòng)分類系統(tǒng)及其神經(jīng)網(wǎng)絡(luò)優(yōu)化算法[J]. 刁倩,王永成,張惠惠.  信息與控制. 1999(03)
[4]語言社群類型與臺(tái)灣的外來詞[J]. 史有為.  語言文字應(yīng)用. 1999(02)
[5]二十年來現(xiàn)代漢語新詞語的特點(diǎn)及其產(chǎn)生渠道[J]. 朱永鍇,林倫倫.  語言文字應(yīng)用. 1999(02)
[6]自動(dòng)分類研究現(xiàn)狀與展望[J]. 成穎,史九林.  情報(bào)學(xué)報(bào). 1999(01)
[7]缺乏抽詞詞典是自動(dòng)抽詞標(biāo)引難以普及的主要原因[J]. 張琪玉.  圖書與情報(bào). 1998(02)
[8]中文文獻(xiàn)主題的自動(dòng)標(biāo)引[J]. 王永成,顧曉明,王麗霞.  情報(bào)學(xué)報(bào). 1998(03)
[9]圖書分類中應(yīng)用專家系統(tǒng)的嘗試[J]. 鄧要武,崔光益,王連俊.  圖書館雜志. 1998(04)
[10]基于《金融檔案分類表》的自動(dòng)分類算法研究[J]. 劉開瑛,鄭家恒,劉靜.  情報(bào)學(xué)報(bào). 1997(05)

博士論文
[1]Internet科技信息資源門戶網(wǎng)站(STIP)系統(tǒng)的實(shí)踐研究[D]. 張智雄.中國科學(xué)院文獻(xiàn)情報(bào)中心 2000



本文編號(hào):2903581

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/tushudanganlunwen/2903581.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶993a9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com