Luder基于內(nèi)容的文檔搜索引擎
本文關(guān)鍵詞:Luder基于內(nèi)容的文檔搜索引擎,由筆耕文化傳播整理發(fā)布。
本文對(duì)Luder基于內(nèi)容的文檔搜索引擎進(jìn)行了研究。文章在Lucene開(kāi)源搜索框架基礎(chǔ)上,重新封裝核心功能,實(shí)現(xiàn)對(duì)多種格式的本地文檔搜索功能,使用戶在系統(tǒng)中全局地掌握桌面文檔資源;構(gòu)建基于SWT圖形界面庫(kù)可移植的交互界面,讓用戶方便地與系統(tǒng)交互:運(yùn)用中文分詞理論實(shí)現(xiàn)支持中/英文的 MandarinAnaylzer、基于詞典的分析、分詞模塊,最大可以支持5個(gè)漢字詞的模式匹配,解決了Lucene對(duì)中文支持不好的問(wèn)題;針對(duì)不同格式的文檔,構(gòu)建多種類(lèi)型解析器(Parser)抽取文檔文本用于建立索引,支持多種流行的文檔格式。本系統(tǒng)有效地解決了桌面應(yīng)用中對(duì)于文檔查詢的問(wèn)題...
本文對(duì)Luder基于內(nèi)容的文檔搜索引擎進(jìn)行了研究。文章在Lucene開(kāi)源搜索框架基礎(chǔ)上,重新封裝核心功能,實(shí)現(xiàn)對(duì)多種格式的本地文檔搜索功能,使用戶在系統(tǒng)中全局地掌握桌面文檔資源;構(gòu)建基于SWT圖形界面庫(kù)可移植的交互界面,讓用戶方便地與系統(tǒng)交互:運(yùn)用中文分詞理論實(shí)現(xiàn)支持中/英文的 MandarinAnaylzer、基于詞典的分析、分詞模塊,最大可以支持5個(gè)漢字詞的模式匹配,解決了Lucene對(duì)中文支持不好的問(wèn)題;針對(duì)不同格式的文檔,構(gòu)建多種類(lèi)型解析器(Parser)抽取文檔文本用于建立索引,支持多種流行的文檔格式。本系統(tǒng)有效地解決了桌面應(yīng)用中對(duì)于文檔查詢的問(wèn)題,實(shí)現(xiàn)基于內(nèi)容查找、提高查找效率與速度,更有效地利用桌面文檔資源。
展開(kāi)
本文關(guān)鍵詞:Luder基于內(nèi)容的文檔搜索引擎,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):91789
本文鏈接:http://www.lk138.cn/kejilunwen/sousuoyinqinglunwen/91789.html