基于Lucene的畢業(yè)論文相似性檢測
本文關(guān)鍵詞:基于Lucene的畢業(yè)論文相似性檢測,由筆耕文化傳播整理發(fā)布。
【摘要】:提出了基于Lucene的論文相似性檢測系統(tǒng),采用隨機(jī)特征碼算法構(gòu)造特征向量。實(shí)驗(yàn)表明該算法與傳統(tǒng)的文本聚類算法在查全率、查準(zhǔn)率及時(shí)間消耗上具有優(yōu)越性,呈線性結(jié)構(gòu)的算法適合大規(guī)模論文的抄襲檢測。
【作者單位】: 長春工業(yè)大學(xué)人文信息學(xué)院;
【關(guān)鍵詞】: Lucene畢業(yè)論文 抄襲檢測 隨機(jī)特征碼
【基金】:吉林省教育廳“十二五”科研課題(吉教科合字2011第353號(hào))
【分類號(hào)】:TP391.1
【正文快照】: 0引言畢業(yè)論文是本科人才培養(yǎng)的重要實(shí)踐性教學(xué)環(huán)節(jié),也是學(xué)士學(xué)位評(píng)定的重要依據(jù)。但是隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)資源方便易得,畢業(yè)論文成段復(fù)制也給學(xué)生的抄襲帶來了極大的方便。本文研究和分析了開源的搜索引擎工具Lucene的原理,將Lucene技術(shù)應(yīng)用于畢業(yè)論文選題系統(tǒng)中,對(duì)上傳論
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 馮汝偉;謝強(qiáng);丁秋林;;基于文本聚類與分布式Lucene的知識(shí)檢索[J];計(jì)算機(jī)應(yīng)用;2013年01期
2 管建和;甘劍峰;;基于Lucene全文檢索引擎的應(yīng)用研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年02期
3 李永春;丁華福;;Lucene的全文檢索的研究與應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年02期
4 周鳳麗;林曉麗;;基于Lucene的Web搜索引擎的研究和實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2012年01期
5 秦穎;文秋芳;梁茂成;;應(yīng)用隨機(jī)特征碼檢測雷同譯文[J];外語電化教學(xué);2009年06期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱學(xué)芳;馮曦曦;;面向農(nóng)業(yè)主題搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];安徽農(nóng)業(yè)科學(xué);2011年35期
2 李敏;黃凱;;一個(gè)多線程全文檢索系統(tǒng)的構(gòu)建[J];長江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年03期
3 王軍;張興忠;;XML與全文檢索在CMS數(shù)據(jù)歸檔中的應(yīng)用[J];電腦開發(fā)與應(yīng)用;2012年01期
4 劉敏娜;葛萌;陳娟;;基于Lucene的全文搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];福建電腦;2009年05期
5 周文勤;;使用Heritrix和Lucence的全文檢索解決方案[J];甘肅聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年04期
6 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的結(jié)構(gòu)機(jī)制與應(yīng)用方式[J];廣西科學(xué)院學(xué)報(bào);2010年04期
7 陳曉麗;楊欣蓉;王作釗;周航;趙益;沈玲玲;;面向制造業(yè)的知識(shí)搜索引擎設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2013年16期
8 汪濤;;論基于Java的全文檢索實(shí)現(xiàn)和索引性能提高[J];湖北民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年01期
9 孫海東;張力;;基于Lucennee.t的醫(yī)學(xué)教育視頻垂直檢索的設(shè)計(jì)與實(shí)現(xiàn)[J];開放教育研究;2011年02期
10 宋佳;諸云強(qiáng);劉潤達(dá);;一種基于Lucene改進(jìn)的全文檢索工具包[J];計(jì)算機(jī)工程與應(yīng)用;2008年04期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的研究及應(yīng)用[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 雷斌;基于Java技術(shù)的智能化搜索引擎的研究與設(shè)計(jì)[D];哈爾濱工程大學(xué);2010年
2 樊春雷;基于語義分析的糖尿病健康教育系統(tǒng)研究與實(shí)現(xiàn)[D];華東理工大學(xué);2011年
3 王兆宇;個(gè)性化站內(nèi)搜索引擎的設(shè)計(jì)與應(yīng)用[D];東華大學(xué);2011年
4 馬靜;基于web的數(shù)字化資源全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2010年
5 吳代文;基于Lucene的二次全文檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
6 丁士敏;基于Ajax/Lucene的站內(nèi)搜索技術(shù)研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年
7 孫華昱;Lucene在醫(yī)學(xué)影像資源檢索平臺(tái)中的應(yīng)用[D];沈陽工業(yè)大學(xué);2011年
8 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年
9 陳剛;基于行為分析智能推薦購物搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2011年
10 遲名;煙草專賣網(wǎng)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 孫健,王偉,鐘義信;基于K-最近距離的自動(dòng)文本分類的研究[J];北京郵電大學(xué)學(xué)報(bào);2001年01期
2 蔣明原;孔令德;寧靜靜;;一種海量數(shù)據(jù)下的Lucene全文檢索解決方案[J];電腦開發(fā)與應(yīng)用;2011年04期
3 曹宇;尹剛;李翔;程榮斌;王懷民;;聚類搜索引擎研究進(jìn)展淺析[J];電腦知識(shí)與技術(shù);2011年22期
4 李振龍;;Web信息檢索的技術(shù)分析與發(fā)展策略研究[J];計(jì)算機(jī)科學(xué);2006年04期
5 印鑒,陳憶群,張鋼;搜索引擎技術(shù)研究與發(fā)展[J];計(jì)算機(jī)工程;2005年14期
6 郎小偉;王申康;;基于Lucene的全文檢索系統(tǒng)研究與開發(fā)[J];計(jì)算機(jī)工程;2006年04期
7 張汛淶;搜索引擎的設(shè)計(jì)剖析[J];計(jì)算機(jī)工程與科學(xué);2002年04期
8 趙恒永;沈堅(jiān);山嵐;;基于專業(yè)信息深度挖掘的搜索引擎Spider的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與科學(xué);2009年06期
9 王浩;姚長利;郭琳;艾國慶;;基于中文搜索引擎網(wǎng)絡(luò)信息用戶行為研究[J];計(jì)算機(jī)應(yīng)用研究;2009年12期
10 朱學(xué)昊;王儒敬;余鋒林;唐昱;;基于Lucene的站內(nèi)搜索設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;2008年10期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 郭琰;元搜索引擎的關(guān)鍵技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];南京理工大學(xué);2002年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 謝維信,劉健莊;視覺圖形符號(hào)的頻譜分析[J];航天醫(yī)學(xué)與醫(yī)學(xué)工程;1990年04期
2 董建萍;一般系統(tǒng)相似性討論[J];桂林電子工業(yè)學(xué)院學(xué)報(bào);1996年01期
3 陳兵,井元偉,張嗣瀛;經(jīng)狀態(tài)反饋確保非線性不確定相似組合系統(tǒng)終極一致有界[J];控制與決策;1998年05期
4 劉紅冰;淺析計(jì)算機(jī)技術(shù)與社會(huì)現(xiàn)象的相似性[J];湖南財(cái)經(jīng)高等?茖W(xué)校學(xué)報(bào);2000年06期
5 王秀平;劉家勇;李治柱;;個(gè)性化學(xué)習(xí)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];微型電腦應(yīng)用;2005年11期
6 王小玲;胡平;;基于個(gè)人興趣和反饋技術(shù)的Page Rank算法研究[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年03期
7 朱俊武;王建東;李斌;;基于語義相似性的web服務(wù)選擇(英文)[J];東南大學(xué)學(xué)報(bào)(英文版);2006年03期
8 喬園園;吳夏;楊玲;張明濤;;化學(xué)信息學(xué)開源軟件的集成與復(fù)用[J];計(jì)算機(jī)與應(yīng)用化學(xué);2007年01期
9 吳春輝;鐘寶榮;;基于內(nèi)容的音頻檢索技術(shù)研究[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2007年06期
10 張亞;王元慶;;一種有效的數(shù)字圖像傳感器彩色插值算法[J];計(jì)算機(jī)測量與控制;2008年04期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 張恒超;陰國恩;;關(guān)系類別及其學(xué)習(xí)機(jī)制[A];第十二屆全國心理學(xué)學(xué)術(shù)大會(huì)論文摘要集[C];2009年
2 趙春江;施文康;鄧勇;;基于Wasserstein距離的目標(biāo)識(shí)別中的研究[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
3 秦軍剛;韓世輝;;不應(yīng)效應(yīng)和波形相異交迭——知覺組織神經(jīng)基礎(chǔ)的可能解釋?[A];2005年中國神經(jīng)心理學(xué)學(xué)術(shù)會(huì)議論文集[C];2005年
4 葉知新;莫雷;;基于相似性歸類中的外顯策略和內(nèi)隱策略[A];第十一屆全國心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2007年
5 范萬春;邱宏茂;孫煜;施仁;李真富;;基于自相關(guān)函數(shù)的地震信號(hào)自適應(yīng)端點(diǎn)檢測[A];第十屆全國核電子學(xué)與核探測技術(shù)學(xué)術(shù)年會(huì)論文集[C];2000年
6 彭豐平;鮑蘇蘇;;基于CT序列圖像肝臟及其管道的分割[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
7 張?jiān)?楚澤涵;;不同頻率聲衰減之間的相似性問題[A];1999年中國地球物理學(xué)會(huì)年刊——中國地球物理學(xué)會(huì)第十五屆年會(huì)論文集[C];1999年
8 彭建武;;連通主義和認(rèn)知語言學(xué)的對(duì)比研究[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 黎堅(jiān);張厚粲;;心理學(xué)常用計(jì)數(shù)數(shù)據(jù)相似性檢驗(yàn)法[A];全國教育與心理統(tǒng)計(jì)測量學(xué)術(shù)年會(huì)論文摘要集[C];2006年
10 劉夢然;;材料力學(xué)學(xué)科特性與內(nèi)在邏輯的分析[A];海峽兩岸力學(xué)教學(xué)—教學(xué)經(jīng)驗(yàn)與教學(xué)改革交流會(huì)論文集[C];2002年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 趙軍;相似性影響電影與觀眾的互動(dòng)[N];中國電影報(bào);2008年
2 本報(bào)記者 黃婉媛;探尋文化相似性有利化解紛爭[N];中山日?qǐng)?bào);2010年
3 中國傳媒大學(xué)計(jì)算機(jī)學(xué)院 朱立谷;重復(fù)數(shù)據(jù)刪除技術(shù)解析[N];中國計(jì)算機(jī)報(bào);2007年
4 趙曉;中國經(jīng)濟(jì)到了一個(gè)新十字路口[N];上海證券報(bào);2008年
5 張?zhí)锟?最新破譯狗的起源和進(jìn)化[N];北京日?qǐng)?bào);2005年
6 沈曉強(qiáng);倫銅合理底部在6400—6500美元[N];期貨日?qǐng)?bào);2007年
7 康潛;前車后轍 安步當(dāng)歌[N];證券日?qǐng)?bào);2007年
8 吳國平;縮量雙星暗藏玄機(jī)?[N];上海證券報(bào);2006年
9 路平;企業(yè)的責(zé)任意識(shí)需提升[N];中國勞動(dòng)保障報(bào);2009年
10 侯燕俐;伍德威:一路旅行一路收藏[N];中國鄉(xiāng)鎮(zhèn)企業(yè)報(bào);2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 曾海泉;時(shí)間序列挖掘與相似性查找技術(shù)研究[D];復(fù)旦大學(xué);2003年
2 王曉曄;時(shí)間序列數(shù)據(jù)挖掘中相似性和趨勢預(yù)測的研究[D];天津大學(xué);2003年
3 黃樟燦;演化計(jì)算的搜索策略研究[D];武漢大學(xué);2004年
4 李桂杰;固體“類流態(tài)”機(jī)理及其與地震孕震的相似性研究[D];天津大學(xué);2004年
5 李俊奎;時(shí)間序列相似性問題研究[D];華中科技大學(xué);2008年
6 黎榮;概念工藝規(guī)劃原型系統(tǒng)關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2006年
7 翁延玲;RTL到門級(jí)設(shè)計(jì)的等價(jià)性驗(yàn)證的研究[D];浙江大學(xué);2008年
8 曹順良;生物學(xué)數(shù)據(jù)集成若干關(guān)鍵問題研究[D];復(fù)旦大學(xué);2005年
9 黃章峰;超音速平板邊界層從層流到湍流的轉(zhuǎn)捩機(jī)理及湍流特性[D];天津大學(xué);2006年
10 阮文善;類型學(xué)視野中的同一、差異與相似[D];華東師范大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 魯華;中西當(dāng)代廣告作品比較研究[D];武漢大學(xué);2005年
2 許瑞珍;結(jié)構(gòu)對(duì)稱蛋白質(zhì)的序列分析[D];華中科技大學(xué);2005年
3 別晨霞;基于中介語語料庫的形容詞產(chǎn)出偏誤分析[D];上海師范大學(xué);2009年
4 陸蘇靜;從相似性角度看中介語中的程度副詞偏誤現(xiàn)象[D];上海師范大學(xué);2009年
5 鐘亮;基于視頻流的數(shù)字隱藏技術(shù)[D];華南師范大學(xué);2005年
6 朱賢芳;生物序列的比對(duì)算法比較研究[D];南京理工大學(xué);2005年
7 孫傳波;認(rèn)知風(fēng)格、加工方式與漢語相似詞學(xué)習(xí)的關(guān)系研究[D];曲阜師范大學(xué);2006年
8 焉炳艷;一種新的基于相似性的多目標(biāo)演化算法[D];武漢理工大學(xué);2006年
9 張婷婷;歸納推理中的屬性中心性效應(yīng)及其心理過程初探[D];西南大學(xué);2007年
10 萬小梅;江西贛語詞匯變音探究[D];華南師范大學(xué);2007年
本文關(guān)鍵詞:基于Lucene的畢業(yè)論文相似性檢測,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):357143
本文鏈接:http://www.lk138.cn/wenshubaike/caipu/357143.html