基于向量空間模型的畢業(yè)論文相似性辨識研究
本文選題:向量空間模型 + 相似性計算 ; 參考:《科學技術與工程》2007年09期
【摘要】:隨著高校擴招以及互聯(lián)網(wǎng)信息膨脹,高校畢業(yè)論文管理中排查論文抄襲的工作量越來越大。文中提出采用向量空間模型計算論文之間的相似度,通過相似度排序,找出“可疑”論文,然后再進行人工審核,從而加快了管理機構對論文排查的速度,減少了人工排查的工作量,增加了論文排查過程的公正性。
[Abstract]:With the expansion of college enrollment and the expansion of Internet information, the workload of investigating plagiarism in the management of graduation thesis is increasing. In this paper, a vector space model is proposed to calculate the similarity between papers. Through similarity ranking, we can find out the "suspicious" papers, and then carry out manual review, thus speeding up the speed of the management organization to search the papers. The workload of manual search is reduced, and the fairness of the process is increased.
【作者單位】: 湖南大學經(jīng)濟管理數(shù)據(jù)中心 長沙航空職業(yè)技術學院
【分類號】:TP391.1
【參考文獻】
相關期刊論文 前2條
1 龐劍鋒,卜東波,白碩;基于向量空間模型的文本自動分類系統(tǒng)的研究與實現(xiàn)[J];計算機應用研究;2001年09期
2 吳棟,滕育平;中文信息檢索引擎中的分詞與檢索技術[J];計算機應用;2004年07期
【共引文獻】
相關期刊論文 前10條
1 戰(zhàn)守義,井新;加入時間因素的個性化信息過濾技術[J];北京理工大學學報;2005年09期
2 代勁;胡峰;王國胤;;基于不完備信息系統(tǒng)的文本分類研究與應用[J];重慶郵電學院學報(自然科學版);2006年03期
3 李粵;安捷;李星;;排序融合算法在校園網(wǎng)搜索引擎中的應用[J];大連理工大學學報;2005年S1期
4 邵晶,黨海峰,白慧先,鄭慶華;OPAC資源與網(wǎng)絡教育資源共享集成關鍵技術研究[J];大學圖書館學報;2005年03期
5 蔡勇智;基于最大匹配分詞算法的中文詞語粗分模型[J];福建電腦;2005年09期
6 谷峰;吳揚揚;;文本分類關鍵技術[J];福建電腦;2006年09期
7 賀衛(wèi)紅;曹毅;;基于向量空間模型文本過濾算法[J];系統(tǒng)工程;2005年10期
8 胡佳妮,徐蔚然,郭軍,鄧偉洪;中文文本分類中的特征選擇算法研究[J];光通信研究;2005年03期
9 謝科;張輝;陳鵬;龐斌;;文本分類系統(tǒng)關鍵技術[J];廣西師范大學學報(自然科學版);2007年02期
10 朱培毅,黃敏;基于Boosting算法的文本自動分類器模型設計[J];高校圖書館工作;2004年05期
相關會議論文 前2條
1 Zhao Shuanzhu Chen Junjie Guo Xin College of Computer and Software Taiyuan University of Technology,Taiyuan,Shanxi,Chnia,030024;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
2 王虎;王潛平;;對整詞二分自動分詞機制的改進[A];中國計算技術與語言問題研究——第七屆中文信息處理國際會議論文集[C];2007年
相關博士學位論文 前10條
1 楊震;個性化信息獲取方法的研究[D];大連理工大學;2004年
2 劉華;基于關鍵短語的文本內容標引研究[D];北京語言大學;2005年
3 孫越恒;基于統(tǒng)計的NLP技術在中文信息檢索中的應用研究[D];天津大學;2005年
4 王秀娟;文本檢索中若干問題研究[D];北京郵電大學;2006年
5 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復研究[D];北京郵電大學;2006年
6 周瑛;神經(jīng)網(wǎng)絡作為分類器的算法研究及在信息檢索中的應用[D];安徽大學;2006年
7 張亮;面向開放域的中文問答系統(tǒng)問句處理相關技術研究[D];南京理工大學;2006年
8 姜韶華;科研項目管理中的文本挖掘方法研究及應用[D];大連理工大學;2006年
9 杜衛(wèi)鋒;粗糙集理論在中文文本分類中的應用[D];西南交通大學;2006年
10 王永恒;海量短語信息挖掘技術的研究與實現(xiàn)[D];國防科學技術大學;2006年
相關碩士學位論文 前10條
1 楊盛;電子郵件過濾系統(tǒng)的研究與設計[D];中南大學;2005年
2 邱宇紅;向量空間模型在醫(yī)學文獻相關性研究中的應用[D];中國醫(yī)科大學;2006年
3 馬安香;基于分類語義的Web信息抽取機制的研究與實現(xiàn)[D];東北大學;2005年
4 周欽強;基于人工智能技術Naive Bayes文本自動分類系統(tǒng)研究[D];廣東工業(yè)大學;2005年
5 侯麗敏;基于網(wǎng)絡的智能答疑系統(tǒng)的研究與實現(xiàn)[D];河南大學;2005年
6 胡卓穎;專題型網(wǎng)頁搜集器關鍵算法的研究及實現(xiàn)[D];江西師范大學;2005年
7 廖海波;基于投影尋蹤回歸的文本分類研究[D];江西師范大學;2005年
8 付雪峰;基于模糊—粗糙集的文本分類模型[D];江西師范大學;2005年
9 李威;基于向量空間的文本自動分類系統(tǒng)的研究和實現(xiàn)[D];蘭州理工大學;2005年
10 陳樂;基于智能文本分類技術的素材管理軟件的設計與開發(fā)[D];南京師范大學;2003年
【二級參考文獻】
相關期刊論文 前1條
1 嚴威,趙政;開發(fā)中文搜索引擎漢語處理的關鍵技術[J];計算機工程;1999年06期
【相似文獻】
相關期刊論文 前10條
1 李虎;鄒鵬;賈焰;周斌;;一種基于MapReduce的分布式文本數(shù)據(jù)過濾模型研究[J];信息網(wǎng)絡安全;2011年09期
2 申瑩;徐東平;龐俊;;基于概念的中文博客情感極性聚類分析[J];計算機系統(tǒng)應用;2011年08期
3 潘正高;侯傳宇;談成訪;;基于命名實體的Web新聞文本分類方法[J];合肥工業(yè)大學學報(自然科學版);2011年08期
4 孫桂煌;;一種基于n-gram短語的文本聚類方法研究[J];現(xiàn)代計算機(專業(yè)版);2011年14期
5 孟佳娜;林鴻飛;李彥鵬;;基于特征貢獻度的特征選擇方法在文本分類中應用[J];大連理工大學學報;2011年04期
6 李志明;李善平;楊朝暉;林欣;;基于本體分割的本體映射算法[J];模式識別與人工智能;2011年02期
7 冷亞軍;梁昌勇;張恩橋;戚筱雯;;基于項類偏好的協(xié)同過濾推薦算法[J];情報學報;2011年07期
8 許志凱;徐志明;李棟;李生;;面向互聯(lián)網(wǎng)新聞的話題檢測與追蹤[J];智能計算機與應用;2011年03期
9 李e,
本文編號:1842408
本文鏈接:http://www.lk138.cn/wenshubaike/caipu/1842408.html