基于文本相似度算法的京津冀特色旅游線路開發(fā)
發(fā)布時(shí)間:2020-12-07 05:42
隨著經(jīng)濟(jì)的發(fā)展和技術(shù)的進(jìn)步,人們的休閑時(shí)間與時(shí)俱增,恩格爾系數(shù)與時(shí)俱減,人們可支配收入大幅度增加,生活水平提高了,對(duì)旅游的需求也越來(lái)越大。旅游已經(jīng)成為現(xiàn)代人生活中重要的部分,并且旅游者已不滿足傳統(tǒng)的旅游產(chǎn)品,越來(lái)越傾向于選擇個(gè)性化的,具有鮮明特色的休閑度假旅游產(chǎn)品。旅游收入在國(guó)內(nèi)生產(chǎn)總值中的占比越來(lái)越大,加快旅游業(yè)發(fā)展成為推動(dòng)我國(guó)經(jīng)濟(jì)發(fā)展的重要方式之一。中國(guó)旅游業(yè)發(fā)展已進(jìn)入爆發(fā)式增長(zhǎng)期,大眾旅游時(shí)代即將全面來(lái)臨。京津旅游資源豐富,河北省旅游景點(diǎn)眾多,但景點(diǎn)分布分散,開發(fā)程度有待提高的問(wèn)題明顯。隨著京津冀一體化格局的不斷演變,整合京津冀旅游資源,開發(fā)具有區(qū)域特色和發(fā)展?jié)摿Φ穆糜尉路,延伸京津游客的旅游線路長(zhǎng)度;引進(jìn)京津的旅游接待能力、管理經(jīng)驗(yàn)和雄厚的資金實(shí)力,必將有利于調(diào)整京津冀區(qū)域旅游集散結(jié)構(gòu),加速河北旅游業(yè)的開發(fā),促進(jìn)京津冀旅游一體化發(fā)展,形成三地共享的特色旅游品牌。運(yùn)用全新的旅游線路開發(fā)思路,將文本相似度算法應(yīng)用到旅游線路開發(fā)中,通過(guò)描述景點(diǎn)的文本信息,分析得出景點(diǎn)的特征,將具有相同特征的景點(diǎn)歸為一類,結(jié)合地理位置的特征將同類型的景點(diǎn)設(shè)計(jì)在一條線路中形成特色旅游線路。線路開發(fā)具有可...
【文章來(lái)源】:河北經(jīng)貿(mào)大學(xué)河北省
【文章頁(yè)數(shù)】:48 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文本處理過(guò)程
2 文本處理文本通常是具有完整、系統(tǒng)含義的一個(gè)句子或多個(gè)句子,屬于自然語(yǔ)言,是非結(jié)構(gòu)化的信息。若要計(jì)算文本間的相似度,需要把這些非結(jié)構(gòu)化的信息即文本,轉(zhuǎn)化成計(jì)算機(jī)能夠識(shí)別和計(jì)算的數(shù)字化的表示形式,這樣才能計(jì)算出文本間的相似度。計(jì)算文本相似度前期需要完成的過(guò)程主要包括分詞,去停用詞、提取特征項(xiàng)、計(jì)算特征項(xiàng)權(quán)重,度量相似度等。2.1 文本預(yù)處理文本預(yù)處理過(guò)程包括分詞和去停用詞。本文將要分析的內(nèi)容為從百度百科下載下來(lái)的共 90 個(gè)景點(diǎn)的文本信息,一個(gè)景點(diǎn)的信息為一個(gè)文本。下面以北京故宮博物院為例,介紹論文的實(shí)現(xiàn)過(guò)程,其文本內(nèi)容如下圖所示。
去掉這些分詞并不影響文本的主要內(nèi)容,遂也要將他們?nèi)サ。本文將整理得到?1200 余個(gè)常見停用詞組成停用詞詞典,去掉文中出現(xiàn)在停用詞詞典中的詞。經(jīng)過(guò)分詞、去掉停用詞之后的故宮博物院文本如下圖所示。經(jīng)過(guò)文本預(yù)處理之后,故宮博物院文本中就是一個(gè)一個(gè)獨(dú)立的可以代表實(shí)際意義的詞語(yǔ),例如:明朝、清朝、兩代、皇宮。
【參考文獻(xiàn)】:
期刊論文
[1]張家口文化旅游資源開發(fā)利用之探究[J]. 田曉菁,牛志忠. 旅游縱覽(下半月). 2016(01)
[2]基于京津冀客源市場(chǎng)的保定旅游商品開發(fā)對(duì)比研究[J]. 胡葉星寒,劉志平. 保定學(xué)院學(xué)報(bào). 2014(05)
[3]“旅游興市”戰(zhàn)略背景下秦皇島市旅游經(jīng)濟(jì)發(fā)展研究[J]. 華艷. 商場(chǎng)現(xiàn)代化. 2014(19)
[4]面向用戶生成內(nèi)容的短文本聚類算法研究[J]. 趙輝,劉懷亮. 現(xiàn)代圖書情報(bào)技術(shù). 2013(09)
[5]京津冀地區(qū)的旅游聯(lián)動(dòng)發(fā)展:模式、對(duì)象與路徑[J]. 寧澤群,李享,吳泰岳,汪金輝. 北京聯(lián)合大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2013(01)
[6]京津冀旅游協(xié)作共生共贏研究[J]. 孫振杰,董國(guó)英,李秀娥. 合作經(jīng)濟(jì)與科技. 2012(19)
[7]京津冀區(qū)域旅游經(jīng)濟(jì)空間結(jié)構(gòu)研究[J]. 尚雪梅. 河北大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2012(03)
[8]開啟京津冀區(qū)域經(jīng)濟(jì)一體化新篇章——2011年首都圈發(fā)展高層論壇綜述[J]. 吳慶玲,齊子翔. 首都經(jīng)濟(jì)貿(mào)易大學(xué)學(xué)報(bào). 2012(03)
[9]文本聚類中文本表示和相似度計(jì)算研究綜述[J]. 吳夙慧,成穎,鄭彥寧,潘云濤. 情報(bào)科學(xué). 2012(04)
[10]淺析河北省旅游資源保護(hù)與開發(fā)[J]. 張旭. 科技創(chuàng)新導(dǎo)報(bào). 2011(26)
碩士論文
[1]河北灤州古城文化旅游開發(fā)研究[D]. 龐勵(lì).廣西師范大學(xué) 2016
[2]基于向量空間模型的文本相似度算法研究[D]. 譚靜.西南石油大學(xué) 2015
[3]京津冀協(xié)同發(fā)展下的保定市旅游產(chǎn)品體系的優(yōu)化[D]. 張森森.河北大學(xué) 2015
[4]基于語(yǔ)義領(lǐng)域向量空間模型的文本相似度計(jì)算[D]. 唐果.云南大學(xué) 2013
[5]旅行社旅游線路節(jié)點(diǎn)設(shè)計(jì)分析[D]. 劉倩.西北大學(xué) 2006
[6]旅游線路設(shè)計(jì)研究[D]. 龔軍姣.湖南師范大學(xué) 2005
[7]旅游線路優(yōu)化中的運(yùn)籌學(xué)問(wèn)題[D]. 吳凱.東北財(cái)經(jīng)大學(xué) 2003
本文編號(hào):2902735
【文章來(lái)源】:河北經(jīng)貿(mào)大學(xué)河北省
【文章頁(yè)數(shù)】:48 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文本處理過(guò)程
2 文本處理文本通常是具有完整、系統(tǒng)含義的一個(gè)句子或多個(gè)句子,屬于自然語(yǔ)言,是非結(jié)構(gòu)化的信息。若要計(jì)算文本間的相似度,需要把這些非結(jié)構(gòu)化的信息即文本,轉(zhuǎn)化成計(jì)算機(jī)能夠識(shí)別和計(jì)算的數(shù)字化的表示形式,這樣才能計(jì)算出文本間的相似度。計(jì)算文本相似度前期需要完成的過(guò)程主要包括分詞,去停用詞、提取特征項(xiàng)、計(jì)算特征項(xiàng)權(quán)重,度量相似度等。2.1 文本預(yù)處理文本預(yù)處理過(guò)程包括分詞和去停用詞。本文將要分析的內(nèi)容為從百度百科下載下來(lái)的共 90 個(gè)景點(diǎn)的文本信息,一個(gè)景點(diǎn)的信息為一個(gè)文本。下面以北京故宮博物院為例,介紹論文的實(shí)現(xiàn)過(guò)程,其文本內(nèi)容如下圖所示。
去掉這些分詞并不影響文本的主要內(nèi)容,遂也要將他們?nèi)サ。本文將整理得到?1200 余個(gè)常見停用詞組成停用詞詞典,去掉文中出現(xiàn)在停用詞詞典中的詞。經(jīng)過(guò)分詞、去掉停用詞之后的故宮博物院文本如下圖所示。經(jīng)過(guò)文本預(yù)處理之后,故宮博物院文本中就是一個(gè)一個(gè)獨(dú)立的可以代表實(shí)際意義的詞語(yǔ),例如:明朝、清朝、兩代、皇宮。
【參考文獻(xiàn)】:
期刊論文
[1]張家口文化旅游資源開發(fā)利用之探究[J]. 田曉菁,牛志忠. 旅游縱覽(下半月). 2016(01)
[2]基于京津冀客源市場(chǎng)的保定旅游商品開發(fā)對(duì)比研究[J]. 胡葉星寒,劉志平. 保定學(xué)院學(xué)報(bào). 2014(05)
[3]“旅游興市”戰(zhàn)略背景下秦皇島市旅游經(jīng)濟(jì)發(fā)展研究[J]. 華艷. 商場(chǎng)現(xiàn)代化. 2014(19)
[4]面向用戶生成內(nèi)容的短文本聚類算法研究[J]. 趙輝,劉懷亮. 現(xiàn)代圖書情報(bào)技術(shù). 2013(09)
[5]京津冀地區(qū)的旅游聯(lián)動(dòng)發(fā)展:模式、對(duì)象與路徑[J]. 寧澤群,李享,吳泰岳,汪金輝. 北京聯(lián)合大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2013(01)
[6]京津冀旅游協(xié)作共生共贏研究[J]. 孫振杰,董國(guó)英,李秀娥. 合作經(jīng)濟(jì)與科技. 2012(19)
[7]京津冀區(qū)域旅游經(jīng)濟(jì)空間結(jié)構(gòu)研究[J]. 尚雪梅. 河北大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2012(03)
[8]開啟京津冀區(qū)域經(jīng)濟(jì)一體化新篇章——2011年首都圈發(fā)展高層論壇綜述[J]. 吳慶玲,齊子翔. 首都經(jīng)濟(jì)貿(mào)易大學(xué)學(xué)報(bào). 2012(03)
[9]文本聚類中文本表示和相似度計(jì)算研究綜述[J]. 吳夙慧,成穎,鄭彥寧,潘云濤. 情報(bào)科學(xué). 2012(04)
[10]淺析河北省旅游資源保護(hù)與開發(fā)[J]. 張旭. 科技創(chuàng)新導(dǎo)報(bào). 2011(26)
碩士論文
[1]河北灤州古城文化旅游開發(fā)研究[D]. 龐勵(lì).廣西師范大學(xué) 2016
[2]基于向量空間模型的文本相似度算法研究[D]. 譚靜.西南石油大學(xué) 2015
[3]京津冀協(xié)同發(fā)展下的保定市旅游產(chǎn)品體系的優(yōu)化[D]. 張森森.河北大學(xué) 2015
[4]基于語(yǔ)義領(lǐng)域向量空間模型的文本相似度計(jì)算[D]. 唐果.云南大學(xué) 2013
[5]旅行社旅游線路節(jié)點(diǎn)設(shè)計(jì)分析[D]. 劉倩.西北大學(xué) 2006
[6]旅游線路設(shè)計(jì)研究[D]. 龔軍姣.湖南師范大學(xué) 2005
[7]旅游線路優(yōu)化中的運(yùn)籌學(xué)問(wèn)題[D]. 吳凱.東北財(cái)經(jīng)大學(xué) 2003
本文編號(hào):2902735
本文鏈接:http://www.lk138.cn/guanlilunwen/lvyoujiudianguanlilunwen/2902735.html
最近更新
教材專著