中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 教育論文 > 學(xué)校管理論文 >

教育政策文本的分類算法研究與應(yīng)用

發(fā)布時(shí)間:2020-04-20 04:57
【摘要】:隨著國家對教育事業(yè)的大力推進(jìn)以及信息化技術(shù)的快速發(fā)展,教育政策數(shù)據(jù)在持續(xù)地膨脹,在線的教育政策數(shù)據(jù)已經(jīng)海量化。如何高效管理海量的教育政策數(shù)據(jù)從而挖掘出更多有價(jià)值的信息已經(jīng)變得十分困難。目前,依靠傳統(tǒng)的人工方式來進(jìn)行多種類別的教育政策數(shù)據(jù)的采集、分類與管理,工作量很大、任務(wù)十分繁雜難以完成。自然語言處理中的文本分類技術(shù),可以在節(jié)省人力成本資源的基礎(chǔ)上,更高效地對文本數(shù)據(jù)進(jìn)行自動(dòng)劃分類別。因此,本文將文本分類技術(shù)應(yīng)用到教育政策數(shù)據(jù)的自動(dòng)分類中,快速定位以及準(zhǔn)確查找教育政策數(shù)據(jù),進(jìn)而實(shí)現(xiàn)教育政策數(shù)據(jù)的信息化管理與可視化分析。本文以教育政策文本為研究對象,圍繞教育政策數(shù)據(jù)的采集、文本分類和數(shù)據(jù)可視化進(jìn)行研究,設(shè)計(jì)并實(shí)現(xiàn)了教育政策文本分類可視化系統(tǒng)。本文的主要工作如下:1.針對如何全面地獲取大量教育政策數(shù)據(jù)的問題,本文通過分析北大法寶數(shù)據(jù)庫網(wǎng)站的網(wǎng)頁結(jié)構(gòu)和特點(diǎn),設(shè)計(jì)并實(shí)現(xiàn)了基于網(wǎng)絡(luò)爬蟲技術(shù)的教育政策數(shù)據(jù)采集模塊。該模塊通過模擬登錄的方法解決身份認(rèn)證問題,采用廣度優(yōu)先搜索算法的思想,結(jié)合Beautiful Soup、正則表達(dá)式和數(shù)據(jù)庫等技術(shù),實(shí)現(xiàn)了教育政策數(shù)據(jù)的采集。教育政策數(shù)據(jù)采集模塊解決了請求北大法寶網(wǎng)站過于頻繁、教育政策數(shù)據(jù)抓取不全面的問題,實(shí)現(xiàn)了對教育政策數(shù)據(jù)的全面高效采集。2.針對如何對教育政策準(zhǔn)確分類的問題,本文提出了結(jié)合標(biāo)題與正文注意力機(jī)制的文本分類算法。該算法根據(jù)教育政策文本含有標(biāo)題和正文的特點(diǎn),將文本按照標(biāo)題和正文進(jìn)行建模。在特征詞的表示上,使用循環(huán)結(jié)構(gòu)提取特征詞的上下文語義信息,能夠更好地消除特征詞的歧義;在標(biāo)題和正文文本表示上,使用最大池化技術(shù)來保留文本中重要的潛在語義信息;在整篇文本的表示上,使用注意力機(jī)制為標(biāo)題和正文分配注意力權(quán)重,然后對文本進(jìn)行向量表示,以充分利用教育政策的標(biāo)題信息。通過與現(xiàn)有的分類算法進(jìn)行實(shí)驗(yàn)對比,驗(yàn)證了該算法在教育政策文本分類問題上的優(yōu)越性。3.為了加強(qiáng)教育政策領(lǐng)域的信息化管理,本文設(shè)計(jì)并實(shí)現(xiàn)了教育政策文本分類與可視化系統(tǒng)。一方面,通過將結(jié)合標(biāo)題與正文注意力機(jī)制的文本分類算法應(yīng)用在系統(tǒng)中,實(shí)現(xiàn)了教育政策的自動(dòng)分類,減輕了教育政策管理人員的壓力,提升了教育政策管理的效率;另一方面,通過分析及挖掘教育政策數(shù)據(jù),實(shí)現(xiàn)了教育政策數(shù)據(jù)在地理位置上的分布信息與類別數(shù)量信息展示,能夠直觀的展示出教育政策的整體數(shù)據(jù)信息,來輔助教育政策主管部門做出決策。綜上所述,本文首先設(shè)計(jì)了教育政策數(shù)據(jù)采集模塊,實(shí)現(xiàn)了對教育政策數(shù)據(jù)高效全面的抓取。其次,提出了基于標(biāo)題與正文注意力機(jī)制的教育政策分類算法,能夠充分利用特征詞的語義信息,并根據(jù)標(biāo)題與正文對分類結(jié)果的重要性合理分配權(quán)重。通過在教育政策數(shù)據(jù)集上與其他算法進(jìn)行實(shí)驗(yàn)對比,證明了本文算法優(yōu)于對比算法。最后,設(shè)計(jì)并實(shí)現(xiàn)了教育政策文本分類與可視化系統(tǒng),不僅可以提高教育政策分類的性能,還能提升教育政策管理工作的效率,有利于我國教育政策數(shù)據(jù)的信息化管理。
【圖文】:

網(wǎng)絡(luò)爬蟲,流程,去重,隊(duì)列


進(jìn)行去重處理,并去除那些已經(jīng)爬行過的URL,再把這些新的URL添加到待抓逡逑取的隊(duì)列中用來循環(huán)抓取,直到滿足爬蟲程序的終止條件。通用的網(wǎng)絡(luò)爬蟲流程逡逑如圖2.1所示。逡逑7逡逑

概率分布,模型結(jié)構(gòu),輸出層


安徽大學(xué)碩士學(xué)位論文邐教育政策文本的分類算法研宄與應(yīng)用逡逑Glove邋[35]等,使用這些詞向量訓(xùn)練工具可以很方便的訓(xùn)練到高質(zhì)量的詞向量,本逡逑文選用Google開源的word2vec作為詞向量訓(xùn)練工具。逡逑word2Vec根據(jù)設(shè)計(jì)思想不同,分為CBOW模型(Continuous邋Bag-of-Word逡逑Model)和邋Skip-gram邋模型(Continuous邋Skip-gram邋Model)。它們的網(wǎng)絡(luò)結(jié)構(gòu)如圖逡逑2.2所示,,均包含輸入層、投影層與輸出層。其中,CBOW模型的思想是根據(jù)窗口逡逑詞來預(yù)測中心詞,即使用一個(gè)詞的上下文語義來預(yù)測這個(gè)詞。它的輸入層為窗口逡逑詞的One-hot編碼的分布式表示,投影層對輸入做加權(quán)平均,輸出層則使用逡逑softmax函數(shù)計(jì)算目標(biāo)詞的概率分布。而Skip-gram根據(jù)中心詞來預(yù)測窗口詞,逡逑通過輸入一個(gè)詞來預(yù)測它之前和之后指定范圍內(nèi)的詞出現(xiàn)的概率。它的輸入是目逡逑標(biāo)詞分布式表示,輸出層是目標(biāo)詞的窗口詞的詞向量。逡逑輸入層邐投影層邋輸出層邐輸入層邋投影層邋輸出層逡逑
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.1;G40-011.8

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 武學(xué)超;徐雅婷;;我國政府推動(dòng)產(chǎn)學(xué)研協(xié)同創(chuàng)新政策文本分析(2006-2016)——政策工具視角[J];高教探索;2018年04期

2 焦雨生;;湖北省創(chuàng)新產(chǎn)品需求激勵(lì)政策的反思與重構(gòu)——基于政策文本分析的視角[J];黃岡師范學(xué)院學(xué)報(bào);2018年05期

3 裴雷;孫建軍;周兆韜;;政策文本計(jì)算:一種新的政策文本解讀方式[J];圖書與情報(bào);2016年06期

4 王洪席;;我國綜合素質(zhì)評價(jià)政策的演進(jìn)歷程及特征分析——基于(1999—2014年)政策文本的分析[J];課程.教材.教法;2016年12期

5 楊正聯(lián);;公共政策文本的符號展示意義分析[J];人文雜志;2012年03期

6 王迎;魏順平;;教育政策文本分析研究[J];現(xiàn)代遠(yuǎn)距離教育;2012年02期

7 張偉;薄存旭;;“雙一流”建設(shè)的價(jià)值邏輯與實(shí)踐路徑——基于四省“雙一流”建設(shè)的系列政策文本分析[J];現(xiàn)代教育管理;2018年01期

8 劉暉;李晶;;我國高等教育質(zhì)量保障政策變遷研究——基于1985—2016年的政策文本[J];蘇州大學(xué)學(xué)報(bào)(教育科學(xué)版);2018年02期

9 袁志彬;;基于政策文本分析的科技政策評估模型和實(shí)證研究[J];黨政研究;2017年01期

10 黃棟;許鑫;;基于可持續(xù)轉(zhuǎn)型的我國新能源汽車政策文本分析[J];科技管理研究;2017年13期

相關(guān)會(huì)議論文 前3條

1 王青;曾云敏;楊琳;;廣東碳匯政策文本評估分析[A];2017中國環(huán)境科學(xué)學(xué)會(huì)科學(xué)與技術(shù)年會(huì)論文集(第四卷)[C];2017年

2 鄔志輝;李濤;周兆海;;農(nóng)村教師津補(bǔ)貼政策文本的計(jì)量分析——基于地方政府的政策文本[A];基礎(chǔ)教育區(qū)域性發(fā)展的理論視野與實(shí)踐模式學(xué)術(shù)研討會(huì)會(huì)議資料[C];2012年

3 唐五湘;饒彩霞;程桂枝;;北京市科技金融政策文本量化分析[A];科技型小微企業(yè)創(chuàng)新發(fā)展論壇論文集[C];2013年

相關(guān)重要報(bào)紙文章 前8條

1 張紹勇 張盛斌 滕曉軍;湘鄂黔渝23縣起草《武陵山片區(qū)扶持政策文本》[N];湘聲報(bào);2012年

2 華中師范大學(xué) 劉斌;適度調(diào)整?過度撤并?[N];社會(huì)科學(xué)報(bào);2012年

3 中國教育科學(xué)研究院基礎(chǔ)教育課程研究中心主任 楊九詮;“移步換形”看政策[N];中國教育報(bào);2015年

4 本報(bào)記者 王穎春;細(xì)化配套措施 確保鼓勵(lì)民資政策見實(shí)效[N];中國證券報(bào);2012年

5 丁錦宏 胡思運(yùn) 南通大學(xué)教育科學(xué)學(xué)院;重提“方便學(xué)生就近入學(xué)”[N];中國社會(huì)科學(xué)報(bào);2012年

6 本報(bào)記者 田慕青;奧運(yùn)將對體育產(chǎn)生巨大影響[N];中國體育報(bào);2001年

7 本報(bào)記者 高江虹 吳燕雨 實(shí)習(xí)記者 王琳;靴子落地 新政或致網(wǎng)絡(luò)約車市場變局[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2016年

8 記者 林建偉 江萌 實(shí)習(xí)生 何強(qiáng) 余潔 張澤溥;武漢城市圈金改,憧憬“流金”歲月[N];湖北日報(bào);2015年

相關(guān)博士學(xué)位論文 前1條

1 張鑭;湖北省高新技術(shù)產(chǎn)業(yè)政策研究(1978-2012):政策文本分析視角[D];華中科技大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 王濤;教育政策文本的分類算法研究與應(yīng)用[D];安徽大學(xué);2019年

2 朱菲;泰興市工業(yè)生產(chǎn)性服務(wù)業(yè)發(fā)展的政策文本研究[D];南京大學(xué);2019年

3 王坪;政策工具視角下我國扶貧政策文本量化研究[D];鄭州大學(xué);2019年

4 王美華;基于文本分析方法的PPP國家政策評價(jià)研究[D];天津理工大學(xué);2019年

5 胡志輝;政策工具視角下我國光伏產(chǎn)業(yè)發(fā)展政策研究[D];華南理工大學(xué);2018年

6 周婭;改革開放以來學(xué)前教師政策工具選擇研究[D];西南大學(xué);2018年

7 柳利峰;我國“雙一流”建設(shè)的政策研究[D];鄭州大學(xué);2018年

8 田慧坤;PPP模式采購的國內(nèi)外對比研究[D];合肥工業(yè)大學(xué);2018年

9 徐雨晨;軍民融合知識產(chǎn)權(quán)制度研究:政策文本分析視角[D];大連理工大學(xué);2018年

10 張晶;首都綠色交通政策文本量化研究[D];華北電力大學(xué)(北京);2018年



本文編號:2634178

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/jiaoyulunwen/xuexiaoguanli/2634178.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶50228***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com