可教代理型游戲的設(shè)計(jì)與開(kāi)發(fā)
【圖文】:
者認(rèn)知能力的計(jì)算機(jī)代理。此定義一經(jīng)提出便獲得研究者的一致認(rèn)可,指導(dǎo)著一系列研宄的開(kāi)逡逑展。在現(xiàn)有教學(xué)代理豐富研宄的基礎(chǔ)上,從功能結(jié)構(gòu)角度出發(fā)將可教代理以元組的形式進(jìn)行表逡逑示:TA=邋(E,P,Rt.A)。[5i]具體關(guān)系如圖2-1所示,其中E代表與可教代理進(jìn)行交互的環(huán)境狀逡逑態(tài)的集合,P代表可教代理所感知的環(huán)境中認(rèn)知對(duì)象的集合,Rt代表可教代理向?qū)W習(xí)者學(xué)習(xí)并逡逑反過(guò)來(lái)提高學(xué)習(xí)者學(xué)習(xí)的推理機(jī)制,,A則代表可教代理可以采取的原始行動(dòng)的集合。研究者所逡逑提出的可教代理的定義和模型為后續(xù)可教代理的發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。逡逑|邐J逡逑I邋p邐LJ邋Rt邋L.邋A逡逑I事件追蹤器邐決策者邐執(zhí)彳了器逡逑:邐邐|逡逑圖2-1邋—般可教代理模型逡逑可教代理與教育需求直接相關(guān),其設(shè)計(jì)的最終目的是促進(jìn)學(xué)習(xí)者學(xué)習(xí),激發(fā)學(xué)習(xí)者興趣,逡逑設(shè)計(jì)需滿(mǎn)足教中學(xué)的三個(gè)基本教育要求。首先,可教代理有能力學(xué)習(xí)來(lái)自學(xué)習(xí)者的新知識(shí),以逡逑鼓勵(lì)學(xué)習(xí)者反思學(xué)習(xí)材料。其次,可教代理有能力應(yīng)用所學(xué)知識(shí),并為學(xué)習(xí)者提供反饋,幫助逡逑學(xué)習(xí)者驗(yàn)證和重新思考他們的教學(xué)。最后,可教代理有能力與學(xué)習(xí)者建立良好的關(guān)系,以鼓勵(lì)逡逑學(xué)習(xí)者更好地教學(xué),從而促進(jìn)學(xué)習(xí)者承擔(dān)起學(xué)習(xí)的責(zé)任。為滿(mǎn)足相應(yīng)的教育需求,研究者將其逡逑所應(yīng)具備的能力分為三種:可教性、實(shí)踐性、情感性
逑圖2-2強(qiáng)化學(xué)習(xí)模型逡逑強(qiáng)化學(xué)習(xí)的模型如圖2-2所示。主體通過(guò)與環(huán)境的交互進(jìn)行學(xué)習(xí),主體與環(huán)境的交互接口逡逑包括動(dòng)作回報(bào)和狀態(tài)。交互過(guò)程可以表述為如下的形式:每一步主體都根據(jù)策略選擇一個(gè)動(dòng)作逡逑執(zhí)行,然后感知下一步的狀態(tài)和回報(bào),通過(guò)經(jīng)驗(yàn)再修改自己的策略。主體的目的就是獲取最大逡逑化的累積回報(bào)。假設(shè)主體生存的環(huán)境被描述為某個(gè)可能的狀態(tài)集S,它可以執(zhí)行的動(dòng)作集合A,逡逑強(qiáng)化學(xué)習(xí)系統(tǒng)接受環(huán)境狀態(tài)的輸入s,根據(jù)內(nèi)部的推理機(jī)制,系統(tǒng)輸出相應(yīng)的動(dòng)作行為a,環(huán)逡逑境在系統(tǒng)動(dòng)作a下,變遷到新的狀態(tài)s1。系統(tǒng)接收環(huán)境新?tīng)顟B(tài)的輸入,同時(shí)得到環(huán)境對(duì)系統(tǒng)的逡逑立即回報(bào)r?。每次在某狀態(tài)St下執(zhí)行新動(dòng)作at,主體會(huì)收到一個(gè)立即的回報(bào)rt,然后環(huán)境變遷逡逑到新的狀態(tài)s't,如此產(chǎn)生了一系列的狀態(tài)Sl,動(dòng)作a,和立即回報(bào)n的集合。逡逑強(qiáng)化學(xué)習(xí)技術(shù)的基本原理是:如果系統(tǒng)某個(gè)動(dòng)作導(dǎo)致環(huán)境正的回報(bào),那么系統(tǒng)以后產(chǎn)生這逡逑17逡逑
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:G434;G633.8
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 李馨;;融入“適應(yīng)性”的教育游戲結(jié)構(gòu)設(shè)計(jì)模型及實(shí)驗(yàn)研究[J];遠(yuǎn)程教育雜志;2015年02期
2 郭雷;;計(jì)算機(jī)游戲中的智能角色研究[J];計(jì)算機(jī)與數(shù)字工程;2013年01期
3 馬穎峰;隋志華;;教育網(wǎng)絡(luò)游戲中NPC與學(xué)習(xí)者置入感的關(guān)系研究——由Games-to-Teach項(xiàng)目想到的[J];電化教育研究;2009年06期
4 陳仕品;張劍平;;智能教學(xué)系統(tǒng)的研究熱點(diǎn)與發(fā)展趨勢(shì)[J];電化教育研究;2007年10期
5 張汝波,顧國(guó)昌,劉照德,王醒策;強(qiáng)化學(xué)習(xí)理論、算法及應(yīng)用[J];控制理論與應(yīng)用;2000年05期
6 蔣國(guó)飛,吳滄浦;基于Q學(xué)習(xí)算法和BP神經(jīng)網(wǎng)絡(luò)的倒立擺控制[J];自動(dòng)化學(xué)報(bào);1998年05期
7 周?chē)?guó)韜;問(wèn)卷調(diào)查法芻議[J];心理發(fā)展與教育;1990年01期
相關(guān)碩士學(xué)位論文 前1條
1 褚建華;Q-learning強(qiáng)化學(xué)習(xí)算法改進(jìn)及其應(yīng)用研究[D];北京化工大學(xué);2009年
本文編號(hào):2697800
本文鏈接:http://www.lk138.cn/zhongdengjiaoyulunwen/2697800.html