基于標簽流行度的社會化標注模型研究
發(fā)布時間:2019-04-19 17:42
【摘要】:隨著Web2.0技術(shù)的不斷成熟,以Del.icio.us、Last.fm、Flickr等社會化標注系統(tǒng)為代表的大眾分類系統(tǒng)大量涌現(xiàn),區(qū)別于傳統(tǒng)分類體系,大眾分類體系具有結(jié)構(gòu)可見、分類靈活以及個性化明顯等特點,因此對于這一類分類體系形成規(guī)律的研究引起了學(xué)術(shù)界特別是信息科學(xué)、計算機科學(xué)等領(lǐng)域的廣泛關(guān)注。然而,關(guān)于大眾分類的形成機制及內(nèi)在成因一直是科學(xué)界廣泛探討但至今沒有形成共識的一個重要課題。大眾分類實質(zhì)上是不同社會個體知識由分散到匯聚的過程,即集體智慧的涌現(xiàn),鑒于此特點本文采用基于Agent的建模方法對社會化標注系統(tǒng)中標注動力學(xué)機制展開模型研究。 大眾分類的形成依托于用戶的社會化標注行為,對其形成機制的考察關(guān)鍵在于深入理解用戶的標注行為規(guī)律。已有的研究大多從直觀的用戶行為角度出發(fā),提出用戶標注行為的動力模型,并從資源共現(xiàn)標簽頻率分布特征以及系統(tǒng)中不同標簽規(guī)模增長兩方面加以驗證模型的合理性。本文通過考察資源標簽流的分布特點對用戶標注行為進行了分析,從用戶基于背景知識的標注行為和標簽的系統(tǒng)推薦兩方面提出了社會化標注動力學(xué)模型,并利用該模型對現(xiàn)實資源上的標簽頻率分布進行了多組數(shù)據(jù)擬合驗證,結(jié)果表明本文所提出的社會化標注模型可以比較有效的反映現(xiàn)實資源標簽流的特點,也進一步說明本文對于用戶標注行為分析的合理性。本文的研究內(nèi)容的創(chuàng)新性主要體現(xiàn)在以下三方面: (1)從實際數(shù)據(jù)分析入手,針對Del.icio.us社會化標注系統(tǒng)中的資源上標簽頻率分布進行分析,觀察到與以往研究中提到的冪律分布的不同的分布特征,即分段的冪律特征和近似“平臺”的結(jié)構(gòu)特征,并分析“平臺”上的標簽可能是由于社會化標注系統(tǒng)中的標簽推薦機制作用產(chǎn)生的; (2)以往的標注動力模型通常把用戶的標注行為理解為用戶針對某一資源的整體特征構(gòu)建標簽。在本文所提的模型中,把用戶標注行為進一步分解為:用戶針對資源的某一個維度的屬性構(gòu)建標簽;每個資源具有多維屬性,從而標識不同的資源特性。對基于Agent仿真結(jié)果的分析表明:不同社會化標注系統(tǒng)中對資源的認知程度不同,用戶具有知識背景差異的標注行為可能是導(dǎo)致資源上標簽標注頻率出現(xiàn)分段冪律分布的主要原因; (3)在模型的數(shù)據(jù)驗證工作中,首先,以往的研究多采用資源共現(xiàn)標簽頻率分布特征以及系統(tǒng)中不同標簽規(guī)模增長兩個方面作為考察指標對模型進行考察,而在本文的研究工作中,使用資源上的標簽頻率分布作為考察指標,并得到了較以往研究更為貼近現(xiàn)實情況的擬合結(jié)果;其次,本文采用來自不同的社會標注系統(tǒng),即Del.icio.us、Last.fin及Flickr中的實際用戶標注數(shù)據(jù)對模型進行檢驗,結(jié)果表明,模型具有很好的適應(yīng)性和可擴展性。 本文提出的模型對于深入理解用戶對資源的多樣化描述到最終達成共識這一集體智慧的涌現(xiàn)過程具有重要的理論意義,同時對于構(gòu)建合理的大眾分類體系,提高社會導(dǎo)航檢索效率、以及用戶接口的合理設(shè)計也具有很強的現(xiàn)實意義。
[Abstract]:......
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.09
本文編號:2461142
[Abstract]:......
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.09
【參考文獻】
相關(guān)期刊論文 前5條
1 陳祖琴;葛繼科;;Web2.0環(huán)境中基于社會標注的個性化推薦系統(tǒng)模型研究[J];電子商務(wù);2012年02期
2 韓敏;唐常杰;段磊;李川;鞏杰;;基于TF-IDF相似度的標簽聚類方法[J];計算機科學(xué)與探索;2010年03期
3 翟爽;宋文;;社會標簽進展研究概述[J];圖書情報工作;2010年20期
4 鐘青燕;蘇一丹;梁勝勇;;基于層次聚類和語義的標簽推薦研究[J];微計算機信息;2010年36期
5 陳禹;復(fù)雜性研究的新動向——基于主體的建模方法及其啟迪[J];系統(tǒng)辯證學(xué)學(xué)報;2003年01期
,本文編號:2461142
本文鏈接:http://lk138.cn/guanlilunwen/ydhl/2461142.html
最近更新
教材專著