中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

單源SimRank計(jì)算優(yōu)化及其在協(xié)同過濾中的應(yīng)用

發(fā)布時(shí)間:2024-07-08 18:30
  圖作為一種表達(dá)對(duì)象與對(duì)象之間抽象關(guān)系的非線性數(shù)據(jù)結(jié)構(gòu),具有更加一般化的表達(dá)能力,在我們現(xiàn)實(shí)生活中扮演者重要的角色。近年來,隨著互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的高速發(fā)展,數(shù)據(jù)增長(zhǎng)的規(guī)模正在以前所未有的速度增加,“大數(shù)據(jù)”給各行各業(yè)帶來了很大的機(jī)遇和挑戰(zhàn),同時(shí)圖數(shù)據(jù)的規(guī)模也隨著個(gè)性化推薦、信息檢索、社交網(wǎng)絡(luò)分析等應(yīng)用的蓬勃發(fā)展變得越來越大。隨著圖數(shù)據(jù)規(guī)模的增大,人們發(fā)現(xiàn)龐大的圖數(shù)據(jù)中蘊(yùn)含著巨大的商業(yè)價(jià)值,基于圖結(jié)構(gòu)的各種互聯(lián)網(wǎng)應(yīng)用在近些年來層出不窮,在這些應(yīng)用中,最典型和最基本的一類任務(wù)就是計(jì)算對(duì)象和對(duì)象之間的相似度。SimRank是一種非常流行的基于圖拓?fù)浣Y(jié)構(gòu)信息來衡量任意兩個(gè)對(duì)象之間相似程度的模型,其核心的思想為:一個(gè)對(duì)象應(yīng)該與自身最相似,如果兩個(gè)對(duì)象都被相似的對(duì)象所引用,那么這兩個(gè)對(duì)象也相似。然而,由于SimRank定義的遞歸依賴性,導(dǎo)致了SimRank計(jì)算的時(shí)空復(fù)雜度很大,圖數(shù)據(jù)規(guī)模的增大在另一方面也使得問題更加突出。在本文中,我們主要針對(duì)單源節(jié)點(diǎn)SimRank的計(jì)算,即給定一個(gè)查詢頂點(diǎn),返回該節(jié)點(diǎn)與所有其他節(jié)點(diǎn)間的相似度,提出并實(shí)現(xiàn)了一種稱之為ProbeWalk的高度并行的算法。我...

【文章頁(yè)數(shù)】:77 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-1:?SimRank算法總結(jié)??

圖2-1:?SimRank算法總結(jié)??

第二章相關(guān)工作??.1?SimRank計(jì)算方法現(xiàn)狀??SimRank作為衡量對(duì)象間相似度的一種指標(biāo)首次在2002年由Jell和Widom??授在文獻(xiàn)[8]提出來以后,隨著其在網(wǎng)頁(yè)排名、孤立點(diǎn)檢測(cè)、協(xié)同過濾、近??查詢處理、網(wǎng)絡(luò)圖聚類等領(lǐng)域的成功應(yīng)用,SimRank的計(jì)算速度便成為....


圖3-1:?—個(gè)路徑復(fù)用的例子??

圖3-1:?—個(gè)路徑復(fù)用的例子??

較大的情況下的一個(gè)好方法。??圖3-1:?—個(gè)路徑復(fù)用的例子??圖3-1是一個(gè)“路徑復(fù)用”的例子,頂點(diǎn)a為一個(gè)待查詢頂點(diǎn),路徑??<?>為算法隨機(jī)的一條相遇長(zhǎng)度為1的隨機(jī)路徑,路徑<?a,Z?,e,c,/,/z?>??為相遇長(zhǎng)度為2的隨機(jī)路徑,路徑<?>為相遇長(zhǎng)度為3的隨機(jī)路??....


圖3-2:從頂點(diǎn)a和j出發(fā)的相遇長(zhǎng)度為3的匹配路徑??

圖3-2:從頂點(diǎn)a和j出發(fā)的相遇長(zhǎng)度為3的匹配路徑??

高查詢算法的可用性便成為了一個(gè)問題。“路徑復(fù)用”策略便是解決查詢集合??較大的情況下的一個(gè)好方法。??圖3-1:?—個(gè)路徑復(fù)用的例子??圖3-1是一個(gè)“路徑復(fù)用”的例子,頂點(diǎn)a為一個(gè)待查詢頂點(diǎn),路徑??<?>為算法隨機(jī)的一條相遇長(zhǎng)度為1的隨機(jī)路徑,路徑<?a,Z?,e,c,/,/....


圖3-3:隨機(jī)圖的平均誤差隨/的變化?

圖3-3:隨機(jī)圖的平均誤差隨/的變化?

?33??以誤差也就越大。同樣的,在圖3-3中有著跟人造圖一樣的規(guī)律,總體的平均??誤差是隨著/指數(shù)減小的,有所不同的是,這兩個(gè)真實(shí)圖的折線比較接近,這??是因?yàn)檫@兩個(gè)數(shù)據(jù)集頂點(diǎn)數(shù)和邊數(shù)都比較接近從而在相同條件下誤差結(jié)果比較??接近。??10“??????fr?■?Random?....



本文編號(hào):4003694

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/4003694.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f742c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com