多分類代價敏感支持向量機(jī)的拓展與研究
發(fā)布時間:2020-12-14 07:23
隨著數(shù)據(jù)時代的發(fā)展,代價敏感的多分類問題受到越來越多的重視,F(xiàn)有的基于支持向量機(jī)模型的多分類算法可以大致分為兩類,其一是組合多個二分類器,但是這類方法將每一類樣本和其他類的樣本獨(dú)立開來,忽略了不同類別樣本之間的聯(lián)系,在一些情境中效果不佳。其二即多分類支持向量機(jī),將多個分類面的參數(shù)求解合并到一個最優(yōu)化問題中,一次性實(shí)現(xiàn)多分類。相較與前者,其增加了所需求解的參數(shù)個數(shù),但能較好掌握數(shù)據(jù)類別分布。多分類代價敏感支持向量機(jī)即為旨在解決代價敏感問題的第二類算法的代表。本文著重在多分類代價敏感支持向量機(jī)的基礎(chǔ)上,將原始模型正則項進(jìn)行拓展,通過引入?yún)?shù)將目標(biāo)函數(shù)轉(zhuǎn)化為二次規(guī)劃問題,并研究正則項對模型的影響。本文利用高效塊坐標(biāo)下降法對模型參數(shù)進(jìn)行求解,并針對大規(guī)模樣本,詳細(xì)給出模型高效計算的方法。通過實(shí)例將模型與現(xiàn)有較為成熟的多分類方法進(jìn)行對比,展現(xiàn)新的模型在一般分類和代價敏感學(xué)習(xí)上的優(yōu)勢。同時,本文對已有Rademacher結(jié)構(gòu)引理進(jìn)行拓展,利用該引理計算多分類模型的泛化邊界,將其與Gaussian泛化邊界進(jìn)行對比。最后,本文給出拓展后的多分類代價敏感支持向量機(jī)的泛化邊界,研究泛化邊界與分類問題的類別...
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
Gu(c,q,k)和Ra(c,q,k)在不同k,c下關(guān)于q的變化趨勢對比
圖像集包含 40 個不同的實(shí)驗(yàn)對象在同一背景,不同的時間、光線、面部表情 (睜開/閉上眼睛,微笑/不微笑) 和面部表情細(xì)節(jié) (眼鏡/不戴眼鏡) 下的 10 張正面照片(人臉圖像的樣本總數(shù)為 400 張),部分圖像如圖4-1 所示。為了在不同類別的代價敏感學(xué)習(xí)中對比 p-mcSVM 模型和 mcSVM 模型的表現(xiàn),需要依據(jù)每對人臉圖像集進(jìn)行二次處理,處理步驟如下:[1.] 確定 N(N=2,3,4,5)[2.] 隨機(jī)固定 15 人作為入侵者, 計為 I 類。[3.] 剩下的 25 人作為集體內(nèi)部人員, 計為 G 類。將集體內(nèi)部人員 (G) 隨機(jī)分成 N 小類。[4.] 設(shè)定誤分類代價比為 CIG: CGI: CGG。-27-
§4.2 p-mcSVM 模型的參數(shù)模擬(3) p-mcSVM 模型的 err 和總損失 cost 大于 mcSVM,即 p-mcSVM 模型對集體內(nèi)部人員的分類不敏感,這部分的誤分類代價較小。因此, p-mcSVM 能減少代價較大的誤分類事件,但同時也會增加代價較小的誤分類事件發(fā)生的次數(shù)。§4.2 p-mcSVM 模型的參數(shù)模擬本節(jié)研究無代價敏感下采用高斯核時,模型參數(shù)與高斯核參數(shù) σ 之間的關(guān)系。模擬實(shí)驗(yàn)采用 k = 2,5,10 的三組數(shù)據(jù),分別研究模型在不同參數(shù)組合下根據(jù)三組數(shù)據(jù)擬合出的 β 變化路徑,固定模型參數(shù) λ = 0.1。
本文編號:2916061
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
Gu(c,q,k)和Ra(c,q,k)在不同k,c下關(guān)于q的變化趨勢對比
圖像集包含 40 個不同的實(shí)驗(yàn)對象在同一背景,不同的時間、光線、面部表情 (睜開/閉上眼睛,微笑/不微笑) 和面部表情細(xì)節(jié) (眼鏡/不戴眼鏡) 下的 10 張正面照片(人臉圖像的樣本總數(shù)為 400 張),部分圖像如圖4-1 所示。為了在不同類別的代價敏感學(xué)習(xí)中對比 p-mcSVM 模型和 mcSVM 模型的表現(xiàn),需要依據(jù)每對人臉圖像集進(jìn)行二次處理,處理步驟如下:[1.] 確定 N(N=2,3,4,5)[2.] 隨機(jī)固定 15 人作為入侵者, 計為 I 類。[3.] 剩下的 25 人作為集體內(nèi)部人員, 計為 G 類。將集體內(nèi)部人員 (G) 隨機(jī)分成 N 小類。[4.] 設(shè)定誤分類代價比為 CIG: CGI: CGG。-27-
§4.2 p-mcSVM 模型的參數(shù)模擬(3) p-mcSVM 模型的 err 和總損失 cost 大于 mcSVM,即 p-mcSVM 模型對集體內(nèi)部人員的分類不敏感,這部分的誤分類代價較小。因此, p-mcSVM 能減少代價較大的誤分類事件,但同時也會增加代價較小的誤分類事件發(fā)生的次數(shù)。§4.2 p-mcSVM 模型的參數(shù)模擬本節(jié)研究無代價敏感下采用高斯核時,模型參數(shù)與高斯核參數(shù) σ 之間的關(guān)系。模擬實(shí)驗(yàn)采用 k = 2,5,10 的三組數(shù)據(jù),分別研究模型在不同參數(shù)組合下根據(jù)三組數(shù)據(jù)擬合出的 β 變化路徑,固定模型參數(shù) λ = 0.1。
本文編號:2916061
本文鏈接:http://www.lk138.cn/guanlilunwen/tongjijuecelunwen/2916061.html
最近更新
教材專著