基于機器學習的軟件缺陷預測方法研究
本文選題:機器學習 + 軟件缺陷預測 ; 參考:《中國礦業(yè)大學》2017年博士論文
【摘要】:隨著軟件規(guī)模的不斷擴大和復雜度增加,軟件維護的難度也日益增大。在軟件開發(fā)和維護過程中,不可避免地會產(chǎn)生各種各樣的缺陷。軟件缺陷是影響軟件質(zhì)量的首要因素,如果軟件產(chǎn)品中存在缺陷,在軟件運行過程中有可能會造成軟件失效,甚至導致軟件崩潰。軟件測試能夠發(fā)現(xiàn)軟件產(chǎn)品中存在的缺陷,但過量的測試又會影響軟件的開發(fā)進度,增加開發(fā)成本。軟件缺陷預測是軟件測試中的一項重要工作,主要是根據(jù)歷史數(shù)據(jù)來預測軟件中潛在的缺陷,從而合理分配測試資源,提高測試工作效率。近年來,軟件缺陷預測在軟件工程領(lǐng)域引起了研究者的廣泛關(guān)注,基于機器學習的軟件缺陷預測方法也成為研究的熱點。針對面向分類任務的有監(jiān)督缺陷預測中存在的關(guān)鍵問題,如項目內(nèi)缺陷預測中的特征選擇、分類不平衡影響和演化信息利用不充分,跨項目缺陷預測中的不相關(guān)或冗余特征,以及跨公司缺陷預測中的特征異構(gòu)等,本論文主要研究基于機器學習的軟件缺陷預測的新技術(shù)、新方法,旨在進一步提高缺陷預測性能。具體研究內(nèi)容如下:(1)針對軟件缺陷預測中不同特征與類別(有缺陷或無缺陷)的相關(guān)性差異,提出一種基于相似性度量的特征選擇方法。根據(jù)不同類別樣本間的相似性和特征差值來更新特征權(quán)重,按照特征權(quán)重降序排列得到一個特征排序列表,然后根據(jù)特征排序列表依次選擇所有特征子集,并分別評價它們的分類性能。與四種特征選擇方法進行比較,結(jié)果表明,提出的特征選擇方法的性能優(yōu)于或相當于對比方法。(2)為了探究分類不平衡對軟件缺陷預測模型性能的影響程度,提出一種分類不平衡影響分析方法。通過設(shè)計一種新數(shù)據(jù)集構(gòu)造算法,將原不平衡數(shù)據(jù)集轉(zhuǎn)化為一組不平衡率依次遞增的新數(shù)據(jù)集,并選取典型的預測模型對新數(shù)據(jù)集進行預測,從而評價各個預測模型在分類不平衡時的性能穩(wěn)定程度,同時還評價了代價敏感模型和集成模型在分類不平衡時的性能穩(wěn)定程度。(3)針對面向?qū)ο蟪绦虻难莼畔?從歷史包的缺陷率和類的變更程度角度提出了兩個演化度量元,并采用特征選擇方法比較代碼度量元和演化度量元與類別的相關(guān)性。結(jié)果表明,與代碼度量元相比,提出的演化度量元與類別的相關(guān)性相對較高,且加入提出的演化度量元能夠有效提高缺陷預測性能。(4)針對跨項目數(shù)據(jù)集中的不相關(guān)或冗余特征,提出一種基于特征選擇的跨項目缺陷預測方法。采用特征子集選擇和特征排序兩種方法,驗證特征選擇對于跨項目缺陷預測的有效性。結(jié)果表明,與項目內(nèi)缺陷預測類似,特征選擇也能夠在一定程度上提高跨項目缺陷預測的性能。(5)針對跨公司數(shù)據(jù)集間的特征異構(gòu)問題,提出一種基于特征遷移的跨公司缺陷預測方法。首先,根據(jù)不同特征分布曲線的“距離”設(shè)計一種特征匹配算法,將異構(gòu)特征轉(zhuǎn)化為匹配特征。然后,采用遷移學習方法將源項目中的特征信息遷移到目標項目中相匹配的特征上,實現(xiàn)跨公司缺陷預測。最后,設(shè)計大量實驗來驗證該方法的有效性,同時討論了該方法在不同影響因素下的性能。綜上所述,本論文旨在利用機器學習中的理論和方法解決軟件缺陷預測中的實際問題,不僅豐富和拓寬了機器學習理論的應用領(lǐng)域,還提高了機器學習方法的應用價值,更為軟件缺陷預測提供了新的研究思路,對于提高軟件質(zhì)量和軟件可靠性具有重要意義。
[Abstract]:In the process of software engineering , a new data set based on similarity measure is proposed . ( 4 ) Aiming at unrelated or redundant features in cross project data set , a cross project defect prediction method based on feature selection is proposed . A feature matching algorithm is designed based on feature subset selection and feature ranking .
【學位授予單位】:中國礦業(yè)大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:TP181;TP311.5
【相似文獻】
相關(guān)期刊論文 前10條
1 ;常用軟件缺陷威脅因特網(wǎng)[J];佛山陶瓷;2001年02期
2 ;軟件缺陷詞典正在制定[J];軟件世界;2007年06期
3 王德勝;宮云戰(zhàn);;論軟件缺陷[J];計算機應用研究;2008年12期
4 聶劍平;韓柯;陳光;曹旭;;軟件缺陷增長過程的混沌分析[J];計算機工程與應用;2008年11期
5 劉海;郝克剛;;軟件缺陷數(shù)據(jù)的分析方法及其實現(xiàn)[J];計算機科學;2008年08期
6 熊斐;李建忠;徐中望;;軟件缺陷管理與防范[J];科技創(chuàng)新導報;2009年04期
7 石劍飛;楊欣;秦瑋;閆懷志;;一種軟件缺陷預測改進模型的研究[J];北京理工大學學報;2010年09期
8 繆林松;;基于代價敏感神經(jīng)網(wǎng)絡算法的軟件缺陷預測[J];電子科技;2012年06期
9 朱小燕;曲俊燕;;淺析軟件缺陷的問題[J];無線互聯(lián)科技;2013年04期
10 田華;蒲天銀;;基于遷移學習的軟件缺陷預測方法研究[J];西南師范大學學報(自然科學版);2014年03期
相關(guān)會議論文 前8條
1 趙修湘;石勇;劉瑩;張玲玲;;文本分類在軟件缺陷管理中的應用[A];第四屆(2009)中國管理學年會——管理科學與工程分會場論文集[C];2009年
2 李立清;;軟件缺陷數(shù)據(jù)的分析和預測[A];第三屆中國測試學術(shù)會議論文集[C];2004年
3 李立清;;用軟件缺陷數(shù)據(jù)進行缺陷預測[A];中國工程物理研究院科技年報(2005)[C];2005年
4 趙亮;侯金寶;;文件和包層次的軟件缺陷預測研究[A];第十四屆全國容錯計算學術(shù)會議(CFTC'2011)論文集[C];2011年
5 于秀山;王廣儉;;軟件缺陷管理[A];中國電子學會可靠性分會第十三屆學術(shù)年會論文選[C];2006年
6 寇綱;彭怡;石勇;;基于數(shù)據(jù)挖掘的軟件缺陷度量評估管理及研究現(xiàn)狀綜述[A];第三屆(2008)中國管理學年會——信息管理分會場論文集[C];2008年
7 高通;焦彥平;龔波;;基于曲線擬合的軟件缺陷排除成本預測[A];2010年全國通信安全學術(shù)會議論文集[C];2010年
8 涂亞明;毛軍鵬;余靜;尹磊;;系統(tǒng)測試階段的軟件缺陷預測模型分析[A];第六屆中國測試學術(shù)會議論文集[C];2010年
相關(guān)重要報紙文章 前7條
1 謝敏、戴金龍;追蹤每一個軟件缺陷[N];計算機世界;2005年
2 學健;可怕的不是缺陷本身[N];計算機世界;2001年
3 ;Firefox、IE中發(fā)現(xiàn)缺陷[N];計算機世界;2005年
4 道瓊斯;小電腦 大雄心[N];人民郵電;2007年
5 特約撰稿 朱顏鎮(zhèn);萬維易化項目管理力助電信運營商[N];通信信息報;2004年
6 ;Microsoft計劃推出Windows Server SP1[N];計算機世界;2004年
7 記者 王俊鳴;美專家認為因特網(wǎng)中樞有漏洞[N];科技日報;2001年
相關(guān)博士學位論文 前9條
1 于巧;基于機器學習的軟件缺陷預測方法研究[D];中國礦業(yè)大學;2017年
2 Gabriel Kofi Armah;[D];電子科技大學;2015年
3 王偉光;動態(tài)軟件缺陷測試關(guān)鍵技術(shù)研究[D];南京大學;2016年
4 陳琳;基于機器學習的軟件缺陷預測研究[D];重慶大學;2016年
5 陳媛;基于數(shù)據(jù)挖掘的軟件缺陷預測技術(shù)研究[D];中國科學院研究生院(長春光學精密機械與物理研究所);2012年
6 馬櫻;基于機器學習的軟件缺陷預測技術(shù)研究[D];電子科技大學;2012年
7 單純;軟件缺陷分布預測技術(shù)及應用研究[D];北京理工大學;2015年
8 張凱;軟件缺陷混沌分形描述與軟件質(zhì)量進化度量的研究[D];武漢理工大學;2005年
9 楊曉杏;基于度量元的軟件缺陷預測技術(shù)[D];中國科學技術(shù)大學;2014年
相關(guān)碩士學位論文 前10條
1 趙長凱;軟件缺陷管理與預測系統(tǒng)的設(shè)計[D];復旦大學;2013年
2 張亮;基于改進BP算法的軟件缺陷預測模型研究[D];北京理工大學;2015年
3 王男帥;基于遺傳優(yōu)化支持向量機的軟件缺陷預測模型研究[D];北京理工大學;2015年
4 陳艷;軟件缺陷管理技術(shù)研究與實現(xiàn)[D];電子科技大學;2014年
5 李碧雯;基于遷移學習的跨項目軟件缺陷預測[D];上海交通大學;2015年
6 梁天超;一種基于人工免疫樸素貝葉斯方法的軟件缺陷預測模型[D];南京郵電大學;2015年
7 陳家強;軟件缺陷預測中數(shù)據(jù)預處理技術(shù)研究[D];南京大學;2014年
8 江曉蘇;魚群優(yōu)化的多核支持向量機在軟件缺陷預測中的應用[D];重慶師范大學;2016年
9 權(quán)衡;基于Web的軟件缺陷管理系統(tǒng)的設(shè)計與實現(xiàn)[D];華中科技大學;2014年
10 劉慶山;基于復雜網(wǎng)絡的動態(tài)軟件缺陷預測算法研究[D];燕山大學;2016年
,本文編號:1961309
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/1961309.html