跨域多模態(tài)數(shù)據(jù)分析關鍵技術研究
發(fā)布時間:2024-06-29 03:23
跨域多模態(tài)數(shù)據(jù)集在許多領域發(fā)揮重要作用,本文主要研究征信背景下的多字段分類數(shù)據(jù)和多元時間序列數(shù)據(jù)之間的數(shù)據(jù)融合問題。現(xiàn)有跨域多模態(tài)數(shù)據(jù)融合的研究主要集中在文本與圖像間融合以及視頻與音頻間的融合,鮮有人研究多字段分類數(shù)據(jù)與多元時間序列數(shù)據(jù)之間的融合,且這兩種數(shù)據(jù)間存在較大的結(jié)構(gòu)和語義上的差異,如何設計模型使其既能夠最大可能地挖掘每種模態(tài)數(shù)據(jù)所蘊含的信息,又能彌補兩種數(shù)據(jù)結(jié)構(gòu)和語義上的差異使其很好地融合,成為本文的一大難點。本文主要包括如下三部分研究內(nèi)容。首先,本文提出分類多字段數(shù)據(jù)的特征表示模型CFM模型。該模型通過在FM模型的基礎上引入Cat2vec模型的交叉層+K-Max池化層(Interaction Layer+K-Max Pooling Layer)結(jié)構(gòu),解決了傳統(tǒng)模型無法挖掘特征間存在的高階潛在模式且精度不足等問題。其次,本文提出了多元時間序列數(shù)據(jù)特征表示模型IA-RNN模型。該模型通過在基于基本LSTM單元的模型上引入Input-Attention,使得模型可以捕捉不同維度的輸入數(shù)據(jù)在每個時間點擁有的不同程度的作用,從而可以更好地挖掘多元時間序列數(shù)據(jù)中蘊含的潛在信息。最后,本...
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3997092
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
圖2-3新模型準確率及損失曲線
圖2-3新模型準確率及損失曲線模型在測試集的ROC曲線結(jié)果如下圖2-4所示,通過計算可知模型的AUC值達到0.8729。CFM模型與FM模型和Cat2vec模型的對比實驗結(jié)果如下圖2-5所示,可知在AUC評價指標下,F(xiàn)M模型AUC值為0.....
圖2-4新模型ROC曲線
圖2-3新模型準確率及損失曲線模型在測試集的ROC曲線結(jié)果如下圖2-4所示,通過計算可知模型的AUC值達到0.8729。CFM模型與FM模型和Cat2vec模型的對比實驗結(jié)果如下圖2-5所示,可知在AUC評價指標下,F(xiàn)M模型AUC值為0.....
圖2-5實驗效果對比圖
圖2-3新模型準確率及損失曲線模型在測試集的ROC曲線結(jié)果如下圖2-4所示,通過計算可知模型的AUC值達到0.8729。CFM模型與FM模型和Cat2vec模型的對比實驗結(jié)果如下圖2-5所示,可知在AUC評價指標下,F(xiàn)M模型AUC值為0.....
圖2-6Dropout對比實驗
提升了2個百分點,可見新模型提升效果顯著。我們還測試了不同超參數(shù)設置對模型效果的影響。首先,我們測試了不同dropout值對模型效果的影響,由圖2-6可知,模型效果隨dropout值先提升后降低,當dropout值小于0.3時模型過于復雜,存在過擬合現(xiàn)象,....
本文編號:3997092
本文鏈接:http://www.lk138.cn/kejilunwen/ruanjiangongchenglunwen/3997092.html
最近更新
教材專著