中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當前位置:主頁 > 科技論文 > 軟件論文 >

智能語音會議紀要系統(tǒng)的設(shè)計與實現(xiàn)

發(fā)布時間:2024-06-10 19:49
  隨著人工智能技術(shù)的發(fā)展,越來越多的研究者和開發(fā)者使用機器學習和深度學習的算法開發(fā)出更加智能化的應用。人工智能領(lǐng)域包括機器人、語音識別、圖像識別、自然語言處理和專家系統(tǒng)。在日常生活中,語音識別和自然語言處理應用最為廣泛,但是這些算法在使用上比較單一,沒有將兩種或多種組合算法和技術(shù)應用到同一個場景中。技術(shù)是自然語言處理中應用最為廣泛的技術(shù)之一,該技術(shù)在不改變大篇幅文檔原意的情況下,自動的總結(jié)生成主要內(nèi)容。在這個海量的信息時代,這項用簡短的文本表達信息主要內(nèi)容的技術(shù),有利于緩解信息過載問題。機器情感分析是人們對問題、事件或話題的觀點、情緒和態(tài)度的計算研究。情感分析技術(shù)使得機器通過語音和文字來感知情感,在特定場景下,利用語音和文字的情感,發(fā)掘潛在的用戶信息和商業(yè)信息。本文基于深度學習中語音識別技術(shù)、文本摘要抽取技術(shù)和情感分析技術(shù)實現(xiàn)了智能語音會議紀要系統(tǒng)。首先,系統(tǒng)語音處理模塊由說話人分類模塊和語音識別模塊組成。語音處理模塊用于將會議語音轉(zhuǎn)化為會議劇本。說話人分類模塊利用說話人多音頻流時間軸策略對會議語音中的說話人進行分類和標記,主要研究和實現(xiàn)了語音端點檢測技術(shù)。語音識別模塊主要研究語音識別現(xiàn)...

【文章頁數(shù)】:89 頁

【學位級別】:碩士

【部分圖文】:

圖1.2CALO會議系統(tǒng)架構(gòu)圖

圖1.2CALO會議系統(tǒng)架構(gòu)圖

視為一個基本的信息單元,并假定文檔是固定的,并包含關(guān)于單個實體的意級別情感分類是對文檔中的單個句子進行分類。但是,不能假定每個句子都見的。某種意義上說,人們通常首先將一個句子分類為固執(zhí)和非固執(zhí),這成分類。然后,由此產(chǎn)生的固定句子被分類為表達積極或消極的情感。句子級類也可以表述為三....


圖2.1隱形馬爾可夫模型

圖2.1隱形馬爾可夫模型

為特征向量。生成參數(shù)數(shù)量的方法是根據(jù)具體語音進行調(diào)節(jié)的工作,但在一個簡單的情況下,它是頻譜的衍生物。圖2.1隱形馬爾可夫模型其次,它是模型的概念。模型描述了一些收集說出的單詞的共同屬性的數(shù)學對象。


圖6.1音頻分割運行結(jié)果圖

圖6.1音頻分割運行結(jié)果圖

說話人分類的過程,簡單說主要是將收集的音頻流文件通過語音端點檢測進行智能分割,保留說話人語音片段,并進行排序的過程。圖6.1音頻分割運行結(jié)果圖


圖6.2用戶所對應的時間和語音片段當單獨一個音頻流文件進行分割完全后,系統(tǒng)會將用戶名,會議名,分割后的音頻文件組和每段音頻的起始時間都存到數(shù)據(jù)庫中,當系統(tǒng)需要對音頻片段按照時間軸

圖6.2用戶所對應的時間和語音片段當單獨一個音頻流文件進行分割完全后,系統(tǒng)會將用戶名,會議名,分割后的音頻文件組和每段音頻的起始時間都存到數(shù)據(jù)庫中,當系統(tǒng)需要對音頻片段按照時間軸

靜音階段)。同時,將語音起始的時間點和終止的時間點分別標記并存儲到對應的數(shù)據(jù)庫中。圖6.2用戶所對應的時間和語音片段當單獨一個音頻流文件進行分割完全后,系統(tǒng)會將用戶名,會議名,分割后的音頻文件組和每段音頻的起始時間都存到數(shù)據(jù)庫中,當系統(tǒng)需要對音頻片段按照時間軸排序時要從數(shù)據(jù)庫中....



本文編號:3991819

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/ruanjiangongchenglunwen/3991819.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶31606***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com