智能語音會議紀要系統(tǒng)的設計與實現(xiàn)

發(fā)布時間：2024-06-10 19:49

　　隨著人工智能技術(shù)的發(fā)展,越來越多的研究者和開發(fā)者使用機器學習和深度學習的算法開發(fā)出更加智能化的應用。人工智能領(lǐng)域包括機器人、語音識別、圖像識別、自然語言處理和專家系統(tǒng)。在日常生活中,語音識別和自然語言處理應用最為廣泛,但是這些算法在使用上比較單一,沒有將兩種或多種組合算法和技術(shù)應用到同一個場景中。技術(shù)是自然語言處理中應用最為廣泛的技術(shù)之一,該技術(shù)在不改變大篇幅文檔原意的情況下,自動的總結(jié)生成主要內(nèi)容。在這個海量的信息時代,這項用簡短的文本表達信息主要內(nèi)容的技術(shù),有利于緩解信息過載問題。機器情感分析是人們對問題、事件或話題的觀點、情緒和態(tài)度的計算研究。情感分析技術(shù)使得機器通過語音和文字來感知情感,在特定場景下,利用語音和文字的情感,發(fā)掘潛在的用戶信息和商業(yè)信息。本文基于深度學習中語音識別技術(shù)、文本摘要抽取技術(shù)和情感分析技術(shù)實現(xiàn)了智能語音會議紀要系統(tǒng)。首先,系統(tǒng)語音處理模塊由說話人分類模塊和語音識別模塊組成。語音處理模塊用于將會議語音轉(zhuǎn)化為會議劇本。說話人分類模塊利用說話人多音頻流時間軸策略對會議語音中的說話人進行分類和標記,主要研究和實現(xiàn)了語音端點檢測技術(shù)。語音識別模塊主要研究語音識別現(xiàn)...

【文章頁數(shù)】：89 頁

【學位級別】：碩士

【部分圖文】：

圖1.2CALO會議系統(tǒng)架構(gòu)圖

視為一個基本的信息單元，并假定文檔是固定的，并包含關(guān)于單個實體的意級別情感分類是對文檔中的單個句子進行分類。但是，不能假定每個句子都見的。某種意義上說，人們通常首先將一個句子分類為固執(zhí)和非固執(zhí)，這成分類。然后，由此產(chǎn)生的固定句子被分類為表達積極或消極的情感。句子級類也可以表述為三....

圖2.1隱形馬爾可夫模型

為特征向量。生成參數(shù)數(shù)量的方法是根據(jù)具體語音進行調(diào)節(jié)的工作，但在一個簡單的情況下，它是頻譜的衍生物。圖2.1隱形馬爾可夫模型其次，它是模型的概念。模型描述了一些收集說出的單詞的共同屬性的數(shù)學對象。

圖6.1音頻分割運行結(jié)果圖

說話人分類的過程，簡單說主要是將收集的音頻流文件通過語音端點檢測進行智能分割，保留說話人語音片段，并進行排序的過程。圖6.1音頻分割運行結(jié)果圖

圖6.2用戶所對應的時間和語音片段當單獨一個音頻流文件進行分割完全后，系統(tǒng)會將用戶名，會議名，分割后的音頻文件組和每段音頻的起始時間都存到數(shù)據(jù)庫中，當系統(tǒng)需要對音頻片段按照時間軸

靜音階段）。同時，將語音起始的時間點和終止的時間點分別標記并存儲到對應的數(shù)據(jù)庫中。圖6.2用戶所對應的時間和語音片段當單獨一個音頻流文件進行分割完全后，系統(tǒng)會將用戶名，會議名，分割后的音頻文件組和每段音頻的起始時間都存到數(shù)據(jù)庫中，當系統(tǒng)需要對音頻片段按照時間軸排序時要從數(shù)據(jù)庫中....

本文編號：3991819

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://lk138.cn/kejilunwen/ruanjiangongchenglunwen/3991819.html

上一篇：基于BP神經(jīng)網(wǎng)絡的教學認知診斷方法及應用
下一篇：基于隨機游走的連接隱私保護方案研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

智能語音會議紀要系統(tǒng)的設計與實現(xiàn)