日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 醫(yī)療電子 > 醫(yī)療電子
[導讀]1引言說話人識別是根據從說話人所發(fā)語音中提取信息判斷說話人身份的過程。語音信號中包含了話音特征和說話人個性特征,說話人識別的關鍵問題之一是提取反映說話人個性的語音特征參數。在說話人識別系統中常用的語音特

1引言

說話人識別是根據從說話人所發(fā)語音中提取信息判斷說話人身份的過程。語音信號中包含了話音特征和說話人個性特征,說話人識別的關鍵問題之一是提取反映說話人個性的語音特征參數。在說話人識別系統中常用的語音特征參數主要有,LPC 倒譜系數(LPCC) 、Mel 頻率倒譜系數(MFCC)、線譜對(LSP)等 。在純凈語音環(huán)境中,系統已經達到很好的識別性能,但是在實際應用的環(huán)境中,由于背景噪聲的存在,系統往往達不到令人滿意的效果。

主分量分析PCA (primary component analyze)是統計學中一種根據數據的統計分布特性,提取數據主要成分的數據處理方法. 它是最小均方誤差下的最優(yōu)正交變換,對消除模式間的相關性、突出模式間差異性有最佳的效果,所以常被用于數據的壓縮和模式識別的特征提取 . 由于它需要對原始數據的方差矩陣進行估值并求取其特征值和特征向量, 計算量異常巨大, 而基于神經網絡的主分量分析算法不必進行矩陣求逆運算,并且神經網絡具有并行運算能力, 這將降低PCA 計算量, 提高PCA 的實用性 。對語音信號的原始特征作主分量分析后往往能得到更好的特征參數 。本文選用LPC倒譜系數作為表征聲道的特征參數,采用相繼的幾幀組成的特征參數矢量作為樣本,對其進行主分量分析,這樣去除了特征中的冗余信息,壓縮特征參數的維數,得到新的PCA特征參數,然后把PCA特征參數作為GMM模型的輸入向量,進行說話人識別的訓練和識別。

本文第二節(jié)介紹主分量分析神經網絡的原理和算法,第三節(jié)介紹高斯混和模型和LPCC特征參數,第四節(jié)給出相應的說話人識別系統實驗和結果,最后是簡要的討論與展望。

2主分量神經網絡(PCANN)

主分量神經網絡是基于Hebb 學習規(guī)則的線性無監(jiān)督學習神經網絡, 它可以通過對權矩陣W 的學習, 使W接近于原始數據X的關聯矩陣C中特征值所對應的特征向量, 而不必進行矩陣求逆運算,提高了運算速度。
2.1    基于Hebb學習的最大特征濾波器      

2.2    基于Hebb 學習的主分量分析網絡

圖3:提取前m個主分量的神經網絡解析圖

3識別系統特征參數以及模型

3.1 語音的主分量特征參數(PCA特征)
本文選用線性預測倒譜系數(LPCC)作為語音的原始特征參數然后對其進行主分量分析。LPCC系數是一種非常重要的特征參數。它的主要優(yōu)點是比較徹底地去掉了語音產生過程中的激勵信息,主要反映聲道相應,而且往往只要十幾個倒譜系數就能較好地描述語音信號的共振峰特性,因此在識別中取得了較好的效果。在實際計算中,LPCC參數不是由信號直接得到的,而是由LPC系數得到的。關系式如下:


          (8)
這里 實際上是直流分量,反映頻譜能量,其值的大小不影響譜形,在識別中通常不用,也不去計算。當LPCC系數個數不大于LPC系數個數時用第二式,當LPCC系數個數大于LPC系數個數時,用第三式進行計算。

4實驗及結果分析
本文實現了一個在噪聲環(huán)境下與文本無關的說話人自動識別系統。使用的是一個含20人的語音數據庫,包括10名男性和10名女性,每人語音長度約90秒。采樣率為12kHz,采用16bit量化。

首先對數據進行預處理,包括端點檢測、預加重(H(z)=1-0.95 )和加窗(Hamming窗,幀長20ms,幀移10ms)。原始特征選為12階的LPCC倒譜參數,主分量特征個數選12階。高斯模型混合數M=16。訓練音長為40s,測試音為3s。實驗結果如表(1):

表1  實驗結果(%)

圖(4)是根據表(1)中的數據畫出的曲線。

從表(1)可以看出,與傳統的GMM方法相比,PCANN_GMM方法明顯增強系統抗噪聲能力,改進了識別效果。并且在PCANN_GMM中,幀數不同對識別也有較小的影響,當幀數大于5幀時,系統的識別性能不再提高。

5總結

本文運用PCANN/GMM方法進行說話人識別,將多幀特征參數合并為一幀,利用了幀間相關性,對其進行主分量分析,減少了冗余度,提高了系統的魯棒性。另外,當前的說話人識別研究還主要集中在聲學特征層次進行,基于人們說話中含有的高級特征所進行的研究雖然很多,下一步的工作將結合聲學特征和高級特征,研究它們之間的關系,從而進一步提高說話人識別系統的性能。
 
參考文獻

[1] 趙力. 語音信號處理 北京:機械工業(yè)出版社,2003
[2] E.Oja. “A Simplified Neural Model as a Principal Components Analyzer”,Journal of Mathematic Biology,VOL.19,pp.267-273,1982
[3] Sanger T D. “Optimal Unsupervised Learing In a Singer Layer Linear Feedforward Neural Network”,Neural Networks, pp459-473, 1989
[4] 何振亞 顧明亮 語音信號的主分量特征 應用科學學報, VOL 17,NO.4,1999
[5]  Simon Haykin. 神經網絡原理. 北京:機械工業(yè)出版社, 2004
[6] Chanchal Chatterjee. and Vwani P.Roychowdhury. “On Relative Convergence Properties of Principal Component Analysis Algorithms”,IEEE Transactions On Neural Networks, VOL.9,NO.2,March 1998
[7] Oh-Wook Kwon. and Kwokleung Chan. “Speech Feather Analysis Using Variational Bayesian PCA”,IEEE Signal Processing Letters,VOL.10,NO.5,May 2003

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

舍弗勒以"專注驅動技術的科技公司"為主題亮相IAA MOBILITY 2025(B3館B40展臺) 合并緯湃科技后首次亮相IAA MOBILITY,展示拓展后的汽車產品組合 憑借在軟件、...

關鍵字: 電氣 軟件 驅動技術 BSP

香港2025年 9月12日 /美通社/ -- 全球領先的互聯網社區(qū)創(chuàng)建者 - 網龍網絡控股有限公司 ("網龍"或"本公司",香港交易所股票代碼:777)欣然宣布,其子公司My...

關鍵字: AI 遠程控制 控制技術 BSP

深圳2025年9月11日 /美通社/ -- 2025 年 9 月 10 日,第 26 屆中國國際光電博覽會(簡稱 "CIOE 中國光博會")在深圳盛大開幕。本屆展會吸引力再創(chuàng)新高,全球超3800家優(yōu)質...

關鍵字: 自動化 光電 CIO BSP

天津2025年9月11日 /美通社/ -- 國際能源署(IEA)數據顯示,2024 年全球數據中心電力消耗達 415 太瓦時,占全球總用電量的 1.5%,預計到 2030 年,這一數字將飆升至 945 太瓦時,近乎翻番,...

關鍵字: 模型 AI 數據中心 BSP

北京2025年9月11日 /美通社/ -- 國際9月11日上午,2025年中國國際服務貿易交易會(以下簡稱"服貿會")—體育賽事經濟高質量發(fā)展大會現場,北京經濟技術開發(fā)區(qū)工委委員、管委會副主...

關鍵字: 5G BSP GROUP MOTOR

柏林2025年9月9日 /美通社/ -- 2025年9月5日,納斯達克上市公司優(yōu)克聯集團(NASDAQ: UCL)旗下全球互聯品牌GlocalMe,正式亮相柏林國際消費電子展(IFA 2025),重磅推出融合企...

關鍵字: LOCAL LM BSP 移動網絡

深圳2025年9月9日 /美通社/ -- PART 01活動背景 當技術的鋒芒刺穿行業(yè)壁壘,萬物互聯的生態(tài)正重塑產業(yè)疆域。2025年,物聯網產業(yè)邁入?"破界創(chuàng)造"與"共生進化"?的裂變時代——AI大模型消融感知邊界,...

關鍵字: BSP 模型 微信 AIOT

"出海無界 商機無限"助力企業(yè)構建全球競爭力 深圳2025年9月9日 /美通社/ -- 2025年8月28日, 由領先商業(yè)管理媒體世界經理人攜手環(huán)球資源聯合主辦、深圳?前海出海e站通協辦的...

關鍵字: 解碼 供應鏈 AI BSP

柏林2025年9月9日 /美通社/ -- 柏林當地時間9月6日,在2025德國柏林國際電子消費品展覽會(International Funkausstellung...

關鍵字: 掃地機器人 耳機 PEN BSP

武漢2025年9月9日 /美通社/ -- 7月24日,2025慧聰跨業(yè)品牌巡展——湖北?武漢站在武漢中南花園酒店隆重舉辦!本次巡展由慧聰安防網、慧聰物聯網、慧聰音響燈光網、慧聰LED屏網、慧聰教育網聯合主辦,吸引了安防、...

關鍵字: AI 希捷 BSP 平板
關閉