日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 電源 > 數字電源
[導讀]隨著DSP和專用集成電路技術的發(fā)展,快速傅立葉變換以及近來嵌入式操作系統(tǒng)的研究,使得特定人識別尤其是計算量小的特定人識別成為可能。因此,對特定人語音識別技術在汽車控制上的應用的研究是很有前途的。

關鍵詞: 特定人語音識別   預處理   LPCC   MPCC

1  引言
從20世紀50年代開始對語音識別的研究開始,經過幾十年的發(fā)展已經達到一定的高度,有的已經從實驗室走向市場,如一些玩具、某些部門密碼語音輸入等,隨著DSP和專用集成電路技術的發(fā)展,快速傅立葉變換以及近來嵌入式操作系統(tǒng)的研究,使得特定人識別尤其是計算量小的特定人識別成為可能。因此,對特定人語音識別技術汽車控制上的應用的研究是很有前途的。

2  特定人語音識別的方法
目前,常用的說話人識別方法有模板匹配法、統(tǒng)計建模法、聯接主義法(即人工神經網絡實現)。考慮到數據量、實時性以及識別率的問題,筆者采用基于矢量量化和隱馬爾可夫模型(HMM)相結合的方法。

說話人識別的系統(tǒng)主要由語音特征矢量提取單元(前端處理)、訓練單元、識別單元和后處理單元組成,其系統(tǒng)構成如圖1所示。

圖1     系統(tǒng)構成
由上圖也可以看出,每個司機在購買車后必須將自己的語音輸入系統(tǒng),也就是訓練過程,當然最好是在安靜、次數達到一定的數目。從此在以后駕駛過程中就可以利用這個系統(tǒng)了。

所謂預處理是指對語音信號的特殊處理:預加重,分幀處理。預加重的目的是提升高頻部分,使信號的頻譜變得平坦,以便于進行頻譜分析或聲道參數分析。用具有 6dB/倍頻程的提升高頻特性的預加重數字濾波器實現。雖然語音信號是非平穩(wěn)時變的,但是可以認為是局部短時平穩(wěn)。故語音信號分析常分段或分幀來處理。

2.1  語音特征矢量提取單元
說話人識別系統(tǒng)設計中的根本問題是如何從語音信號中提取表征人的基本特征。即語音特征矢量的提取是整個說話人識別系統(tǒng)的基礎,對說話人識別的錯誤拒絕率和錯誤接受率有著極其重要的影響。同語音識別不同,說話人識別利用的是語音信號中的說話人信息,而不考慮語音中的字詞意思,它強調說話人的個性。因此,單一的語音特征矢量很難提高識別率。該系統(tǒng)在說話人的識別中采用倒譜系數加基因周期參數,而在對控制命令的語音識別中僅采用倒譜系數。其中,常用的倒譜系數有2 種,即LPC(線性預測系數)和倒譜參數(LPCC),一種是基于Mel刻度的MFLL(頻率倒譜系數)參數(Mel頻率譜系數)。

對于LPCC參數的提取, 可先采用Durbin遞推算法、格型算法或者Schur遞推算法來求LPC系數,然后求LPC參數。設第l幀語音的LPC系數為αn,則LPCC的參數為


1<n≤p
其中p為LPCC系數的階數,k為LPCC系數的遞推次數。
進一步的研究發(fā)現,引入一階和二階差分倒譜可以提高識別率。
對于MPCC參數的提取,若根據Mel曲線將語音信號頻譜分為K個頻帶,每個頻帶的能量為θ(Mk),則 MFCC參數為
1<n≤p
通過對LPCC和MFCC參數對識別率影響的實驗比較,筆者選取LPCC參數及其一階和二階差分倒譜稀疏作為特征參數。

基音周期估計的方法很多,主要有基于求短時自相關函數的算法、基于求短時平均幅度差函數(AMDF)的算法、基于同態(tài)信號處理和線性預測編碼的算法。筆者僅介紹基于求短時自相關函數的算法。

設Sw(n)是一段加窗語音信號,它的非零區(qū)間為0<n≤n-1。Sw(n)的自相關函數稱為語音信號的S(n)的短時自相關函數,用Rw(l)表示,即
 Rw(l)=

可知短時自相關函數在Rw(0)處最大,且在基音周期的各個整數倍點上有很大的峰值,選擇合適的窗函數(窗長為40ms的Hamming窗)與濾波器(帶寬為60~900Hz的帶通濾波器)后,只要找到自相關函數的第一最大峰值點的位置并計算它與零點的距離,便能估計出基音周期。

2.2  訓練單元
訓練單元的功能是把事先收集到的語音利用一定的算法為每一個待識別的說話人訓練出與之相匹配的參數。針對說話人識別在汽車應用中的不同的要求,訓練單元也分為2部分:對說話人識別的訓練和對待識別詞的訓練。

對于說話人識別部分的訓練, 針對說話人的特征進行訓練,為每個合法用戶建立一套或多套HMM模型,同時采用基于矢量量化(VQ)的方法,為每個合法用戶建立VQ碼本。VQ碼本的設計采用LBG算法,初始碼本的設置采用分裂法初始碼本。

第2 部分針對控制命令中用到的每個孤立的詞條建立多個訓練樣本,或稱為詞條樣本,估計出該詞條的HMM參數(一套或多套)。對一個HMM過程的完整的描述包括:2個模型參數N和M,3組概率度量A,B和π。為了方便起見,通常采用如下方式表示一個完整的模型:λ=(N,M,π,A,B),或者簡寫為:λ= (π,A,B)。而對于每一個詞條V的模型參數,V=1~V,可以用Baum-Welch重估算法。

2.3  識別單元
識別單元的功能是利用經訓練已經獲得的HMM模型參數 和測得的說話人的基音周期在一定的判決條件下辨認出待識別的說話人并估計出待識別的控制命令詞串。針對HMM模型參數通常采用的判決條件是最大后驗概率,用Viterbi算法實現。

2.4  后處理單元
充分利用每個說話人的聲道參數和詞條中各狀態(tài)持續(xù)時間的概率分布來改進系統(tǒng)的識別率。

3  系統(tǒng)的實現
由于汽車的控制命令是有限的詞條和數字串的組合, 對這些語音命令的識別屬于特定人小詞匯量的連接詞的識別以及與文本有關的說話人確認,不論是從目前的DSP運算速度還是存儲空間來說,實時實現這些語音命令的識別都是完全可能的。
識別系統(tǒng)組成框圖如圖所示:在此系統(tǒng)中,對運算能力和存儲單元要求非常高的語音識別部分完全由DSP完成。

框圖中識別系統(tǒng)的功能是完成語音的輸入、A/D轉換及識別,系統(tǒng)中核心部分采用TMS320VC5410。其原因是它的運算速度和存儲空間都能滿足要求,同時它的一些并行運算硬件結構也非常適合語音識別的各種算法,程序和已經脫機訓練好的HMM參數表及相應的詞典存放在程序存儲器中,數據存儲器存放識別過程中的中間計算數據。A/D芯片采用TLC320AD50C, 里面含有A/D、D/A以及低通濾波器和采樣保持電路。模擬語音信號的輸入主要是通過傳聲器,保證語音門禁的安全性,轉換后的數字語音數據以同步串行通信方式傳送給DSP。如圖2。

圖2     識別系統(tǒng)的組成框圖

結束語
語音控制汽車是未來的一種趨勢。目前,將語音技術應用于汽車的產品只有在一些玩具中用到,由此可想利用語音技術進行汽車控制這一領域蘊涵著相當大的潛在市場。

而且,說話人識別技術已經發(fā)展到可以應用到實際的階段了,但目前對說話人識別的應用并不是很多。筆者嘗試提出一種比較容易實現的方案,將說話人識別技術應用到實際中。但在實際應用中,說話人識別系統(tǒng)都面臨一個共同的問題,即無法區(qū)分一個發(fā)音是現場發(fā)音還是錄音回放。針對該現象,筆者提出的說話人識別系統(tǒng)可以有效地防止這種情況發(fā)生。具體實現說話人識別系統(tǒng)時,可采用隨機或其它方法來生成提示文本。如隨機的數字串,以使假冒者無法事先錄音,增加駕駛的安全性。  

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險積極籌備個人養(yǎng)老金的產品設計和系統(tǒng)開發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產品,推動商業(yè)養(yǎng)老保險、個人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險等產品供給。 搭養(yǎng)老政策東風 ...

關鍵字: 溫度 BSP 東風 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎單元,承載著生存與活動的最基本功能。而對于理想空間的解構意義卻在物理性容器之外,體現出人們對于空間和生活深層關系的思考,同時也塑造著人與空間的新型連接...

關鍵字: 溫度 BSP 智能化 進程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績預告。今年前三季度,公司預計實現營業(yè)收入7.54億元至8.33億元,同比增長60.24%至77.03%;歸母凈利潤預計為1.73億...

關鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經濟和信息化局發(fā)布2022年度第一批北京市市級企業(yè)技術中心創(chuàng)建名單的通知,諾誠健華正式獲得"北京市企業(yè)技術中心"認定。 北京市企業(yè)技...

關鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國際數據公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報告》,報告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...

關鍵字: IDC BSP 數字化 數據中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團成立60周年的紀念日。趁著首都銀行集團成立60周年與首都銀行(中國)在華深耕經營12年的“大日子”,圍繞作為外資金融機構對在華戰(zhàn)略的構想和業(yè)...

關鍵字: 數字化 BSP 供應鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團公司上海通運國際物流有限公司(Nipp...

關鍵字: 溫控 精密儀器 半導體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國進出口商品交易會("廣交會")于"云端"開幕。本屆廣交會上高新技術企業(yè)云集,展出的智能產品超過140,...

關鍵字: 中國智造 BSP 手機 CAN

要問機器人公司哪家強,波士頓動力絕對是其中的佼佼者。近來年該公司在機器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機器人會后空翻,自主爬樓梯等。這不,波士頓動力又發(fā)布了其機器人組團跳男團舞的新視頻,表演的機器人包括...

關鍵字: 機器人 BSP 工業(yè)機器人 現代汽車

南京2022年10月17日 /美通社/ -- 日前《2022第三屆中國高端家電品牌G50峰會》于浙江寧波落幕,來自兩百余名行業(yè)大咖、專家學者共同探討了在形勢依然嚴峻的當下,如何以科技創(chuàng)新、高端化轉型等手段,幫助...

關鍵字: LINK AI BSP 智能家電

數字電源

15504 篇文章

關注

發(fā)布文章

編輯精選

技術子站

關閉