日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 電源 > 數(shù)字電源
[導(dǎo)讀]摘要:為解決特殊群體使用計(jì)算器困難的問題,設(shè)計(jì)了一種基于TMS320VC5509 DSP的可語音識(shí)別的計(jì)算器系統(tǒng)。該計(jì)算器系統(tǒng)的核心是采用HMM算法建立語音識(shí)別模型。通過對實(shí)時(shí)語音信號(hào)(數(shù)字、運(yùn)算符號(hào)等語音)進(jìn)行處理,將得

摘要:為解決特殊群體使用計(jì)算器困難的問題,設(shè)計(jì)了一種基于TMS320VC5509 DSP的可語音識(shí)別的計(jì)算器系統(tǒng)。該計(jì)算器系統(tǒng)的核心是采用HMM算法建立語音識(shí)別模型。通過對實(shí)時(shí)語音信號(hào)(數(shù)字、運(yùn)算符號(hào)等語音)進(jìn)行處理,將得到的參數(shù)與模板庫參數(shù)進(jìn)行匹配并加以識(shí)別,利用TMS320VC5509 DSP自帶的計(jì)算模塊實(shí)現(xiàn)語音信號(hào)整數(shù)100以內(nèi)的加、減、乘、除等計(jì)算功能。實(shí)驗(yàn)結(jié)果表明,該計(jì)算器系統(tǒng)在低噪聲場合和高噪聲場合下識(shí)別率分別達(dá)到94.73%和76.55%。
關(guān)鍵詞:語音識(shí)別;DSP;HMM;計(jì)算器;TMS320VC5509

    隨著電子技術(shù)的高速發(fā)展,現(xiàn)代普通民用計(jì)算器在保留基本的加減乘除等運(yùn)算外,加入了大量如三角函數(shù)、冪函數(shù)等比較復(fù)雜的運(yùn)算。但是其基本的操作沒有發(fā)生變化,依然是運(yùn)用手指操作,對于需要進(jìn)行實(shí)時(shí)數(shù)字計(jì)算的一些特殊人群(殘疾人士)或是在一些特殊場合在無法手動(dòng)操作計(jì)算器的情況下,用加入了語音識(shí)別模塊的計(jì)算器來進(jìn)行實(shí)時(shí)數(shù)字計(jì)算就有相當(dāng)?shù)谋匾?br />    語音識(shí)別技術(shù)是人機(jī)最自然、最簡潔的交流方式,它就是讓機(jī)器能夠自動(dòng)識(shí)別并理解說話人要表達(dá)的意思,將語音信號(hào)轉(zhuǎn)變?yōu)檎_的文本或者命令的高科技技術(shù)。根據(jù)實(shí)際的應(yīng)用,語音識(shí)別可以分為:特定人與非特定人的識(shí)別、孤立詞與連續(xù)詞的識(shí)別、中小詞匯量與無限詞匯量的識(shí)別。
    考慮到成本及使用范圍因素,本文中應(yīng)用的是基于TMS320VC5509 DSP的非特定人、孤立詞、小詞匯量的語音識(shí)別系統(tǒng)。通過實(shí)際測試,使用該DSP的語音識(shí)別系統(tǒng)有著較高的實(shí)時(shí)性、識(shí)別率,基于該系統(tǒng)的計(jì)算器對實(shí)時(shí)數(shù)字計(jì)算有較高準(zhǔn)確性,基本能解決特殊群體和特殊地點(diǎn)使用計(jì)算器困難的情況。

1 系統(tǒng)硬件設(shè)計(jì)
1.1 語音識(shí)別系統(tǒng)
    語音識(shí)別的基本原理框圖如圖l所示。語音識(shí)別過程主要包括語音信號(hào)前處理、特征提取、模式匹配等部分。語音信號(hào)輸入之后,預(yù)處理和數(shù)字化是進(jìn)行語音識(shí)別的前提條件。特征提取是進(jìn)行語音信號(hào)訓(xùn)練和識(shí)別必不可少的步驟,本文采用的是提取每幀的Mel系數(shù)的倒譜參數(shù)作為語音信號(hào)的特征值。模板匹配算法目前有DTW算法、HMM隱馬爾科夫模型、ANN人工神經(jīng)網(wǎng)絡(luò)等。本文采用HMM隱馬爾科夫模型的方法,提取出的特征值存入?yún)⒖寄J綆熘校脕砥ヅ浯R(shí)別語音信號(hào)的特征值。匹配計(jì)算是進(jìn)行語音識(shí)別的核心部分,由待識(shí)別人的語音經(jīng)過特征提取后,與系統(tǒng)訓(xùn)練時(shí)產(chǎn)生的模板進(jìn)行匹配,在說話人辨認(rèn)中,取與待識(shí)別語音相似度最大的模型所對應(yīng)的語音作為識(shí)別結(jié)果。


1.2 系統(tǒng)硬件結(jié)構(gòu)
    圖2為系統(tǒng)硬件結(jié)構(gòu)框圖。此系統(tǒng)的核心器件是TI公司的TMS320VC5509定點(diǎn)DSP。在本系統(tǒng)中,它不僅是語音識(shí)別的核心,還負(fù)責(zé)計(jì)算器的運(yùn)算部分。TMS320VC5509是系統(tǒng)的運(yùn)算處理單元,具有2個(gè)乘法器(MAC),4個(gè)累加器(ACC);40位、16位的算術(shù)邏輯單元(ALU)各一個(gè),這大大增強(qiáng)了DSP的運(yùn)算能力;指令字長不只單一的16位,可擴(kuò)展到最高48位,數(shù)據(jù)字長16位;可通過USB接口對TMS320VC5509燒寫程序而不必借助仿真器。正是基于這些優(yōu)點(diǎn),選擇該器件可節(jié)省開發(fā)資金,減小電路板面積。DSP與TLV320AIC23的接口電路如圖3所示。

[!--empirenews.page--]
    TLV320AIC23是Tl公司的一款低成本、低功耗的音頻編解碼器(CODEC),在本系統(tǒng)中負(fù)責(zé)采集語音信號(hào)。它與本系統(tǒng)相關(guān)的性能參數(shù)有:支持8~96 kHz可調(diào)采樣率;可調(diào)1~5dB的完整緩存放大系統(tǒng)等。圖4是TLV320AIC23的電路圖。


    AM29LV800B存儲(chǔ)器又稱閃存(Flash),它具有在線電擦寫、低功耗、大容量等特點(diǎn),其存儲(chǔ)容量為8Mbit。上電后,DSP從外部Flash加載并執(zhí)行程序代碼,使系統(tǒng)能夠脫機(jī)運(yùn)行。在本系統(tǒng)中,它主要用來存儲(chǔ)程序代碼、語音模型、以及壓縮后的語音數(shù)據(jù)。
    HY57V641620同步動(dòng)態(tài)存儲(chǔ)器(SDRAM),容量為4 M×16 bit。作為RAM的擴(kuò)展,它大大增強(qiáng)了DSP的存儲(chǔ)與運(yùn)算能力。在系統(tǒng)初始化的時(shí)候,用來裝載放在Flash中的聲學(xué)模型。這樣在語音識(shí)別的過程中可以通過片外的SDRAM來訪問聲學(xué)模型,比直接訪問Flash來獲取聲學(xué)模型數(shù)據(jù)要快。LCD顯示器用來實(shí)時(shí)顯示經(jīng)過語音識(shí)別后的數(shù)字、運(yùn)算符號(hào),并在得到需要顯示最終結(jié)果的提示后顯示答案。

2 系統(tǒng)軟件設(shè)計(jì)
2.1 系統(tǒng)軟件流程
    圖5為系統(tǒng)的軟件流程。整個(gè)系統(tǒng)開始運(yùn)行后,初始化DSP及TLV320AIC23,以使各個(gè)寄存器的初值符合要求。在系統(tǒng)通過TLV320AIC23采集語音信號(hào)后,首先要進(jìn)行預(yù)濾波和預(yù)加重;接著將語音信號(hào)進(jìn)行分幀;然后計(jì)算每幀信號(hào)的短時(shí)能量與短時(shí)平均過零率,為接下來的門限判決提供依據(jù);利用門限判決進(jìn)行端點(diǎn)檢測后,提取每幀的Mel倒譜參數(shù)(MFCC),作為該幀信號(hào)的特征值;最后,用處理后的語音信號(hào)的特征值與模板進(jìn)行匹配,這一部分是系統(tǒng)的重點(diǎn)。以相似度最大的模板鎖對應(yīng)的語音信號(hào)為識(shí)別結(jié)果。根據(jù)識(shí)別的結(jié)果在顯示器上顯示數(shù)字和運(yùn)算符號(hào),由運(yùn)算規(guī)則得出結(jié)果并顯示。


2.2 前處理
    前處理是對語音信號(hào)采樣、A/D轉(zhuǎn)換、預(yù)濾波和預(yù)加重、分幀等。以8 kHz和16位的采樣頻率采集的語音模擬信號(hào)。本系統(tǒng)使用帶通濾波器來濾波,上截頻率為3.4 kHz。下截頻率為60 Hz。由于語音信號(hào)具有極強(qiáng)的相關(guān)性,因此,分幀時(shí)要考慮幀重復(fù)的問題。本文將語音信號(hào)以256個(gè)采樣點(diǎn)為一幀,兩頓之間的重復(fù)點(diǎn)數(shù)為80,通過一個(gè)一階的濾波器H(z)=1-a/z對采集的信號(hào)進(jìn)行處理。
    端點(diǎn)檢測就是從說話人的語音命令中,檢測出孤立詞的語音開始和結(jié)束的始點(diǎn)。端點(diǎn)檢測是語音識(shí)別過程的一個(gè)重要環(huán)節(jié),只有將孤立詞從說話人的背景噪聲中分割出來,才能夠進(jìn)一步進(jìn)行語音識(shí)別工作。本文采用短時(shí)能量和過零率檢測端點(diǎn)。語音信號(hào)的短時(shí)能量分析給出了反應(yīng)其幅度變化的一個(gè)合適描述方法。
    短時(shí)過零率,即指每幀內(nèi)信號(hào)通過零值的次數(shù),能夠在一定程度上反映信號(hào)的頻譜特性。一幀語音信號(hào)內(nèi)短時(shí)平均過零率定義為:
   
    用短時(shí)能量參數(shù)檢測結(jié)束點(diǎn),信號(hào){x(n)}的短時(shí)能量定義為:
   
式中,{x(n)}為輸入信號(hào)序列。
    在正式端點(diǎn)檢測開始后,短時(shí)能量與短時(shí)過零率作為門限來判決說話人命令字的開始與結(jié)束;連續(xù)5幀語音信號(hào)超過門限值視為說話人命令字的開始,連續(xù)8幀語音信號(hào)低于門限值視為說話人命令字的結(jié)束。
2.3 特征值提取
    提取每幀的Mel倒譜參數(shù)(MFCC)為該幀信號(hào)的特征值。由倒譜特征是用于說話人個(gè)性特征和說話人識(shí)別的最有效的特征之一,它是基于人耳模型而提出的。其提取過程如下:
    1)原始語音信號(hào)S(n)經(jīng)過預(yù)加重、加窗等處理,得到每個(gè)語音幀的時(shí)域信號(hào)x(n)。然后經(jīng)過離散傅里葉變換(DFT)后得到離散頻譜X(k)。


    式中,N表示傅里葉變換的點(diǎn)數(shù)。[!--empirenews.page--]
    2)將離散譜X(k)通過M個(gè)Mel頻率濾波器組可得到Mel頻譜并通過對數(shù)能量的處理,得到對數(shù)頻譜S(n)。計(jì)算S(n)通過每一個(gè)濾波器的輸出,得到M個(gè)h(m)參數(shù)。
   
    3)對所有濾波器輸出進(jìn)行對數(shù)運(yùn)算,再進(jìn)一步進(jìn)行離散余弦變換(DCT),即可得到MFCC參數(shù)。
   
    一般在Mel濾波器的選擇中。Mel濾波器組都選擇三角形的濾波器,但也可以是其他形狀,如正弦形的濾波器組等。
2.4 模板匹配(HMM算法)
    本文采用隱馬爾科夫模型(HMM算法)進(jìn)行模式匹配。它將特征矢量作為模板,在語音識(shí)別模式匹配時(shí),對輸人的語音與模板庫中的模板進(jìn)行比較,最后將相似度最高的作為輸出結(jié)果。HMM算法解決由于說話人語速不同和連續(xù)說話的而帶來的失真問題,還能大大減少運(yùn)算時(shí)間,提高識(shí)別率。
    隱馬爾可夫模型是一個(gè)雙重隨機(jī)過程的統(tǒng)計(jì)模型,其基本隨機(jī)過程是隱藏起來觀測不到的,另一個(gè)隨機(jī)過程則產(chǎn)生觀測序列。對于語音識(shí)別系統(tǒng),觀測序列0就是矢量量化后的結(jié)果序列,模型λ就是由訓(xùn)練語音得到的模板。語音的訓(xùn)練過程就是產(chǎn)生模板λ的過程,而語音的識(shí)別過程就是求出在模板λ下,待識(shí)別語音的結(jié)果序列0的條件概率P[O/λ]。
    由α(i)和β(i)的定義可直接得到:P[O/λ]=αt(i)βt(i)。而語音的訓(xùn)練算法則較復(fù)雜,目前都采用迭代的方法得到a和b的近似解,其迭代公式如:
   
    在實(shí)際應(yīng)用中,僅對詞條的少數(shù)次發(fā)音進(jìn)行訓(xùn)練的語音識(shí)別系統(tǒng)。不可能對各種復(fù)雜語境下的不同發(fā)音都有較高的識(shí)別率。某些較陳舊的識(shí)別算法如動(dòng)態(tài)時(shí)間彎曲法,只能把單詞的多次訓(xùn)練發(fā)音形成多個(gè)模板,造成模板數(shù)量成倍增加,影響系統(tǒng)的實(shí)時(shí)性。而HMM能夠?qū)σ粋€(gè)詞的多個(gè)訓(xùn)練序列進(jìn)行有效的融合而形成一個(gè)模板。當(dāng)訓(xùn)練發(fā)音的數(shù)量增多時(shí),只會(huì)造成訓(xùn)練過程的計(jì)算量增大。而不會(huì)使識(shí)別過程的計(jì)算量有絲毫增加,這對系統(tǒng)的實(shí)時(shí)性是相當(dāng)有利的。

3 系統(tǒng)測試
    針對計(jì)算器的使用特點(diǎn)和環(huán)境,分別在2個(gè)地點(diǎn)測試系統(tǒng)的性能。1)封閉的實(shí)驗(yàn)室(地點(diǎn)1),噪聲較小,采集的信號(hào)較為良好,缺點(diǎn)是有回聲。2)課間休息的教室(地點(diǎn)2),噪聲及大,干擾很強(qiáng),信號(hào)的采集質(zhì)量很差。
    因?yàn)檎麄€(gè)系統(tǒng)的設(shè)計(jì)是實(shí)現(xiàn)計(jì)算器的計(jì)算功能,因此本次的實(shí)驗(yàn)是在系統(tǒng)識(shí)別數(shù)字和運(yùn)算符號(hào)等語音后在顯示器上顯示數(shù)學(xué)運(yùn)算公式,并在識(shí)別出“等于”或“得出”2個(gè)詞組的語音后顯示出“=”和最后的計(jì)算結(jié)果。
    在測試前預(yù)先采集5男5女共1 000個(gè)語音樣本(內(nèi)容為數(shù)字0到100,加、減、乘、除、等于和十、百、千、萬等基本計(jì)算所需要的數(shù)字和運(yùn)算符號(hào)讀音),并且對所有樣本進(jìn)行訓(xùn)練。另外找10人(4女,6男)在各實(shí)驗(yàn)地點(diǎn)進(jìn)行實(shí)時(shí)測試,每人10個(gè),共100個(gè)未經(jīng)訓(xùn)練的樣本。用這些樣本對系統(tǒng)進(jìn)行測試,其測試結(jié)果如表1所示。


    由表l所示,在相同的實(shí)驗(yàn)設(shè)備條件下,在噪聲較小的環(huán)境下的系統(tǒng)識(shí)別率要遠(yuǎn)高于在嘈雜的環(huán)境下。特別是非經(jīng)訓(xùn)練的樣本在嘈雜環(huán)境下的識(shí)別率比較低,主要是因?yàn)榄h(huán)境中的噪聲相當(dāng)復(fù)雜,查看頻譜圖發(fā)現(xiàn)噪聲幾乎與說話人語音混雜疊加,算法難以識(shí)別。

4 結(jié)論
    本文設(shè)計(jì)的語音識(shí)別計(jì)算器系統(tǒng),除兼有語音識(shí)別的功能,還能對識(shí)別的語音信號(hào)做進(jìn)一步處理。由于采用HMM模型對語音信號(hào)進(jìn)行端點(diǎn)檢測,大大提高語音信號(hào)起止點(diǎn)判斷準(zhǔn)確性,提高了識(shí)別的準(zhǔn)確率。由于系統(tǒng)運(yùn)算復(fù)雜。計(jì)算量和存儲(chǔ)量都很大,同時(shí)也需要實(shí)時(shí)處理語音信號(hào)與算法,系統(tǒng)所采用的TMS320VC5509,由于其具有0.05 MW/MIPS的功耗,800 MIPS的運(yùn)算能力等優(yōu)越的性能,完全能夠滿足實(shí)時(shí)識(shí)別功能。實(shí)驗(yàn)表明,該計(jì)算器系統(tǒng)處理速度快,運(yùn)行穩(wěn)定,達(dá)到了設(shè)計(jì)要求。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

美國紐約州阿蒙克2022年10月20日 /美通社/ -- IBM(NYSE: IBM)發(fā)布 2022 年第三季度業(yè)績報(bào)告。 IBM 董事長兼首席執(zhí)行官 Arvind Kri...

關(guān)鍵字: IBM 軟件 BSP 云平臺(tái)

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險(xiǎn)積極籌備個(gè)人養(yǎng)老金的產(chǎn)品設(shè)計(jì)和系統(tǒng)開發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動(dòng)商業(yè)養(yǎng)老保險(xiǎn)、個(gè)人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險(xiǎn)等產(chǎn)品供給。 搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字: 溫度 BSP 東風(fēng) 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元,承載著生存與活動(dòng)的最基本功能。而對于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對于空間和生活深層關(guān)系的思考,同時(shí)也塑造著人與空間的新型連接...

關(guān)鍵字: 溫度 BSP 智能化 進(jìn)程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績預(yù)告。今年前三季度,公司預(yù)計(jì)實(shí)現(xiàn)營業(yè)收入7.54億元至8.33億元,同比增長60.24%至77.03%;歸母凈利潤預(yù)計(jì)為1.73億...

關(guān)鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲(chǔ)及超融合市場研究報(bào)告》,報(bào)告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...

關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團(tuán)成立60周年的紀(jì)念日。趁著首都銀行集團(tuán)成立60周年與首都銀行(中國)在華深耕經(jīng)營12年的“大日子”,圍繞作為外資金融機(jī)構(gòu)對在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字: 數(shù)字化 BSP 供應(yīng)鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會(huì)社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運(yùn)國際物流有限公司(Nipp...

關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國進(jìn)出口商品交易會(huì)("廣交會(huì)")于"云端"開幕。本屆廣交會(huì)上高新技術(shù)企業(yè)云集,展出的智能產(chǎn)品超過140,...

關(guān)鍵字: 中國智造 BSP 手機(jī) CAN

要問機(jī)器人公司哪家強(qiáng),波士頓動(dòng)力絕對是其中的佼佼者。近來年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機(jī)器人會(huì)后空翻,自主爬樓梯等。這不,波士頓動(dòng)力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻,表演的機(jī)器人包括...

關(guān)鍵字: 機(jī)器人 BSP 工業(yè)機(jī)器人 現(xiàn)代汽車

數(shù)字電源

15504 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉