日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]基于Windows CE的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)

摘要:論文給出一種基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)方案,該系統(tǒng)的硬件電路由嵌入式微處理器和音頻處理等主要芯片組成,采用Windows CE操作系統(tǒng),語(yǔ)音口令識(shí)別算法為連續(xù)隱馬爾可夫模型。實(shí)驗(yàn)結(jié)果表明,隨著嵌入式微處理器性能的不斷提高和價(jià)格的不斷下降,對(duì)運(yùn)算量要求比較高的語(yǔ)音口令識(shí)別技術(shù)就可以通過(guò)嵌入式系統(tǒng)來(lái)實(shí)現(xiàn),并且應(yīng)用到許多需要使用口令控制的便攜式設(shè)備中。
關(guān)鍵詞:語(yǔ)音口令識(shí)別;嵌入式系統(tǒng);隱馬爾可夫模型;Windows CE

0 引言
    隨著微電子技術(shù)的迅速發(fā)展,嵌入式系統(tǒng)在一些特定的專用設(shè)備上得到了廣泛應(yīng)用,通常這些設(shè)備的硬件資源(如處理器的運(yùn)行速度、存儲(chǔ)器的容量等)非常有限,并且對(duì)成本也有苛刻的要求,有時(shí)對(duì)實(shí)時(shí)響應(yīng)要求也比較高,在數(shù)字信號(hào)處理芯片上已經(jīng)實(shí)現(xiàn)了語(yǔ)音口令識(shí)別系統(tǒng)或語(yǔ)音口令識(shí)別系統(tǒng)的部分功能。語(yǔ)音口令識(shí)別技術(shù)與嵌入式系統(tǒng)的有效結(jié)合能夠顯示出其優(yōu)勢(shì)作用,但是也有很多有待進(jìn)一步提高和改進(jìn)之處,語(yǔ)音識(shí)別技術(shù)對(duì)運(yùn)算速度和內(nèi)存容量的要求都比較高,需要采用一些快速算法提高實(shí)時(shí)處理的性能。嵌入式微處理器的價(jià)格在不斷下降,但是其性能卻在不斷上升,嵌入式系統(tǒng)目前已經(jīng)廣泛地應(yīng)用于運(yùn)算量比較大的系統(tǒng)和設(shè)備中,而其體積小和低功耗的特點(diǎn)使其能夠發(fā)揮出更大的優(yōu)勢(shì)。
    論文給出一種基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)方案,硬件系統(tǒng)的核心芯片是嵌入式微處理器,語(yǔ)音口令識(shí)別算法采用連續(xù)隱馬爾可夫模型,現(xiàn)有的非特定人語(yǔ)音口令識(shí)別系統(tǒng)中,多采用狀態(tài)輸出具有連續(xù)概率分布的連續(xù)隱馬爾可夫模型CDHMM(Continuous Density
Hidden Markov Model)。操作系統(tǒng)則是采用的目前廣泛使用的WindowsCE 5.O。
    硬件電路的核心芯片是三星公司的嵌入式微處理器S3C2440AL,主頻為400MHz。該微處理器具有低功耗、高性能等特點(diǎn),廣泛應(yīng)用于便攜式設(shè)備中?;谇度胧较到y(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)需要有接收語(yǔ)音信號(hào)的輸入芯片配合麥克風(fēng)實(shí)現(xiàn)將模擬語(yǔ)音信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的功能,然
后由嵌入式微處理器對(duì)輸入的語(yǔ)音口令信號(hào)進(jìn)行處理。完成語(yǔ)音口令信號(hào)輸入功能的芯片采用的是PHILIPS公司的低功耗芯片UDA1341TS。操作系統(tǒng)采用的是Windows CE5.0。Windows CE 5.0是一個(gè)32位操作系統(tǒng),具有模塊化、結(jié)構(gòu)化,能夠支持超過(guò)1000個(gè)公共Microsoft Win32應(yīng)用程序接口,并且與處理器無(wú)關(guān)等特點(diǎn),為各種嵌入式系統(tǒng)和產(chǎn)品設(shè)計(jì)提供了一種可裁剪的、高效的、可升級(jí)的操作系統(tǒng)。

1 系統(tǒng)設(shè)計(jì)
1.1 硬件電路的設(shè)計(jì)
    論文給出的語(yǔ)音口令識(shí)別系統(tǒng)的硬件電路主要由嵌入式微處理器、存儲(chǔ)器和語(yǔ)音口令輸入芯片組成。核心芯片是嵌入式微處理器Samsung 32位S3C2440AL,其主頻為400MHz,最高頻率533MHz。64MB SDRAM,64MB的NAND FLASH存儲(chǔ)器,用來(lái)存儲(chǔ)操作系統(tǒng)文件等,2MB的NOR FLASH存儲(chǔ),為安裝BIOS使用。S3C2440AL控制PHILIPS公司的UDA 1341TS完成輸入語(yǔ)音口令信號(hào)的功能。該音頻處理芯片由AD/DA轉(zhuǎn)換、控制邏輯電路、可編程增益放大器(PGA)和數(shù)字自動(dòng)增益控制器(AGC)以及數(shù)字信號(hào)處理器等部分組成,能進(jìn)行數(shù)字語(yǔ)音處理。
    對(duì)于一個(gè)基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng),主要有以下幾個(gè)要求:
    (1)完成語(yǔ)音口令識(shí)別功能時(shí),需要系統(tǒng)對(duì)人所發(fā)出的語(yǔ)音口令做出快速的響應(yīng),然后給出相應(yīng)的判斷結(jié)果。
    (2)自動(dòng)獲得語(yǔ)音信號(hào)。語(yǔ)音口令識(shí)別系統(tǒng)一直處于隨時(shí)接受語(yǔ)音口令的工作狀態(tài),無(wú)需人工操作就能將人的語(yǔ)音命令與環(huán)境噪聲分離出來(lái),舍棄靜音信號(hào)和環(huán)境噪聲信號(hào)部分,僅僅對(duì)有效的語(yǔ)音口令信號(hào)做處理和識(shí)別。
    (3)需要有足夠的存儲(chǔ)器容量存儲(chǔ)操作系統(tǒng)文件和訓(xùn)練好的語(yǔ)音口令模型庫(kù)以及存儲(chǔ)大量數(shù)據(jù)的數(shù)據(jù)緩沖區(qū)。
    論文給出的語(yǔ)音口令識(shí)別系統(tǒng)選擇高性價(jià)比的嵌入式微處理器S3C2440AL和64MB隨機(jī)存儲(chǔ)器和64MB的閃存來(lái)滿足計(jì)算速度和數(shù)據(jù)緩存的要求。
1.2 軟件程序的設(shè)計(jì)
    選擇Windows CE 5.0為語(yǔ)音口令識(shí)別系統(tǒng)的操作系統(tǒng),Windows CE 5.0是一個(gè)多任務(wù)操作系統(tǒng)。開(kāi)發(fā)工具主要有Platform Builder 5.0和EVC++4.0。Platform Builder5.0用于定制和開(kāi)發(fā)內(nèi)核,而EVC++4.0則用來(lái)編寫(xiě)基于操作系統(tǒng)的應(yīng)用層程序,也就是算法執(zhí)行程序與圖形化界面,而圖形化的界面使用MFC編寫(xiě)。
    由于語(yǔ)音口令識(shí)別系統(tǒng)算法的運(yùn)算量比較大,所以為了能夠加快運(yùn)算速度,首先對(duì)Windows CE 5.0操作系統(tǒng)進(jìn)行配置,需要將相應(yīng)的板級(jí)支持包BSP(Board SupportPackage)導(dǎo)入到Platform Builder 5.O,裁剪掉一些使用不到的資源,保留一些需要的資源,驅(qū)動(dòng)的配置正確后,將配置好的操作系統(tǒng)內(nèi)核裝入到嵌入式平臺(tái)中,然后進(jìn)行應(yīng)用程序的開(kāi)發(fā)。
    語(yǔ)音口令識(shí)別系統(tǒng)分為訓(xùn)練和識(shí)別兩個(gè)過(guò)程。訓(xùn)練時(shí),語(yǔ)音口令信號(hào)首先經(jīng)過(guò)預(yù)處理,然后提取語(yǔ)音特征參數(shù),采用MFCC(Mel-Frequen-cy Ceptral Coefficients)參數(shù),然后建立此口令的連續(xù)隱馬爾可夫(CDHMM)模型,把所有經(jīng)過(guò)訓(xùn)練的語(yǔ)音口令的模型放在模型庫(kù)中。
    在識(shí)別階段,與訓(xùn)練時(shí)提取語(yǔ)音口令信號(hào)的特征參數(shù)一樣,也要提取MFCC特征參數(shù),然后與保存在語(yǔ)音口令模型庫(kù)中的每一條語(yǔ)音口令模型相匹配,根據(jù)概率評(píng)分確定輸出識(shí)別結(jié)果。語(yǔ)音口令識(shí)別系統(tǒng)的程序流程圖如圖1所示。


    當(dāng)語(yǔ)音口令識(shí)別系統(tǒng)采集到命令語(yǔ)音信號(hào)后,要提取參數(shù),做出比較判斷,調(diào)用相應(yīng)語(yǔ)音口令識(shí)別算法。對(duì)每條語(yǔ)音口令信號(hào),先切除靜音,進(jìn)行預(yù)加重處理,然后通過(guò)Hamming窗分幀,幀長(zhǎng)和幀移分別為20ms和10ms,對(duì)每一幀語(yǔ)音信號(hào)提取16階MFCC和△MFCC一共32維參數(shù)作為特征矢量。
    語(yǔ)音口令識(shí)別軟件系統(tǒng)由許多不同的語(yǔ)音信號(hào)預(yù)處理、識(shí)別算法和其它子程序組成,為了實(shí)現(xiàn)參數(shù)的傳遞,每個(gè)程序執(zhí)行后的參數(shù)以文件的形式輸出,而這些程序的調(diào)用先后順序和參數(shù)的輸入輸出文件的位置等都由一個(gè)主程序管理。
    在Windows CE中,編寫(xiě)可執(zhí)行程序,需要調(diào)用應(yīng)用程序編程接口API(Application Programming Interface)函數(shù),并且要設(shè)定程序入口點(diǎn)。調(diào)用過(guò)程為:
#include<windows.h>
int WINAPI_tmain(int argc,TCHAR* argv[])
{
……
}[!--empirenews.page--]
    無(wú)論是進(jìn)行語(yǔ)音口令訓(xùn)練還是語(yǔ)音口令識(shí)別操作,都需要對(duì)語(yǔ)音口令信號(hào)的采集和實(shí)時(shí)處理程序,所以對(duì)語(yǔ)音口令信號(hào)的采集和實(shí)時(shí)處理程序是語(yǔ)音口令識(shí)別系統(tǒng)軟件中的重要部分之一。對(duì)于語(yǔ)音音頻接口的管理是通過(guò)Windows CE 5.0里的API函數(shù)完成的,對(duì)語(yǔ)音口令信號(hào)的采集和實(shí)時(shí)處理程序流程圖如圖2所示。


    主程序在配置好初始化參數(shù)后,建立一個(gè)子線程,建立子線程有利于將靜音檢測(cè)的復(fù)雜運(yùn)算過(guò)程和主程序的音頻數(shù)據(jù)采集過(guò)程分開(kāi)進(jìn)行,以確保在靜音檢測(cè)時(shí)不會(huì)丟掉音頻數(shù)據(jù)。與此同時(shí),主程序開(kāi)始采集數(shù)據(jù),并存入到緩沖區(qū)。當(dāng)預(yù)先設(shè)定好的緩沖區(qū)內(nèi)的數(shù)據(jù)采集滿
后,會(huì)將所采集的數(shù)據(jù)交給子線程,子線程做靜音檢測(cè)判斷。主程序會(huì)依然繼續(xù)重新采集新的音頻數(shù)據(jù)。對(duì)于子線程,子線程的任務(wù)是等待主程序發(fā)出命令,然后對(duì)數(shù)據(jù)做處理。如果檢測(cè)到有語(yǔ)音口令的開(kāi)始,會(huì)繼續(xù)采集數(shù)據(jù),得到完整命令語(yǔ)音口令信號(hào),提取相應(yīng)的特征參數(shù)。
    具體程序中有如下幾個(gè)主要過(guò)程:
    (1)初始化參數(shù)設(shè)置:
    (a).
FuncReturn=waveInOpen(&(Record_Buffer_Manager.hWaveIn),WAVE_MAPPER,&wFormat,(LONG)(RecordBufferFillProc),(DWORD)this, CALLBACK_FUNCTION);//首先要調(diào)用API函數(shù)打開(kāi)音頻設(shè)備接口,并且設(shè)置相應(yīng)的回調(diào)(CALLBACK)函數(shù)(回調(diào)函數(shù)是操作系統(tǒng)在每次緩沖區(qū)存滿后會(huì)自動(dòng)訪問(wèn)的一個(gè)特殊函數(shù))
    (b).
Thread_process=AfxBeginThread((AFX_THREADPROC)RecordThreadProc, (LPVOID)this,THREAD_PRIORITY_NORMAL,0,O,0);//要為其單獨(dú)建立一個(gè)線程,為了實(shí)現(xiàn)靜音檢測(cè),在混雜著環(huán)境噪聲的前提下,找出語(yǔ)音口令信號(hào)。
    (c).
FuncReturn=waveInStart(Record_Buffer_Managcr.hWaveln);//打開(kāi)音頻數(shù)據(jù)流,開(kāi)始錄音。(緩沖區(qū)存滿后,系統(tǒng)會(huì)自動(dòng)訪問(wèn)回調(diào)函數(shù))
    (2)主程序與子線程通信
SetEvent(pRecord->hRecordEvent);//發(fā)出信號(hào),使得子線程函數(shù)得到命令,對(duì)采集到的音頻流進(jìn)行靜音的檢測(cè)判斷。
    (3)在子線程內(nèi)接收消息作出反應(yīng)
WaitForSingleObject(pRecrd->hRecordEvent,INFINTTE);ResetEvent(pRecord->hRecordEvent);//與回調(diào)函數(shù)的信號(hào)發(fā)出程序?qū)?yīng),接受信號(hào),并重新設(shè)定狀態(tài),等待下一次信號(hào)。
……
pRecord->ProcessData((SAMPLE TYPE *)pRecord->pLeftData,……);//將得到的數(shù)據(jù)段進(jìn)行處理,也就是真正執(zhí)行靜音檢測(cè)的部分。
    (4)得到完整語(yǔ)音口令信號(hào)后提取特征參數(shù)。

2 結(jié)束語(yǔ)
    論文建立了一種基于Windows CE的語(yǔ)音口令識(shí)別系統(tǒng),并且對(duì)上升、下降等14條口令進(jìn)行測(cè)試。實(shí)驗(yàn)結(jié)果表明,本語(yǔ)音口令識(shí)別系統(tǒng)達(dá)到了實(shí)時(shí)的要求,可以廣泛應(yīng)用于便攜式設(shè)備中。
 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

立邦不斷推動(dòng)環(huán)境友好型涂料的創(chuàng)新研發(fā),并將低溫固化粉末涂料產(chǎn)品應(yīng)用于煤礦設(shè)備領(lǐng)域。相較其他粉末涂料,立邦低溫固化粉末涂料NPD-ACE -LT系列,全面降低了實(shí)現(xiàn)涂料理想固化效果所需的烘烤溫度,使之所需的升溫時(shí)間也大幅減...

關(guān)鍵字: 溫度 PD D-A CE

美國(guó)紐約州阿蒙克2022年10月20日 /美通社/ -- IBM(NYSE: IBM)發(fā)布 2022 年第三季度業(yè)績(jī)報(bào)告。 IBM 董事長(zhǎng)兼首席執(zhí)行官 Arvind Kri...

關(guān)鍵字: IBM 軟件 BSP 云平臺(tái)

云頂新耀宣布其合作伙伴Providence Therapeutics Holdings Inc.的mRNA新冠候選疫苗PTX-COVID19-B在評(píng)估其安全性、耐受性和免疫原性的II期研究中取得了積極的頂線結(jié)果。云頂新耀...

關(guān)鍵字: VI OV IDE CE

四季酒店集團(tuán)2022年10月17日宣布任命Alejandro Reynal為CEO兼總裁,希望提高集團(tuán)的數(shù)據(jù)應(yīng)用能力,以提升業(yè)績(jī)表現(xiàn)。在加入四季酒店之前,Reynal擔(dān)任凱悅旗下度假村品牌Apple Leisure的總裁...

關(guān)鍵字: APPLE CE TE 電信

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險(xiǎn)積極籌備個(gè)人養(yǎng)老金的產(chǎn)品設(shè)計(jì)和系統(tǒng)開(kāi)發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動(dòng)商業(yè)養(yǎng)老保險(xiǎn)、個(gè)人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險(xiǎn)等產(chǎn)品供給。 搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字: 溫度 BSP 東風(fēng) 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元,承載著生存與活動(dòng)的最基本功能。而對(duì)于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對(duì)于空間和生活深層關(guān)系的思考,同時(shí)也塑造著人與空間的新型連接...

關(guān)鍵字: 溫度 BSP 智能化 進(jìn)程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績(jī)預(yù)告。今年前三季度,公司預(yù)計(jì)實(shí)現(xiàn)營(yíng)業(yè)收入7.54億元至8.33億元,同比增長(zhǎng)60.24%至77.03%;歸母凈利潤(rùn)預(yù)計(jì)為1.73億...

關(guān)鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級(jí)企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠(chéng)健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國(guó)軟件定義存儲(chǔ)及超融合市場(chǎng)研究報(bào)告》,報(bào)告顯示:2022年上半年浪潮超融合銷售額同比增長(zhǎng)59.4%,近5倍于...

關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團(tuán)成立60周年的紀(jì)念日。趁著首都銀行集團(tuán)成立60周年與首都銀行(中國(guó))在華深耕經(jīng)營(yíng)12年的“大日子”,圍繞作為外資金融機(jī)構(gòu)對(duì)在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字: 數(shù)字化 BSP 供應(yīng)鏈 控制

嵌入式軟件

15715 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉