日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 物聯(lián)網(wǎng) > 《物聯(lián)網(wǎng)技術(shù)》雜志
[導(dǎo)讀]摘 要 :文中設(shè)計(jì)了一款智能家居系統(tǒng),主要介紹了語(yǔ)音識(shí)別技術(shù)的相關(guān)基礎(chǔ)原理以及流程。詳細(xì)分析了一段語(yǔ)音信號(hào)從采集到預(yù)處理,提取特征值后與語(yǔ)音庫(kù)中的聲學(xué)模型比對(duì)得出識(shí)別結(jié)果的過程及隱馬爾科夫的建模過程、算法流程,最后利用 Arduino 開發(fā)板搭建智能家居系統(tǒng)。

0 引 言

第一次工業(yè)時(shí)代后,生活方式大不同前,越來越多的機(jī)器設(shè)備開始代替手工作業(yè),而在家居行業(yè)也出現(xiàn)了類似的機(jī)器人幫人們處理家居生活中的簡(jiǎn)單工作,不僅解放了人們的雙手,又節(jié)省了大量時(shí)間。智能家居的發(fā)展與人機(jī)交互技術(shù)有著密不可分的關(guān)聯(lián),在長(zhǎng)期探索中,語(yǔ)音識(shí)別技術(shù)脫穎而出。本文詳細(xì)分析了語(yǔ)音識(shí)別過程,并設(shè)計(jì)了一套基于Arduino平臺(tái)的智能家居系統(tǒng)實(shí)現(xiàn)對(duì)家居燈光、環(huán)境(溫度和濕度)、光線、安防監(jiān)督的語(yǔ)音化控制。

1 語(yǔ)音識(shí)別系統(tǒng)相關(guān)理論技術(shù)

語(yǔ)音識(shí)別的信號(hào)處理流程如圖 1 所示。語(yǔ)音識(shí)別系統(tǒng)由語(yǔ)音前期預(yù)處理、語(yǔ)音信號(hào)特征參數(shù)提取、參考模型庫(kù)建模、模式匹配以及語(yǔ)音后處理五個(gè)部分組成 [1]。語(yǔ)音識(shí)別可分為如下四大階段 :

(1) 第一個(gè)階段先通過性能優(yōu)良的語(yǔ)音采集設(shè)備采集語(yǔ)音信號(hào),然后進(jìn)行相關(guān)預(yù)加重、分幀、加窗、端點(diǎn)檢測(cè)等預(yù)處理操作。

(2) 第二階段是聲學(xué)模型訓(xùn)練階段。提取語(yǔ)音庫(kù)中已知語(yǔ)義的語(yǔ)音信號(hào)特征參數(shù),將其作為模板存入?yún)⒖寄P蛶?kù)中。使用訓(xùn)練算法建立聲學(xué)模型,而聲學(xué)模型的訓(xùn)練過程也是建模過程,通過訓(xùn)練語(yǔ)音庫(kù)的特征參數(shù)訓(xùn)練聲學(xué)模型參數(shù) [2], 因此要設(shè)置合理的模型初始值。

(3) 第三階段是識(shí)別階段,將輸入語(yǔ)音的特征參數(shù)經(jīng)過一定的識(shí)別算法與訓(xùn)練好的參考模型庫(kù)中的特征參數(shù)進(jìn)行相似度對(duì)比,匹配相似度概率最高的即為輸入語(yǔ)音最終識(shí)別結(jié)果 [3]。

(4) 第四階段是語(yǔ)音后處理階段,確定當(dāng)前哪個(gè)詞語(yǔ)可以跟隨上一個(gè)已經(jīng)識(shí)別的詞,排除不可能的單詞,將最佳匹配結(jié)果語(yǔ)音信號(hào)進(jìn)行語(yǔ)言建模,匹配出文本語(yǔ)義。

基于智能語(yǔ)音的智能家居系統(tǒng)設(shè)計(jì)

2 語(yǔ)音信號(hào)的時(shí)域處理

在對(duì)語(yǔ)音信號(hào)分析前,要先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,包括端點(diǎn)檢測(cè)、預(yù)加重、加窗和分幀等技術(shù) [4]。


預(yù)加重采用一個(gè) 6 dB/ 倍頻的一階高通數(shù)字濾波器實(shí)現(xiàn), 其傳遞函數(shù)為 H(z)=1-μz-1,加窗可以讓一幀信號(hào)的幅度在兩端平滑的衰減漸變到零,以避免短時(shí)語(yǔ)音段邊緣的影響。但由于加窗削弱了語(yǔ)音邊緣的信號(hào),為了使相鄰幀連續(xù)不中斷,一般采用重疊分幀方法 [5]。

端點(diǎn)檢測(cè)技術(shù)的目的是檢測(cè)出有效語(yǔ)音信號(hào)的起始點(diǎn)和終止點(diǎn) [6],從而減少需要處理的數(shù)據(jù)量和運(yùn)算量,同時(shí)還能降低噪聲對(duì)語(yǔ)音識(shí)別系統(tǒng)的影響,一般采用雙門限端點(diǎn)檢測(cè)法。

3 語(yǔ)音信號(hào)的特征提取

語(yǔ)音信號(hào)提取的特征值應(yīng)該準(zhǔn)確、完全地包含語(yǔ)音信號(hào)的全部信息。同時(shí)提取能有效反映語(yǔ)音特性、減少語(yǔ)音信號(hào)中與識(shí)別無關(guān)的信息,減少識(shí)別數(shù)據(jù)量。本文分析了語(yǔ)音信號(hào)的三種特征參數(shù),即線性預(yù)測(cè)系數(shù)(LPC)、線性預(yù)測(cè)倒譜系數(shù)(LPCC)、梅爾頻率倒譜系數(shù)(MFCC)[7]。

3.1 線性預(yù)測(cè)系數(shù)(LPC)

線性預(yù)測(cè)的原理 :語(yǔ)音信號(hào) S(n)的值可由過去若干時(shí)刻的采樣值或其線性組合來逼近 [8]。在逼近過程中,逼近值與原始值之間的差值稱為預(yù)測(cè)誤差,當(dāng)預(yù)測(cè)誤差達(dá)到最小時(shí), 即預(yù)測(cè)效果最接近,也是模型建立最完美的值。可以推得, 線性預(yù)測(cè)系數(shù) ai 的值達(dá)到了收斂。線性預(yù)測(cè)方法得到的參數(shù)可以很好地反映語(yǔ)音信號(hào)的頻譜幅度。

3.2 線性預(yù)測(cè)倒譜系數(shù)(LPCC)

LPCC 可以將語(yǔ)音模型中的聲門激勵(lì)信號(hào)與聲道沖激響應(yīng)信號(hào)進(jìn)行分離,計(jì)算量小,實(shí)現(xiàn)相對(duì)簡(jiǎn)單,提高了特征參數(shù)的穩(wěn)定性 [9]。該值是對(duì)語(yǔ)音信號(hào)進(jìn)行 FFT 后再取對(duì)數(shù),求IFFT 后得到的。

3.3 梅爾頻率倒譜系數(shù)(MFCC)

Mel 頻率倒譜系數(shù)(MFCC)充分考慮了人耳聽覺的感知特性后進(jìn)行語(yǔ)音信號(hào)處理。MFCC 具有更好的識(shí)別性能[10], 語(yǔ)音信號(hào)中的能量主要集中在低頻部分,對(duì)人耳的聽覺特性模擬地更好,而人耳對(duì)低頻分量也更敏感。語(yǔ)音信號(hào)低頻部分的一個(gè)參數(shù)淡化了易受環(huán)境噪聲干擾的高頻部分,提高了語(yǔ)音識(shí)別系統(tǒng)的抗噪聲能力。

4 隱馬爾科夫模型 HMM

隱馬爾科夫過程是一個(gè)雙重隨機(jī)過程 :其一用于描述每幀語(yǔ)音信號(hào)的統(tǒng)計(jì)特性(可直接觀測(cè)到);其二用于描述每幀語(yǔ)音信號(hào)如何轉(zhuǎn)變到寫一個(gè)語(yǔ)音幀信號(hào)(隱含在觀察序列中)。隱馬爾可夫模型就像一個(gè)黑箱子,內(nèi)部狀態(tài)外部不可見,外界只能看到各個(gè)時(shí)刻的輸出值 [11]??捎^測(cè)部分是人的語(yǔ)音,而隱含部分則是人組織語(yǔ)言的大腦激勵(lì)信號(hào)。隱馬爾可夫模型可用 λ=(π,A,B)表示 [12]。

本文詳細(xì)分析了 HMM 模型三個(gè)基本問題的解決算法。假設(shè)已知可觀察狀態(tài)值序列 O=(O1,O2,…,OT)(T是語(yǔ)音信號(hào)的幀數(shù))和馬爾科夫模型參數(shù) λ=(π,A,B),計(jì)算可觀察序列的概率 P(O|λ)時(shí)一般使用向前 - 向后算法 [13]。

已知可觀察狀態(tài)值序列 O=(O1,O2,…,OT) 和模型 λ=(π, A,B),計(jì)算最有可能生成該可觀察序列的隱含狀態(tài)序列,通常使用 Viterbi 算法 [14]。

在已知可觀察狀態(tài)的序列 O=(O1,O2,…,OT) 的前提下,確定 HMM 的模型參數(shù) λ=(π,A,B),使得可觀察序列的概率 P(O|λ)最大,通常使用 Baum-Welch 算法 [15]。

5 智能家居系統(tǒng)實(shí)現(xiàn)

結(jié)合 Arduino 開發(fā)平臺(tái)實(shí)現(xiàn)智能家居模塊的交互系統(tǒng),對(duì)家居系統(tǒng)整體以及軟硬件需求進(jìn)行分析與總體設(shè)計(jì),實(shí)現(xiàn)通過語(yǔ)音控制家居設(shè)備的目標(biāo)。該系統(tǒng)具有燈光控制,光線以及溫度濕度檢測(cè)和危險(xiǎn)氣體警報(bào)功能。為了擁有更好的人機(jī)交互環(huán)境,本文系統(tǒng)還添加了語(yǔ)音播報(bào)功能。

調(diào)試并連接智能家居的軟硬件系統(tǒng),分別測(cè)試智能家居系統(tǒng)的語(yǔ)音識(shí)別率,以及相應(yīng)的語(yǔ)音命令能否實(shí)現(xiàn)對(duì)應(yīng)功能。在安靜的環(huán)境下,系統(tǒng)功能能夠全部實(shí)現(xiàn),測(cè)試非特定人 100 次的語(yǔ)音識(shí)別率均在 90% 以上。在有噪聲的環(huán)境下,系統(tǒng)功能均未實(shí)現(xiàn),測(cè)試非特定人 100 次的語(yǔ)音識(shí)別率均在50% 以下甚至更低。由實(shí)驗(yàn)結(jié)果可知,與安靜環(huán)境對(duì)比,噪聲環(huán)境下的語(yǔ)音識(shí)別效果大大降低,且長(zhǎng)語(yǔ)音命令的識(shí)別率同之前一樣低于安靜環(huán)境下的語(yǔ)音識(shí)別率。

智能家居系統(tǒng)框圖如圖 2 所示,系統(tǒng)測(cè)試實(shí)驗(yàn)見表 1所列。

基于智能語(yǔ)音的智能家居系統(tǒng)設(shè)計(jì)

6 結(jié) 語(yǔ)

本文主要對(duì)語(yǔ)音識(shí)別技術(shù)做了大致分析,比較了特征提取線性預(yù)測(cè)技術(shù)、線性預(yù)測(cè)倒譜系數(shù)以及梅爾頻率倒譜系數(shù)之間的優(yōu)缺點(diǎn)。詳細(xì)分析了隱馬爾科夫的建模過程以及相應(yīng)算法,結(jié)合 Arduino 開發(fā)平臺(tái),對(duì)智能家居系統(tǒng)做出簡(jiǎn)單設(shè)計(jì),實(shí)現(xiàn)了語(yǔ)音命令“開燈”“關(guān)燈”“溫度濕度檢測(cè)”“環(huán)境光線檢測(cè)”等操作,同時(shí)還采用危險(xiǎn)氣體警報(bào)對(duì)家居安防進(jìn)行布施。語(yǔ)音播報(bào)提供了良好的人機(jī)交互環(huán)境,通過智能家居各模塊功能語(yǔ)音識(shí)別測(cè)試可知,提高語(yǔ)音識(shí)別率不僅需要安靜的環(huán)境,還需要說標(biāo)準(zhǔn)的普通話。語(yǔ)音識(shí)別如何在有較大噪音的環(huán)境中進(jìn)行準(zhǔn)確識(shí)別是一道難關(guān),也是未來科研人的努力方向。


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉