日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 消費電子 > 音頻技術(shù)
[導(dǎo)讀]   開發(fā)基于自然語言的語音識別系統(tǒng)面臨許多技術(shù)挑戰(zhàn),包括使用精確的語音識別引擎將機器聽到的內(nèi)容翻譯成文字—以及一個綜合的自然語言處理器,它能判斷所說內(nèi)容的意思或意圖,然后返回一個有意

  開發(fā)基于自然語言的語音識別系統(tǒng)面臨許多技術(shù)挑戰(zhàn),包括使用精確的語音識別引擎將機器聽到的內(nèi)容翻譯成文字—以及一個綜合的自然語言處理器,它能判斷所說內(nèi)容的意思或意圖,然后返回一個有意義的響應(yīng)或動作。這些課題已經(jīng)被廣泛研究幾十年了,這里不作過多討論。本文主要討論在遠場語音接口系統(tǒng)中經(jīng)常被忽視但同樣很重要的技術(shù)性挑戰(zhàn):在語音到達語音識別引擎之前的語音預(yù)處理。

  即使是最現(xiàn)代的語音識別引擎要想運轉(zhuǎn)良好也有一個基本的要求—輸入到該引擎的必須是語音。雖然對遠場語音接口系統(tǒng)來說這似乎是顯而易見的要求,但它卻是最具挑戰(zhàn)性的要求之一。這里的“遠場”指的是用戶話音距產(chǎn)品麥克風(fēng)的距離超過半米的系統(tǒng)。舉例來說,靠近用戶臉部的智能手機形成的是一種“近場”用例,但對著一臂之長的PC機或平板電腦講話或隔著房間對電視機、立體聲系統(tǒng)、燈光開關(guān)、自動調(diào)溫器或智能家庭控制器講話ADC都算作“遠場”用例。

  近場和遠場用例之間存在著許多重要的差別,這些差別產(chǎn)生了在近場系統(tǒng)中沒有但在遠場系統(tǒng)中十分艱巨的技術(shù)性挑戰(zhàn)。

  1.大動態(tài)范圍:在遠場系統(tǒng)中,用戶語音可能非常低,因為他/她與產(chǎn)品麥克風(fēng)有數(shù)米距離,但干擾可能非常大,比如在受語音控制的揚聲器系統(tǒng)中有音樂回放的場合。

  2.低信噪比(SNR)、低直接路徑與混響路徑比(DRR)以及未知方向的語音和噪聲:遠場系統(tǒng)中的語音噪聲比要比近場系統(tǒng)中的小得多。隨著用戶不斷遠離產(chǎn)品的麥克風(fēng),語音電平會越來越小,而背景噪聲電平保持不變。

  同樣,從用戶嘴巴到麥克風(fēng)的間接路徑——從沿途的墻體和窗戶等表面的反射路徑與從用戶到麥克風(fēng)的直接路徑相比可能有很顯著的功率(即低的DRR)。在使用傳統(tǒng)的語音處理技術(shù)和語音識別引擎時這種混響效應(yīng)會造成很大的問題。

  最后,在遠場系統(tǒng)中,用戶語音相對于麥克風(fēng)的方向以及噪聲相對于麥克風(fēng)的方向都是未知的。在典型應(yīng)用場合,噪聲甚至與用戶語音來自相同的方向。

  3.全雙工話音交互:在許多遠場系統(tǒng)中,當用戶對著產(chǎn)品講話時,產(chǎn)品的揚聲器中可能正在播放音頻內(nèi)容,如音樂、電影或話音提示。這時需要使用一個全雙工的回聲消除器,以便在聆聽用戶語音的同時抵消掉產(chǎn)品的回放輸出聲。在回聲消除器并不完全了解回放內(nèi)容的系統(tǒng)中情況就更加復(fù)雜了。

  在這些情況下,實現(xiàn)一個依然能夠良好拾取語音的系統(tǒng)是一項極具挑戰(zhàn)性的任務(wù)。本文將介紹傳統(tǒng)方法為何無法在這些遠場條件下提供可接受性能的原因,然后提出了能以極具成本效益的方法提供卓越遠場性能的一種解決方案。

  大動態(tài)范圍

  用于智能家庭設(shè)備的語音捕獲系統(tǒng)需要支持大信號動態(tài)范圍,從輕聲細語到響亮的音頻內(nèi)容回放。對于與用戶距離大概在0.5米至3米范圍內(nèi)的設(shè)備來說,設(shè)備麥克風(fēng)處的語音電平范圍大概在75dB至44dB SPL。對于體積不大的音頻回放設(shè)備來說,回放內(nèi)容在設(shè)備麥克風(fēng)處的SPL電平可能接近95dB。這種典型和極具挑戰(zhàn)性的用例對設(shè)備中的麥克風(fēng)和模數(shù)轉(zhuǎn)換器(ADC)的選型有很大的影響。

  對于遠場應(yīng)用來說,選擇具有高信噪比值的麥克風(fēng)非常重要。如上所述,目標語音信號的SPL 電平可能低至44dB。對于94dB SPL的1kHz音來說,如果使用信噪比(SNR)為66dB的麥克風(fēng),等效的本底噪聲為28dB SPL,那么最差情況下的語音與麥克風(fēng)自身噪聲之比為16dB。如果選擇信噪比為55dB的麥克風(fēng),那么語音與麥克風(fēng)自身噪聲之比可能低至5dB!

  ADC內(nèi)部的本底噪聲也很重要,因為如果應(yīng)用中的ADC動態(tài)范圍不夠的話,還會造成信號飽和。

  圖 1顯示了兩種ADC的輸入?yún)⒖荚肼?,它們都是麥克風(fēng)增強設(shè)置值的函數(shù)。紅線顯示的是動態(tài)范圍大約是96dB的18位ADC性能,藍線顯示的是動態(tài)范圍大約為106dB的24位ADC性能。作為參考,灰線顯示的是信噪比為66dB、靈敏度為-43dBV/Pascal的麥克風(fēng)自身噪聲電平。

  

  圖1:麥克風(fēng)自身的噪聲和來自ADC的噪聲將疊加在一起形成系統(tǒng)總的本底噪聲。

  圖 2和圖3顯示了分別使用96dB動態(tài)范圍和106dB動態(tài)范圍的ADC時系統(tǒng)的屬性。106dB ADC可以提供更低的本底噪聲和更高的飽和點。合理的設(shè)置是針對96dB ADC使用24dB的麥克風(fēng)增強值、針對106dB ADC使用12dB的麥克風(fēng)增強值。在本例中,使用106dB ADC時的本底噪聲要低2dB,飽和點要高12dB。本底噪聲低2dB對于拾取遠場條件中的語音來說尤其重要。

  

  圖2:這張表顯示了使用96dB ADC時的系統(tǒng)屬性。

  

  圖3:這張表顯示了使用106dB ADC時的系統(tǒng)屬性。

  考慮到峰值內(nèi)容和諧振等因素,由于回聲而在麥克風(fēng)處產(chǎn)生的SPL電平可能達到96dB甚至更高。因此對于具有大聲回放而且體積不大的設(shè)備來說,在使用 96dB或者更低動態(tài)范圍的ADC時飽和問題很常見。當在實際系統(tǒng)中遇到這些問題時,唯一的解決方案通常是進一步降低麥克風(fēng)的增強值,但這樣做的同時會抬高本底噪聲。在這個例子中,麥克風(fēng)增強值需要減小到12dB。然而,與106dB ADC相比,這樣做將使本底噪聲高出4.3dB。因此我們可以知道,對遠場產(chǎn)品來說首選的解決方案是使用具有高信噪比的麥克風(fēng)和106dB或更高動態(tài)范圍的ADC。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉