日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 消費(fèi)電子 > 消費(fèi)電子
[導(dǎo)讀]引言基于內(nèi)容的音頻檢索指通過音頻特征分析,對不同音頻數(shù)據(jù)賦以不同語義,使具有相同語義的音頻在聽覺上保持相似。該技術(shù)在許多領(lǐng)域都有極大應(yīng)用價(jià)值。在檢索系統(tǒng)中一種常見情形是將安靜環(huán)境下訓(xùn)練的模型應(yīng)用于實(shí)際

引言

基于內(nèi)容的音頻檢索指通過音頻特征分析,對不同音頻數(shù)據(jù)賦以不同語義,使具有相同語義的音頻在聽覺上保持相似。該技術(shù)在許多領(lǐng)域都有極大應(yīng)用價(jià)值。在檢索系統(tǒng)中一種常見情形是將安靜環(huán)境下訓(xùn)練的模型應(yīng)用于實(shí)際有背景噪聲的環(huán)境。尤其在哼唱輸入的情況下,噪聲不可避免,因此噪聲背景環(huán)境中的音頻識別技術(shù)一直備受關(guān)注。本文給出一個(gè)將音頻增強(qiáng)和音頻檢索系統(tǒng)相連接的抗噪聲音頻檢索系統(tǒng),重點(diǎn)分析基于內(nèi)容的音頻檢索系統(tǒng)的前端抗噪技術(shù)。

2  系統(tǒng)平臺的建立

基于內(nèi)容的音頻檢索系統(tǒng)運(yùn)用多媒體信息處理技術(shù),結(jié)合人感知心理研究和模式識別技術(shù)實(shí)現(xiàn)音頻檢索,包括音頻分割、特征提取和索引檢索等關(guān)鍵步驟。在提交哼唱式音頻過程中不可避免地會受到來自周圍環(huán)境和傳輸媒介引入的噪聲、設(shè)備內(nèi)部電噪聲的干擾。這些干擾將使檢索系統(tǒng)的性能惡化。因此,必須對帶噪音頻進(jìn)行抗噪處理。音頻檢索系統(tǒng)首先是建立數(shù)據(jù)庫,對音頻數(shù)據(jù)進(jìn)行特征提取。音頻檢索主要采用哼唱查詢方式,用戶通過查詢界面哼入查詢信息,然后提交查詢。在進(jìn)行屬性特征提取前通過前端抗噪模塊增強(qiáng)哼唱語音。接著系統(tǒng)對哼唱音頻提取特征,然后檢索引擎對特征矢量進(jìn)行匹配,按相關(guān)性排序后通過查詢接口返回給用戶。圖1為抗噪聲檢索系統(tǒng)原理框圖。

3  音頻抗噪技術(shù)分析

3.1  語音增強(qiáng)算法分類

系統(tǒng)前端輸入信號通常是哼唱輸入,語音頻段可以采用語音增強(qiáng)技術(shù)。語音增強(qiáng)是指為了提高受噪聲污染的語音信號的質(zhì)量而對含噪語音所做的處理,主要用于從帶噪語音信號中提取純凈的原始音頻或原始語音參數(shù)。根據(jù)不同的標(biāo)準(zhǔn),語音增強(qiáng)算法有多種分類方法。

從信號輸入的通道數(shù)分為單通道的語音增強(qiáng)算法與多通道的語音增強(qiáng)算法。單通道語音系統(tǒng)下語音與噪聲同時(shí)存在于一個(gè)通道中,語音信息與噪聲信息必須從同一個(gè)信號中得出。常用方法包括譜減法、信號統(tǒng)計(jì)模型方法、聽覺掩蔽算法、維納濾波方法、信號子空間算法等。多通道語音增強(qiáng)算法則采用麥克風(fēng)陣列獲取信號數(shù)據(jù),它可充分利用陣列信號的信號源方向、說話人位置等空間特性,結(jié)合語音信號與噪聲的特征實(shí)現(xiàn)語音增強(qiáng)。代表性的算法有自適應(yīng)波束形成算法、結(jié)合波束形成與后濾波算法及各種基于信號子空間、統(tǒng)計(jì)模型算法等。

另一種分類方法是根據(jù)對語音信號處理方式的不同,將語音增強(qiáng)算法分為時(shí)域語音增強(qiáng)算法和變換域語音增強(qiáng)算法兩大類。時(shí)域語音增強(qiáng)是在時(shí)間域直接處理帶噪語音來恢復(fù)純凈語音,利用語音信號在時(shí)域中的短時(shí)平穩(wěn)特性、相關(guān)特性等來研究具有針對性的噪聲消除技術(shù),其代表性算法有最大后驗(yàn)概率估計(jì)法、卡爾曼濾波法、梳狀濾波器法、子空間的方法、自適應(yīng)噪聲抵消算法、語音生成模型等。變換域語音增強(qiáng)需一個(gè)適當(dāng)?shù)淖儞Q將語音信號轉(zhuǎn)換到變換域中,然后針對變換域中的帶噪語音分量的特性設(shè)計(jì)算法恢復(fù)純凈語音分量,最后通過相應(yīng)的反變換獲得純凈語音信號在時(shí)域中的估計(jì)。其常用變換有離散傅里葉變換、離散余弦變換及K-L變換和小波變換等,代表性算法有譜減法、維納濾波法、短時(shí)譜幅度的MMSE估計(jì)、自適應(yīng)濾波法等、聽覺掩蔽效應(yīng)增強(qiáng)算法,小波變換算法、基于頻域盲源分離的語音增強(qiáng)技術(shù)等。還有一些新方法,如神經(jīng)網(wǎng)絡(luò)、分形理論等。

3.2 系統(tǒng)抗噪算法的確定

在基于內(nèi)容的音頻檢索系統(tǒng)中,用戶通過哼唱等方式輸入檢索信息,基于單麥克風(fēng)輸入的單通道語音增強(qiáng)算法是一種簡便、實(shí)用的形式。變換域語音增強(qiáng)算法可充分利用變換域中語音與背景噪聲較其在時(shí)域中更為顯著的特征區(qū)別,且能有效消除語音信號在時(shí)域中存在的相關(guān)特性,因此其對帶噪語音的增強(qiáng)效果要優(yōu)于時(shí)域語音增強(qiáng)算法。因此系統(tǒng)適合采用譜減法、聽覺掩蔽算法、維納濾波方法、信號子空間算法。

維納濾波法能改善平穩(wěn)段的譜估計(jì),殘留噪聲類似于白噪聲,降低音樂噪聲的干擾,但算法復(fù)雜度較大,適用于對實(shí)時(shí)性要求不高的場合。聽覺掩蔽算法可減少不必要的語音失真,實(shí)際應(yīng)用中常只能用帶噪語音估計(jì)掩蔽閾值,則估計(jì)結(jié)果誤差較大,對噪聲估計(jì)要求較高。信號子空間算法能有效去除帶噪語音中的背景噪聲,使語音的質(zhì)量和可懂度都有較大提高,但計(jì)算量較大。譜減法算法簡單,算法復(fù)雜度低,實(shí)現(xiàn)較容易,能夠最大程度上滿足實(shí)時(shí)性要求,但會引入較大音樂噪聲,適合在平穩(wěn)噪聲環(huán)境和對實(shí)時(shí)性要求較高的場合使用。由于本系統(tǒng)為實(shí)時(shí)檢索系統(tǒng),對實(shí)時(shí)性和快速性的要求較高,因此這里采用譜減法。

4  基于譜減法的減噪技術(shù)

4.1  譜減法的基本原理

譜減法就是在頻域?qū)⒃肼暤念l譜分量從帶噪語音信號的頻譜中減去。其基本思想是:在假定加性高斯噪聲與短時(shí)平穩(wěn)的語音信號獨(dú)立的條件下,從帶噪語音信號的功率譜中減去噪聲的功率譜,從而得到增強(qiáng)后較為純凈的語音頻譜。其基本原理框圖如圖2所示,圖1中,s(n)表示純凈語音,d(n)表示加性噪聲,r(n)=s(n)+d(n)表示帶噪語音信號,Yk和Sk(k=0,1,2…)分別表示帶噪語音信號和純凈語音的頻譜系數(shù),λn(k)表示噪聲的功率譜系數(shù)。

式中,α和β為參數(shù)。當(dāng)α=1,β=1時(shí),為幅度譜減法形式。當(dāng)α=2,β=1時(shí),為功率譜減法形式。

該譜減法稱為傳統(tǒng)譜相減法。它基于人耳對聲音相位不敏感特性,從含噪語音中減去估計(jì)噪聲而達(dá)到語音增強(qiáng)的目的,直觀簡單,但容易產(chǎn)生“音樂噪聲”,因此實(shí)際應(yīng)用中常采用譜減法的改進(jìn)算法。

4.2  譜減法的改進(jìn)算法

用功率譜減法處理語音信號后,在頻域中仍殘留有噪聲,要濾除或減少這些噪聲,可適當(dāng)?shù)亩鄿p去噪聲分量,使殘留噪聲在幅值上減少,從而降低噪聲的影響,即過減法。此時(shí)式(1)取β>1,這樣語音失真可能會增大。因此,通過噪聲估計(jì)來調(diào)整和確定β的取值。β值的取值原則:對信噪比低的帶噪語音,噪聲的方差大,β可適當(dāng)大些;對信噪比高的帶噪語音,β取值則可小些。因?yàn)樵肼曌V的估計(jì)是平均值,所以當(dāng)前幀的噪聲譜實(shí)際上與估計(jì)值有偏差,因此,經(jīng)譜減法計(jì)算的語音譜值可能是負(fù)值,一般則設(shè)結(jié)果設(shè)為零,即采用半波整流法,還可采用殘余噪聲衰減法,噪聲殘留的幅值介于零和整個(gè)非語音活動期最大噪聲殘留幅值之間,由于殘留噪聲的隨機(jī)性,在每個(gè)頻點(diǎn)上其振幅值隨不同分析幀而隨機(jī)波動,因此在給定頻點(diǎn)上通過用相鄰幀的頻點(diǎn)振幅最小值代替當(dāng)前幀的振幅而壓縮殘留噪聲。這樣就形成改進(jìn)型譜減法的系統(tǒng),能有效實(shí)現(xiàn)前端減噪。

5  結(jié)束語

基于內(nèi)容的音頻檢索技術(shù)適應(yīng)性更強(qiáng),具有廣泛的應(yīng)用價(jià)值,具有噪聲魯棒性的檢索系統(tǒng)在實(shí)際應(yīng)用中不可或缺。本文給出一個(gè)將音頻增強(qiáng)和音頻檢索系統(tǒng)級聯(lián)的抗噪聲音頻檢索系統(tǒng),從不同角度分析語音增強(qiáng)算法,并通過比較選取譜減法作為基于內(nèi)容的音頻檢索系統(tǒng)的前端抗噪技術(shù),同時(shí)給出譜減法的改進(jìn)算法。

 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

美國紐約州阿蒙克2022年10月20日 /美通社/ -- IBM(NYSE: IBM)發(fā)布 2022 年第三季度業(yè)績報(bào)告。 IBM 董事長兼首席執(zhí)行官 Arvind Kri...

關(guān)鍵字: IBM 軟件 BSP 云平臺

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險(xiǎn)積極籌備個(gè)人養(yǎng)老金的產(chǎn)品設(shè)計(jì)和系統(tǒng)開發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動商業(yè)養(yǎng)老保險(xiǎn)、個(gè)人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險(xiǎn)等產(chǎn)品供給。 搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字: 溫度 BSP 東風(fēng) 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元,承載著生存與活動的最基本功能。而對于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對于空間和生活深層關(guān)系的思考,同時(shí)也塑造著人與空間的新型連接...

關(guān)鍵字: 溫度 BSP 智能化 進(jìn)程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績預(yù)告。今年前三季度,公司預(yù)計(jì)實(shí)現(xiàn)營業(yè)收入7.54億元至8.33億元,同比增長60.24%至77.03%;歸母凈利潤預(yù)計(jì)為1.73億...

關(guān)鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報(bào)告》,報(bào)告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...

關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團(tuán)成立60周年的紀(jì)念日。趁著首都銀行集團(tuán)成立60周年與首都銀行(中國)在華深耕經(jīng)營12年的“大日子”,圍繞作為外資金融機(jī)構(gòu)對在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字: 數(shù)字化 BSP 供應(yīng)鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運(yùn)國際物流有限公司(Nipp...

關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國進(jìn)出口商品交易會("廣交會")于"云端"開幕。本屆廣交會上高新技術(shù)企業(yè)云集,展出的智能產(chǎn)品超過140,...

關(guān)鍵字: 中國智造 BSP 手機(jī) CAN

要問機(jī)器人公司哪家強(qiáng),波士頓動力絕對是其中的佼佼者。近來年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機(jī)器人會后空翻,自主爬樓梯等。這不,波士頓動力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻,表演的機(jī)器人包括...

關(guān)鍵字: 機(jī)器人 BSP 工業(yè)機(jī)器人 現(xiàn)代汽車

消費(fèi)電子

95976 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉