日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 消費(fèi)電子 > 音視頻及家電
[導(dǎo)讀] (文章來(lái)源:最極客) ? ? ?? 目前,語(yǔ)音識(shí)別技術(shù)基本成型,處于較為成熟的狀態(tài)。例如在語(yǔ)音識(shí)別的Switchboard任務(wù)方面,最新的IBM已經(jīng)能將錯(cuò)誤率控制在5.5%之下,有經(jīng)驗(yàn)的轉(zhuǎn)寫(xiě)

(文章來(lái)源:最極客)
? ? ?? 目前,語(yǔ)音識(shí)別技術(shù)基本成型,處于較為成熟的狀態(tài)。例如在語(yǔ)音識(shí)別的Switchboard任務(wù)方面,最新的IBM已經(jīng)能將錯(cuò)誤率控制在5.5%之下,有經(jīng)驗(yàn)的轉(zhuǎn)寫(xiě)人員在這個(gè)任務(wù)中可以達(dá)到4%之下。因此,這類安靜環(huán)境下的語(yǔ)音識(shí)別系統(tǒng)已經(jīng)近似于人類水平。

目前的進(jìn)展多處于應(yīng)用層面。語(yǔ)音合成技術(shù)被應(yīng)用在更多領(lǐng)域,而且從原始的機(jī)器聲音已經(jīng)進(jìn)化到能夠發(fā)出自然人的聲音的程度,甚至現(xiàn)在出現(xiàn)各種明星聲音的語(yǔ)音助手。在語(yǔ)音識(shí)別方面,市面上已經(jīng)出現(xiàn)了針對(duì)方言口音的語(yǔ)音軟件。在語(yǔ)義理解方面,聊天機(jī)器人正處在迅速進(jìn)化的過(guò)程中,甚至能夠講笑話。在語(yǔ)音喚醒方面,智能音箱等產(chǎn)品大量出現(xiàn)。雖然在這些應(yīng)用中,許多產(chǎn)品并沒(méi)有達(dá)到高層智能的水平,但也給語(yǔ)音識(shí)別技術(shù)指明了方向。

實(shí)際上,語(yǔ)音識(shí)別技術(shù)在發(fā)音規(guī)范且背景噪音可控的環(huán)境下,在很多年前就能夠進(jìn)入應(yīng)用階段。不少尖端系統(tǒng)在工程水平很高的情況下還可以做的更好,如早期的Siri及DARPA項(xiàng)目語(yǔ)音識(shí)別評(píng)測(cè)中的各種參賽系統(tǒng)。但在飛速進(jìn)步的過(guò)程中,語(yǔ)音識(shí)別仍無(wú)法避免遇到某些瓶頸。

在強(qiáng)噪聲干擾的情況下,目前的語(yǔ)音識(shí)別系統(tǒng)還很難達(dá)到實(shí)用化要求。在自然發(fā)音、噪聲、口音等復(fù)雜條件下,語(yǔ)音識(shí)別的準(zhǔn)確率明顯下降。此外,語(yǔ)音的訓(xùn)練和測(cè)試用數(shù)據(jù)的匹配也并不十分契合。想要解決環(huán)境復(fù)雜的問(wèn)題,除了高超的技術(shù)之外,聲學(xué)模型自適應(yīng)等也是不錯(cuò)的方式。對(duì)于匹配問(wèn)題則可以更加偏向研究方向,對(duì)語(yǔ)音本質(zhì)進(jìn)行更為深入的理解。

例如在人類的聽(tīng)覺(jué)系統(tǒng)中,存在一種“雞尾酒會(huì)效應(yīng)”:人類在具有背景噪聲干擾的情況下,依然能夠?qū)⒆⒁饬性谀骋粋€(gè)人的談話上??梢詫⑷祟惵?tīng)覺(jué)系統(tǒng)的這種功能賦予語(yǔ)音識(shí)別系統(tǒng),但就目前的技術(shù)而言依然很難實(shí)現(xiàn)。同時(shí),遠(yuǎn)場(chǎng)識(shí)別也依然是個(gè)充滿挑戰(zhàn)性的問(wèn)題。當(dāng)前,語(yǔ)音識(shí)別的遠(yuǎn)場(chǎng)錯(cuò)誤率是近場(chǎng)的兩倍左右。因此,解決遠(yuǎn)場(chǎng)及強(qiáng)噪聲干擾情況下的語(yǔ)音識(shí)別是當(dāng)前的一個(gè)有待進(jìn)一步研究的問(wèn)題。

對(duì)于這個(gè)問(wèn)題,目前的主要解決方法是語(yǔ)音識(shí)別和麥克風(fēng)陣列相結(jié)合。通過(guò)陣列信號(hào)處理技術(shù),增強(qiáng)多通道語(yǔ)音技術(shù),而后利用深度學(xué)習(xí)的方法進(jìn)行聲學(xué)建模。當(dāng)然,這種方案有待于進(jìn)步和優(yōu)化,并且要考慮多方面的問(wèn)題。如怎樣將陣列信號(hào)處理技術(shù)和深度學(xué)習(xí)方法相結(jié)合,利用陣列信號(hào)處理的相關(guān)知識(shí)指導(dǎo)深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì),以便直接從多通道語(yǔ)音信號(hào)中學(xué)習(xí)多通道語(yǔ)音增強(qiáng)方法,而后和后端聲學(xué)模型聯(lián)合優(yōu)化等。

另外,個(gè)體發(fā)音以及用詞習(xí)慣都存在差異性,所以如何使得語(yǔ)音識(shí)別更加智能化也是一個(gè)問(wèn)題??梢钥吹?,語(yǔ)音識(shí)別已經(jīng)走到一個(gè)相對(duì)成熟的發(fā)展階段,未來(lái)也會(huì)在應(yīng)用級(jí)市場(chǎng)普及,但在發(fā)展過(guò)程中仍然存在許多瓶頸。生物技術(shù)識(shí)別方式先進(jìn)而便捷,但人們不免擔(dān)心其中所涉及到的隱私問(wèn)題。

當(dāng)然,目前語(yǔ)音識(shí)別技術(shù)并未大規(guī)模普及,但在那一天到來(lái)之前,人們需要彌補(bǔ)語(yǔ)音識(shí)別技術(shù)中存在的瓶頸。其實(shí)對(duì)于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)而言,一切都只是時(shí)間問(wèn)題。足夠的語(yǔ)音數(shù)據(jù)加上足夠的訓(xùn)練,語(yǔ)音識(shí)別技術(shù)的發(fā)展還是值得期待的。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀
關(guān)閉