千錘百煉增強(qiáng)型靈云語(yǔ)音識(shí)別讓車載語(yǔ)音交互更流暢

時(shí)間：2020-08-27 08:09:01

關(guān)鍵字：語(yǔ)音識(shí)別車聯(lián)網(wǎng)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 　　伴隨著車聯(lián)網(wǎng)的快速發(fā)展，為了進(jìn)一步提升智能車載的語(yǔ)音交互體驗(yàn)，捷通華聲推出了增強(qiáng)型靈云語(yǔ)音識(shí)別技術(shù)。該技術(shù)采用了捷通華聲最新研發(fā)的針對(duì)抗噪的深度學(xué)習(xí)算法，通過(guò)對(duì)行車環(huán)境噪音信息進(jìn)行建模，有效

　　伴隨著車聯(lián)網(wǎng)的快速發(fā)展，為了進(jìn)一步提升智能車載的語(yǔ)音交互體驗(yàn)，捷通華聲推出了增強(qiáng)型靈云語(yǔ)音識(shí)別技術(shù)。該技術(shù)采用了捷通華聲最新研發(fā)的針對(duì)抗噪的深度學(xué)習(xí)算法，通過(guò)對(duì)行車環(huán)境噪音信息進(jìn)行建模，有效處理車外胎噪、風(fēng)噪，車內(nèi)空調(diào)聲、引擎聲等行車環(huán)境噪音，并利用大量實(shí)際行車噪音數(shù)據(jù)，對(duì)算法進(jìn)行了進(jìn)一步訓(xùn)練和優(yōu)化，擁有極強(qiáng)的抗噪能力，即使在車速80km/h的情況下，也能具有極高的語(yǔ)音識(shí)別率。

　　捷通華聲表示，增強(qiáng)型靈云語(yǔ)音識(shí)別技術(shù)已整合到靈云遠(yuǎn)場(chǎng)語(yǔ)音交互解決方案中，通過(guò)與多麥克風(fēng)陣列完美結(jié)合，可“過(guò)濾”掉絕大多數(shù)車載環(huán)境噪音，實(shí)現(xiàn)遠(yuǎn)距離的語(yǔ)音識(shí)別，經(jīng)過(guò)實(shí)踐測(cè)試，其極高的識(shí)別率完全滿足了行車環(huán)境對(duì)遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別的要求，實(shí)現(xiàn)人對(duì)智能車載設(shè)備流暢、自然的語(yǔ)音控制。同時(shí)，捷通華聲與國(guó)內(nèi)廣大智能車載設(shè)備廠商、解決方案提供商、軟件開發(fā)商等行業(yè)伙伴精誠(chéng)合作，堅(jiān)持“合作共贏”的發(fā)展理念，通過(guò)為合作伙伴提供麥克風(fēng)陣列、云+端語(yǔ)音交互、內(nèi)容服務(wù)等軟硬件一體的車載語(yǔ)音解決方案，共同推動(dòng)智能語(yǔ)音交互技術(shù)在車載領(lǐng)域的普及化應(yīng)用！

　　增強(qiáng)型靈云語(yǔ)音識(shí)別+麥克風(fēng)陣列輕松應(yīng)對(duì)行車環(huán)境噪音

　　長(zhǎng)期以來(lái)，語(yǔ)音交互技術(shù)受行車環(huán)境的背景噪音、回聲、混響等多重復(fù)雜因素影響，駕駛者必須要近距離對(duì)著麥克風(fēng)“咬耳朵”講話，且識(shí)別率較低，無(wú)法滿足駕車途中車載設(shè)備識(shí)別司機(jī)命令的要求，嚴(yán)重制約了語(yǔ)音交互技術(shù)在智能車載領(lǐng)域的應(yīng)用。

　　捷通華聲靈云遠(yuǎn)場(chǎng)語(yǔ)音交互解決方案能很好的解決這一問(wèn)題，該方案包含了多麥克風(fēng)陣列與增強(qiáng)型語(yǔ)音識(shí)別技術(shù)。多麥克風(fēng)陣列能精準(zhǔn)拾取說(shuō)話人的語(yǔ)音信號(hào)，抑制噪聲和混響，增強(qiáng)型語(yǔ)音識(shí)別技術(shù)，對(duì)殘余的車載噪音進(jìn)行進(jìn)一步處理，大幅提高行車噪音環(huán)境中的語(yǔ)音識(shí)別率。

　　多麥克風(fēng)陣列能根據(jù)聲音到達(dá)的時(shí)間差，準(zhǔn)確計(jì)算出聲源與陣列模塊之間的角度和距離，實(shí)現(xiàn)對(duì)目標(biāo)聲源的定位與跟蹤，并利用麥克風(fēng)陣列的空域?yàn)V波特性，在目標(biāo)說(shuō)話人方向形成拾音波束，僅拾取波束的信號(hào)，抑制波束之外的噪聲和混響（反射聲），同時(shí)，通過(guò)回聲消除技術(shù)，過(guò)濾掉音頻設(shè)備發(fā)出的聲音，讓語(yǔ)音識(shí)別引擎獲取的用戶聲音更為清晰純凈。

　　由于麥克風(fēng)陣列會(huì)不可避免的拾取部分行車環(huán)境噪音，影響語(yǔ)音識(shí)別率，對(duì)此，捷通華聲綜合考慮車內(nèi)物理結(jié)構(gòu)和車速變化，對(duì)駕車過(guò)程中的車外胎噪、風(fēng)噪，車內(nèi)空調(diào)聲、引擎聲等車載環(huán)境噪音信息進(jìn)行建模，并用大量的實(shí)際行車噪音數(shù)據(jù)進(jìn)行訓(xùn)練，進(jìn)一步優(yōu)化語(yǔ)音識(shí)別引擎，推出了針對(duì)智能車載的增強(qiáng)型靈云語(yǔ)音識(shí)別技術(shù)，輕松應(yīng)對(duì)常見車載環(huán)境噪音。該技術(shù)采用深度神經(jīng)網(wǎng)絡(luò)算法（DNN）算法，可在用戶的使用過(guò)程中，通過(guò)利用積累的語(yǔ)音數(shù)據(jù)來(lái)訓(xùn)練、優(yōu)化算法，不斷提升語(yǔ)音識(shí)別率。通過(guò)這一系列的技術(shù)，讓車載噪音環(huán)境中的語(yǔ)音識(shí)別率大幅提高，充分滿足實(shí)際行車過(guò)程中人機(jī)交互對(duì)語(yǔ)音識(shí)別技術(shù)的要求。

　　增強(qiáng)型語(yǔ)音識(shí)別讓語(yǔ)音交互真正滿足司機(jī)需求

　　融合了增強(qiáng)型靈云語(yǔ)音識(shí)別技術(shù)的靈云遠(yuǎn)場(chǎng)語(yǔ)音交互解決方案，為合作伙伴提供麥克風(fēng)陣列、云+端語(yǔ)音交互、內(nèi)容服務(wù)等軟硬件一體的車載語(yǔ)音解決方案。該方案對(duì)外提供統(tǒng)一接口，可快速建立語(yǔ)音命令與車載系統(tǒng)以及各種應(yīng)用之間的連接，搭配開放的服務(wù)擴(kuò)展、靈活的能力支持，讓智能車載具備語(yǔ)音喚醒、聲源定向、遠(yuǎn)場(chǎng)降噪、回聲消除、語(yǔ)音打斷、語(yǔ)音糾錯(cuò)、多輪對(duì)話等功能，打造“能聽會(huì)說(shuō)、能理解、會(huì)思考”的智能車載設(shè)備，徹底打破車載設(shè)備應(yīng)用語(yǔ)音交互技術(shù)的產(chǎn)業(yè)瓶頸，真正實(shí)現(xiàn)自然、流暢的人機(jī)語(yǔ)音交互。

　　在駕車過(guò)程中，當(dāng)司機(jī)被堵車、等待、紅燈等煩擾時(shí)，只要隨口說(shuō)出想聽的音樂(lè)、歌曲，車載設(shè)備便會(huì)自動(dòng)檢索并播放音樂(lè)，緩解司機(jī)等待的焦躁情緒；當(dāng)有電話打進(jìn)來(lái)，而司機(jī)正在開車時(shí)，只需說(shuō)出“接聽”，即可接通電話，真正實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”，再也不必在開車過(guò)程中用手“按啊按、找啊找”，把司機(jī)的雙手和眼睛還給駕駛，保證行車安全。

　　靈云遠(yuǎn)場(chǎng)語(yǔ)音交互解決方案在智能車載領(lǐng)域，已全面支持打電話、收發(fā)短信、聽音樂(lè)、聽廣播、地圖導(dǎo)航、POI、車況查詢、天氣查詢、服務(wù)查詢、設(shè)備控制、交通制度問(wèn)答等多種功能，并為用戶免費(fèi)提供天氣、交通、新聞、故事、股票、音樂(lè)、火車、航班、餐飲、酒店等日常生活常用的30多種信息與內(nèi)容服務(wù)，充分滿足車載場(chǎng)景下司機(jī)的各種需求。同時(shí)，靈云遠(yuǎn)場(chǎng)語(yǔ)音交互解決方案支持隨時(shí)打斷，只聽司機(jī)真正想表達(dá)的信息，并通過(guò)語(yǔ)音糾錯(cuò)和多輪對(duì)話，讓語(yǔ)音交互更加流暢、自然，真正滿足司機(jī)的需求。

　　捷通華聲堅(jiān)持合作共贏與廣大合作伙伴共享產(chǎn)業(yè)機(jī)遇

　　增強(qiáng)型靈云語(yǔ)音識(shí)別技術(shù)源自于捷通華聲于2011年推出的首個(gè)全方位人工智能開放平臺(tái)——靈云平臺(tái)（hcicloud.com），歷經(jīng)四年發(fā)展，靈云平臺(tái)已成為國(guó)內(nèi)提供人工智能能力最多、服務(wù)用戶最廣的人工智能開放平臺(tái)。靈云平臺(tái)自推出以來(lái)面向產(chǎn)業(yè)全面開放，包括個(gè)人開發(fā)者在內(nèi)的所有合作伙伴，都可以通過(guò)靈云平臺(tái)獲取智能語(yǔ)音、智能圖像、智能語(yǔ)義、生物特征等技術(shù)能力。

　　伴隨著IOT的快速發(fā)展，2014年，為讓國(guó)內(nèi)智能車載，以及智能家居、家電、機(jī)器人等終端設(shè)備廠商、集成商、開發(fā)商更方便地使用靈云平臺(tái)（hcicloud.com）全方位人工智能能力，捷通華聲推出了企業(yè)級(jí)開發(fā)商專用的靈云智能終端交互方案：靈云種子。靈云種子全面整合了靈云平臺(tái)多項(xiàng)人工智能技術(shù)能力，包括靈云語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解、聲紋識(shí)別、人臉識(shí)別、指紋識(shí)別、光學(xué)字符識(shí)別等能力，并為開發(fā)商提供簡(jiǎn)單易用的開發(fā)接口。開發(fā)商通過(guò)應(yīng)用靈云種子，結(jié)合多麥克風(fēng)陣列模塊，可以輕松實(shí)現(xiàn)智能語(yǔ)音交互、語(yǔ)音喚醒、語(yǔ)音導(dǎo)航、文字與證照?qǐng)D像識(shí)別、聲紋解鎖、人臉識(shí)別等多種人機(jī)交互功能，全方位、多角度滿足車載、家居、家電、機(jī)器人等終端設(shè)備對(duì)人工智能技術(shù)能力多樣化的市場(chǎng)需求。

　　一花開放不是春，捷通華聲將堅(jiān)持 “合作共贏”的發(fā)展理念，與廣大合作伙伴共同分享人工智能產(chǎn)業(yè)機(jī)遇，共同創(chuàng)建良好的人工智能產(chǎn)業(yè)生態(tài)。為更好服務(wù)全國(guó)智能終端設(shè)備合作伙伴，捷通華聲將進(jìn)一步加快在全國(guó)各地建立分公司與辦事處的進(jìn)程，比如在中國(guó)華南地區(qū)，智能車載、智能家居、機(jī)器人開發(fā)與生產(chǎn)廠商云集，并擁有創(chuàng)新力強(qiáng)、科技水平高等獨(dú)特優(yōu)勢(shì)。為做好合作伙伴的技術(shù)支持，2015年捷通華聲相繼在深圳、廈門等地成立了分公司，為合作伙伴提供更及時(shí)、更完善的技術(shù)支持。

　　未來(lái)發(fā)展，捷通華聲將繼續(xù)以清華大學(xué)人工智能研究力量為依托，更加專注智能語(yǔ)音等人工智能技術(shù)研究與產(chǎn)業(yè)化的推廣與應(yīng)用，通過(guò)與產(chǎn)業(yè)內(nèi)合作伙伴的精誠(chéng)合作，共同推動(dòng)中國(guó)智能終端設(shè)備全面服務(wù)社會(huì)大眾，共同加快智能化生活時(shí)代到來(lái)的步伐！

千錘百煉 增強(qiáng)型靈云語(yǔ)音識(shí)別讓車載語(yǔ)音交互更流暢

千錘百煉增強(qiáng)型靈云語(yǔ)音識(shí)別讓車載語(yǔ)音交互更流暢