你家里有智能語音產(chǎn)品嗎
智能語音語義技術(shù)主要研究人機(jī)之間語音信息的處理問題。簡單來說,就是讓計(jì)算機(jī)、智能設(shè)備、家用電器等通過對(duì)語音進(jìn)行分析、理解和合成,實(shí)現(xiàn)人“能聽會(huì)說”、具備自然語言交流的能力。
智能語音技術(shù)概述按機(jī)器在其中所發(fā)揮作用的不同,分為語音合成技術(shù)、語音識(shí)別技術(shù)、語音評(píng)測技術(shù)等。語音合成技術(shù)即讓機(jī)器開口說話,通過機(jī)器自動(dòng)將文字信息轉(zhuǎn)化為語音,相當(dāng)于機(jī)器的嘴巴。
語音識(shí)別技術(shù)即讓機(jī)器聽懂人說話,通過機(jī)器自動(dòng)將語音信號(hào)轉(zhuǎn)化為文本及相關(guān)信息,相當(dāng)于機(jī)器的耳朵;語音評(píng)測技術(shù)通過機(jī)器自動(dòng)對(duì)發(fā)音進(jìn)行評(píng)分、檢錯(cuò)并給出矯正指導(dǎo)。此外,還有根據(jù)人的聲音特征進(jìn)行身份識(shí)別的聲紋識(shí)別技術(shù),可實(shí)現(xiàn)變聲和聲音模仿的語音轉(zhuǎn)換技術(shù),以及語音消噪和增強(qiáng)技術(shù)等。
智能語音產(chǎn)品和服務(wù)形態(tài)多樣智能語音技術(shù)會(huì)成為未來人機(jī)交互的新方式,將從多個(gè)應(yīng)用形態(tài)成為未來人機(jī)交互的主要方式。
智能音箱類產(chǎn)品提升家庭交互的便利性。智能音箱是從被動(dòng)播放音樂,過渡到主動(dòng)獲取信息、音樂和控制流量的入口。當(dāng)前智能音箱以語音交互技術(shù)為核心,成為作為智能家庭設(shè)備的入口,不但能夠連接和控制各類智能家居終端產(chǎn)品,而且加入了個(gè)性化服務(wù),如訂票、查詢天氣、播放音頻等能力。
個(gè)人智能語音助手重塑了人機(jī)交互模式。個(gè)人語音助手,特別是嵌入到手機(jī)、智能手表、個(gè)人電腦等終端中的語音助手,將顯著提升這類產(chǎn)品的易用性。如蘋果虛擬語音助手 Siri 與蘋果智能家居平臺(tái)Homekit 深度融合,用戶可通過語音控制智能家居。Google Now 為用戶提供關(guān)心的內(nèi)容,如新聞、體育比賽、交通、天氣等等。微軟的Cortana 主要優(yōu)勢在于提升個(gè)人計(jì)算機(jī)的易用性。
以 API 形式提供的智能語音服務(wù)成為行業(yè)用戶的重要入口。智能語音 API 主要提供語音語義相關(guān)的在線服務(wù),可包括語音識(shí)別、語音合成、聲紋識(shí)別、語音聽轉(zhuǎn)寫等服務(wù)類型,并且可以嵌入到各類產(chǎn)品,服務(wù)或 APP 中。在商業(yè)端,智能客服、教育(口語評(píng)測)、醫(yī)療(電子病歷)、金融(業(yè)務(wù)辦理)、安防、法律等領(lǐng)域需求強(qiáng)烈;在個(gè)人用戶領(lǐng)域,智能手機(jī)、自動(dòng)駕駛及輔助駕駛、傳統(tǒng)家電、智能家居等領(lǐng)域需求強(qiáng)烈。





