北京時間1月14日下午消息,對于第一代智能手機,業(yè)界普遍的看法是,喬布斯將觸摸屏和高效節(jié)能芯片引入手機領域后,引領了智能手機的第一波發(fā)展浪潮。那么智能手機今后的發(fā)展浪潮是什么?在中興通訊手機產品規(guī)劃中心主任丁寧看來,“通過聲音控制一切、真正解放雙手”會是下一步發(fā)展的趨勢。
GrandSIILTE是中興重點打造的智慧語音手機,為了進一步描繪語音控制的魅力,丁寧以一段電影片段為例,他說:“在好萊塢大片《2012》里,俄羅斯富商乘坐的豪華飛機需要通過汽車才能著陸,但大家到處都找不到他的賓利車鑰匙了,沒辦法啟動車。這時候,這位俄羅斯富商說了句‘安靜’,然后等大家安靜下來后,他說了一聲‘啟動’,他的賓利車就啟動了。”
“所以,我們認為通過聲音控制一切,是更加提升用戶體驗,更便捷操作電子終端的技術方向。”
當然他也坦承,新技術的成熟需要一個發(fā)展過程,語音識別是一個相對比較難的技術,它需要大數據,大數據傳統(tǒng)的方法是內置到產品里面,但產品本身的容量和空間是有限的,當有新的詞匯產生的時候,它無法及時更新,造成無法識別的問題。
不過,隨著網絡技術的發(fā)展,尤其是4G的來臨,語音識別就會有更好的體驗。所有詞匯的解釋、語音的識別,通過高速的網絡就可以實現高辨識度的語音識別。
中興通訊手機產品規(guī)劃中心主任丁寧
丁寧表示,GrandSIILTE最大的亮點就在于低功耗喚醒和聲紋解鎖。待機狀態(tài)下手機的功耗非常低,在這種情況下,不通過手動操作,通過語音把手機喚醒,并且讓它獨一無二的識別用戶自己的聲音,這就形成了一個真正安全的平臺入口,這是這款手機最有創(chuàng)新的一點。
聲紋認證技術,是中興與語音和語言解決方案提供商Nuance合作提供的,用戶可以在設置選項里設置兩個聲紋ID分別進入常規(guī)桌面和兒童桌面,無需滑行、鍵入,使用密碼或手動操作。
聲紋認證設置
同樣采用了Nuance自然語言理解(NLU)和語音合成技術的駕駛助手應用,主要針對的是駕駛場景,方便用戶在開車時操作手機,通過語音指令,不僅能快速啟動路徑導航功能,還可以實現撥打和接聽電話、收聽短信、播放指定的音樂曲目等等。比如用戶可以說“聯合廣場在那里”,駕駛助手會啟動谷歌地圖顯示搜索到的目的地導航,并提供語音路線。
駕駛助手應用
GrandSIILTE在語音方面的另外一個特色是Hi-FiVoice高保真語音,普通的手機語音有0-4KHz的帶寬,GrandSIILTE有0-8KHz高音頻寬帶,手機的頂端、底端及背面分別嵌入有一枚麥克風,能在嘈雜的環(huán)境中快速識別用戶的語音指令。但經過筆者現場體驗,聲紋識別在嘈雜環(huán)境下的辨識度仍存在一些問題。
GrandSII另外一個跟聲音有關的應用是定向錄音功能,它能夠為用戶提供解說、采訪等多種錄音模式,解說模式指只錄主屏一側(對準解說者)聲音,減弱或屏蔽對面和側面的聲音。
丁寧表示,中興希望通過一些新的技術創(chuàng)新點,為用戶帶來體驗更好的產品。語音控制技術的廣泛應用,可以解放用戶雙手,打造新的智能手機操作習慣。
語音識別已經有近20年的應用歷史,但只是近年來蘋果Siri的推出才廣為人知。從中興GrandSIILTE的現場體驗來看,更好的提高嘈雜環(huán)境下的識別率,是語音識別走向普及的必經之路。





