近日,Google Chrome瀏覽器增加一項新AI功能,為視障人士語音“讀”出網頁圖片內容,作為他們閱讀、生活的輔助工具。不得不承認,AI語音技術在許多領域皆能夠縮短發(fā)出與接收數據信息的時間,其方式也較傳統(tǒng)形式來得有趣得多,還能積極幫助特殊群體豐富感官體驗。
AI語音簡單理解就是人機兩者溝通,通過讓機器聽得見、讓機器聽得懂、讓機器能思考、讓機器能說話的四個步驟運作,結合聲學、語言學、數字信息處理、計算機等多個基本學識基礎,自動語言識別接收的語音信息,再進行語言理解,利用所涉及的收集數據,做出回應,本質上就是人類語音轉化為文本技術。
如今,市面上非常多的智能產品依靠AI語音博取關注,例如移動手機設備,在司機駕駛途中,駕駛員可以直接以語音形式滿足需求,包括查詢目的地線路導航,獲取前方交通擁擠情況,還能語音命令接收來電等等,更大程度保障駕駛安全,給司機提供便捷服務。
早上起床,可以直接對空氣問時間、天氣情況,AI語音直接告訴你答案。出門前,不再擔心開關電源的危險,直接發(fā)出關閉空調的命令。想象一下這樣的生活,AI語音就像一個隱形的機器人助手,隨時解決你拋出來的疑問。
Amazon上個月同微軟、百度等逾30家企業(yè)宣布合作“AI語音相容計劃”,希望不同廠商語音服務在同一個裝置上互通,讓語音產品可以支援所種喚醒關鍵詞而啟動,給予使用者最大的選擇彈性,提供最合適的高品質的互動模式語音服務。
來源:新天域互聯





