日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 通信技術(shù) > 通信技術(shù)
[導(dǎo)讀]7月9日消息,據(jù)國外媒體報(bào)道,蘋果正在測試Dragon Dictation語音輸入功能的本地離線版本,在未來的iOS設(shè)備中將可能增加離線語音輸入功能。而在去年的谷歌I/O大會(huì)上,谷歌發(fā)布了Android4.1系統(tǒng),其中就增加了離線語音

7月9日消息,據(jù)國外媒體報(bào)道,蘋果正在測試Dragon Dictation語音輸入功能的本地離線版本,在未來的iOS設(shè)備中將可能增加離線語音輸入功能。而在去年的谷歌I/O大會(huì)上,谷歌發(fā)布了Android4.1系統(tǒng),其中就增加了離線語音輸入功能。蘋果引入該項(xiàng)Android已有的功能,旨在讓iOS7生態(tài)系統(tǒng)更加完善。

Dragon Dictation是由著名的語音識別軟件公司Nuance開發(fā)的,適用于iPhone,iPad和 iPod touch用戶的一款語音識別應(yīng)用軟件,能將用戶的語音轉(zhuǎn)換成文字。目前的DragonDictation在進(jìn)行語音輸入時(shí),iOS系統(tǒng)會(huì)利用軟件將語音上傳至云端,然后將其轉(zhuǎn)變成文本。這種方式需要互聯(lián)網(wǎng)連接且大多數(shù)情況下需要長時(shí)間載入,對用戶來說使用并不方便。

離線語音輸入功能將提高智能語音技術(shù)體驗(yàn)

語音輸入需要流量,如果普通話不太標(biāo)準(zhǔn)也會(huì)受影響,同時(shí)還存在吵鬧環(huán)境中無法有效識別的問題。離線語音輸入功能引入iOS7,iOS設(shè)備將不需要網(wǎng)絡(luò)連接就可以直接處理和轉(zhuǎn)換語音,這將會(huì)大大加快語音輸入郵件、短信、筆記的速度。

業(yè)內(nèi)人士猜測,蘋果可能會(huì)將該技術(shù)從Dragon Dictation轉(zhuǎn)至Siri,從而使得該語音助手更加快速地回應(yīng)特定請求。如果Dragon Dictation能和Siri相結(jié)合的話,將極大的提高Siri的響應(yīng)速度和削弱對網(wǎng)絡(luò)的依賴,而使智能語音技術(shù)體驗(yàn)大幅度提高。

智能語音技術(shù)與傳統(tǒng)的語音識別有所不同。傳統(tǒng)的語音識別是將用戶所說的語音正確的識別轉(zhuǎn)化為文本,比較有代表性的即為Google的Voice Search。而智能語音技術(shù)就是在傳統(tǒng)語音識別的基礎(chǔ)上更進(jìn)一步,對進(jìn)行了語義的理解,并根據(jù)用戶語音的意圖進(jìn)行回答,讓機(jī)器像人一樣“能聽會(huì)說”的技術(shù),它帶來了人機(jī)交互的根本性變革。

那么智能語音技術(shù)是如何做到語義識別的?

在如上圖所示的智能語音技術(shù)原理中,用戶語音首先被語音識別服務(wù)轉(zhuǎn)換為文字,發(fā)送至云端服務(wù)器對語音識別所獲得文字進(jìn)行語義和語法的識別判斷,以“我想在辦公室附近找個(gè)浪漫點(diǎn)的地方吃意大利菜”為例,智能語音技術(shù)在獲得文本后,根據(jù)其語法模型進(jìn)行語法分析,得出此為一個(gè)“主語+謂語+賓語+副詞”的句法結(jié)構(gòu)。其中,主語為“我”,即用戶,“想找一個(gè)浪漫的地方”說明用戶希望找一個(gè)地方,此地方的特征是“浪漫”, “意大利菜”說明用戶的目的是吃飯,而且是意大利食品,并且用戶要求“辦公室附近”。

根據(jù)這些關(guān)鍵信息,智能語音技術(shù)按照算法,判斷用戶可能是在尋找一個(gè)在自己附近的浪漫的意大利餐廳。之后,利用服務(wù)提供商的搜索引擎搜索,并將結(jié)果的文字按照語法進(jìn)行整合,形成回答。

智能語音技術(shù)日益重要 前景廣闊 多家公司進(jìn)場PK

隨著智能終端、無線網(wǎng)絡(luò)的廣泛普及,在移動(dòng)互聯(lián)網(wǎng)時(shí)代,智能語音技術(shù)的重要性日益顯現(xiàn)。

Strategy Analytics的統(tǒng)計(jì)表明,2012年,中國原始設(shè)備制造商(OEM)所提供的具備語音人機(jī)接口的信息娛樂和車載信息通信系統(tǒng)(telematics)的出貨量達(dá)到300萬臺(tái),并預(yù)期在2018年達(dá)到2000萬臺(tái)。在北美和歐洲市場,帶語音交互功能的車載設(shè)備應(yīng)用已很普及。

福特SYNC系統(tǒng),即專為手機(jī)和數(shù)字媒體播放器配備的福特車載多媒體通信娛樂系統(tǒng),是目前車載系統(tǒng)中采用語音交互技術(shù)的成功的案例。搭載SYNC系統(tǒng)后,配合汽車中控臺(tái)上的顯示屏,可通過語音控制、兼容并操控便攜式通信/娛樂設(shè)備等方式,讓駕駛者在開車過程中更輕松,便捷地實(shí)現(xiàn)諸如語音撥號、語音播出短信內(nèi)容、語音控制音樂播放等功能。

而汽車業(yè)之外,移動(dòng)互聯(lián)網(wǎng)終端大概是目前最熱衷采用智能語音技術(shù)的一類產(chǎn)品了。2011年10月,蘋果率先推出了智能語音助理應(yīng)用Siri,并在2012年6月發(fā)布的IOS6中支持中文服務(wù);Google公司也在其安卓智能手機(jī)操作系統(tǒng)中推出了Google Now智能語音搜索及問答服務(wù);微軟公司已經(jīng)利用DNNS(深度神經(jīng)網(wǎng)絡(luò))改進(jìn)語音識別系統(tǒng),將Windows Phone系統(tǒng)的語音識別引擎速度提高1倍,將詞匯錯(cuò)誤率降低了15%。

除了智能語音識別,我們再來看看語音輸入法的歷史。語音輸入應(yīng)用到手機(jī)上還是訊飛輸入法的首創(chuàng)。

2010年10月,訊飛語音云發(fā)布,并推出了訊飛語音輸入法Android平臺(tái)的第一個(gè)版本,拉開了移動(dòng)互聯(lián)網(wǎng)語音應(yīng)用熱潮的序幕;

2011年7月,谷歌在谷歌拼音輸入法(Android)中加入了中文語音輸入功能;

2012年5月,百度手機(jī)輸入法v3.0版本發(fā)布,新增了語音輸入功能;

2012年6月,蘋果召開新聞發(fā)布會(huì),介紹最新的IOS 6中加入了中文語音輸入功能。

現(xiàn)在,幾乎每一家手機(jī)廠商都試圖將語音技術(shù)融于其移動(dòng)產(chǎn)品、應(yīng)用和服務(wù)中。這其中最主要的一個(gè)原因就是這類終端設(shè)備外型小巧,觸摸輸入很不方便,這種情況下,語音交互就變成了一種非常必要的人機(jī)溝通的補(bǔ)充方式。

語音識別需謹(jǐn)慎 范圍要界定好

去年10月,蘋果公司Siri中文版被爆“涉黃”,用戶可使用語音指令查詢到附近的“三陪”信息。蘋果公司在面對公眾壓力兩周之后做出反應(yīng),從搜索源頭屏蔽了相關(guān)內(nèi)容,使用戶無法搜再出“涉黃”信息。

“Tits &Glass”是Google Glass上首款色情應(yīng)用,上線幾小時(shí)后就被下架,Google還專門為其修改了開發(fā)者政策,禁止 Google Glass應(yīng)用出現(xiàn)成人內(nèi)容,但這款應(yīng)用沒多久后在Google Glass上重新上架,只是用戶不再能直接分享圖片給你的Google+ 好友。而Google Glass在使用中一般只展示圖片和標(biāo)題,大部分密集文字內(nèi)容都是通過智能語音朗讀來完成,這就對色情應(yīng)用提供了土壤,使其可能被濫用。

語音識別功能雖然逐漸智能化人性化,但是發(fā)展范圍研發(fā)公司一定要做合理的限定,避免技術(shù)被濫用。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀
關(guān)閉