日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 據(jù)行業(yè)預測,中國智能語音產(chǎn)業(yè)規(guī)模將達到101.4億元。而智能語音產(chǎn)業(yè)的快速發(fā)展,將帶動智能家居、智能汽車以及智能穿戴設備等相關領域市場規(guī)模增長上千億元。 智能語音市場規(guī)模得以如此神速擴張,并且應

據(jù)行業(yè)預測,中國智能語音產(chǎn)業(yè)規(guī)模將達到101.4億元。而智能語音產(chǎn)業(yè)的快速發(fā)展,將帶動智能家居、智能汽車以及智能穿戴設備等相關領域市場規(guī)模增長上千億元。 智能語音市場規(guī)模得以如此神速擴張,并且應用到多個領域,這必然離不開智能語音技術的不斷突破。

據(jù)行業(yè)預測,中國智能語音產(chǎn)業(yè)規(guī)模將達到101.4億元。而智能語音產(chǎn)業(yè)的快速發(fā)展,將帶動智能家居、智能汽車以及智能穿戴設備等相關領域市場規(guī)模增長上千億元。

智能語音市場規(guī)模得以如此神速擴張,并且應用到多個領域,這必然離不開智能語音技術的不斷突破。那么,我們當前的語音技術達到了什么地步?換句話說,能夠實現(xiàn)什么樣的人機互動效果呢?

以歐拉蜜團隊為代表,我們一起來看看這些年國內(nèi)智能語音行業(yè)的技術突破。

技術門檻高,首先得保證語音識別準確率

中國的語音識別研究起始于1958年,由中國科學院聲學所利用電子管電路識別10個元音。雖然與國外語音識別研究起步時間同步,但由于當時條件的限制,隨后一段時間內(nèi)技術的進展較為緩慢。

最初,我國語音技術的研究一直以學術界為主,隨后才有企業(yè)逐漸涉足這個領域。由于語音識別技術準入門檻高、人才稀缺,經(jīng)過多年研究與探索,一些國內(nèi)企業(yè)終于在這個行業(yè)冒頭,形成了“一超多強”的局面。

歐拉蜜團隊在智能語音方面的研究已達5年。初期,歐拉蜜以設計出一個中文理解能力超越Siri的智能語音助理為目標,開始投入人工智能相關研究領域,而長遠的目標則是致力于提供全方位的人機交互解決方案。

這5年里,歐拉蜜攻破了不少技術難關。首先要解決的,就是語音識別的精準度。

語音人機交互面臨著多重技術難題。例如,人聲距離不能過遠、發(fā)音要標準、環(huán)境要安靜、不能持續(xù)對話、不能被打斷……

歐拉蜜團隊重點解決了這些語音識別方面的問題。目前,歐拉蜜的人聲識別準確度高達90%,并且可實現(xiàn)超遠距離識別(最遠可準確識別距離8米的人聲)。

同時,歐拉蜜團隊研發(fā)了具有強抗噪能力的語音識別技術與核心算法,包括語音活性檢測(Voice AcTIvity DetecTIon | Speech AcTIvity DetecTIon),回聲消除算法(AcousticEcho Cancellation),噪聲處理算法(Noise Reduction & Cancellation),混響處理算法(Reverberation)等多項專利技術。

歐拉蜜還為企業(yè)用戶提供深度定制服務,比如對兒童聲音、嘈雜環(huán)境聲音進行訓練,可達到特殊要求下的語音識別高準確度。

難點在于自然語言語義理解和處理

“能穿多少穿多少”,這句話的意思,到底是要你“多穿”呢,還是要你“少穿”呢。同樣的,中文語境下,類似的歧義句還不在少數(shù)。

例如,“中國隊大敗德國隊”,不知是中國贏了德國,還是德國贏了中國;“小王跟我請了假”,不知是小王向我請了假,還是小王和我都請了假……那么,在這種歧義的語境下,我們需要更多的信息來明確原句的意思。

比較常見的NLP/NLU現(xiàn)有技術與方案有這么幾種。一是基于關鍵詞和簡單規(guī)則,但這樣誤抓率高、歧義多,無法精準抓取參數(shù);二是基于ASR語法的擴展,但這種方式描述能力有限,可擴展性較低;三是基于統(tǒng)計的句法分析算法,這種算法準確率與性能不夠高,且不易處理上下文問題;最后呢,是處理語法擴展的編程,但這種程序復雜度很高。

那么,歐拉蜜是怎么解決這個問題的呢?

歐拉蜜團隊自主研發(fā)的語法描述語言(Syntax Language),可用靈活的規(guī)則來描述說法。同時,依托可全文檢索的結構化知識庫,輔助確定語法參數(shù)的合法性,消除歧義。

歐拉蜜采用了結合規(guī)則和統(tǒng)計的有機算法、時間和數(shù)字識別技術、以編譯器技術動態(tài)解析和匹配規(guī)則,能夠實現(xiàn)多維度的上下文支持能力,準確理解用戶的表達意圖。

例如,當用戶連續(xù)輸入“今天上海的天氣”,“北京呢”,“買一張去那里的機票”。經(jīng)過算法處理以及數(shù)據(jù)庫檢索,歐拉蜜能夠結合上下文,準確將“北京呢”理解為“北京今天的天氣如何”,并給出當天北京的天氣狀況。

同樣的,歐拉蜜也能獲取最后一句中的“那里”指代的是“北京”,并為用戶反饋當?shù)厝ケ本┑臋C票信息。

以視覺行為偵測技術為輔助的語音人機交互

如果人機交互可以更加“智能”,那么它應該擁有哪些能力呢?歐拉蜜團隊進一步改進了語音機器人的喚醒功能,使人機交互更加流暢。

市面上主流的智能音響,目前使用的都是語音喚醒。由于智能音響沒有屏幕,一切功能都是通過語音來操控,喚醒功能也不例外。往往會用一句喚醒話術(通常是產(chǎn)品的名稱)來作為啟動標志,當人們對著智能音響說出這句話時,智能音響就會進行答復并開始接收你傳遞給它的信息。

你可能會說,語音喚醒已經(jīng)很方便了,難道還能有什么改進余地嗎?

試想一下,日常生活中,當我們想要對另一人說話時常常會面向他,這時候,不需要叫對方的名字,對方也知道我們正在與他對話。如果機器也能做到這樣,那么“語音喚醒”都可以省略掉了。

歐拉蜜正是想賦予語音機器人這樣“人性化”的功能。因此,歐拉蜜團隊使用聲源定位并結合視線檢測(Eye Gaze Detection)技術,來幫助機器人確認用戶的說話對象。這樣一來,機器人們除了知道你在說話,還能夠判斷出你是否是在跟它說話,并自動喚醒。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據(jù)LED驅動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉