日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 公眾號精選 > 中興文檔
[導讀]智能語音交互是基于語音輸入的新一代交互模式,通過說話就可以得到反饋結果??梢岳斫鉃槿祟惻c機器間通過自然語言完成信息傳遞的技術。語音交互的完整流程,如下圖所示。通常,根據(jù)距離遠近語音交互場景可分為兩種:近場語音場景:通常通過按鍵激活,例如智能手機等便攜設備。遠場語音場景:通常通過喚...






智能語音交互是基于語音輸入的新一代交互模式,通過說話就可以得到反饋結果??梢岳斫鉃槿祟惻c機器間通過自然語言完成信息傳遞的技術。





語音交互的完整流程,如下圖所示。





通常,根據(jù)距離遠近語音交互場景可分為兩種:

  • 近場語音場景:通常通過按鍵激活,例如智能手機等便攜設備。
  • 遠場語音場景:通常通過喚醒詞激活,例如智能音箱等固定設備。

遠場語音場景下,在產(chǎn)品策略上通常會采取兩種方案,以提高喚醒的準確率:
  • 將喚醒詞的音節(jié)長度增加到4音節(jié)。這是因為音節(jié)越長,喚醒的準確率就會越高。比如:“小興小興”的喚醒準確率遠高于“小興”。



  • 白天只對喚醒詞做本地校驗,夜間則再增加云端二次校驗。這是喚醒速度和準確率間的平衡策略。


    • 白天用戶更看重響應速度,發(fā)生偶爾的誤喚醒用戶能理解或接受,這時候僅由本地的喚醒檢測模塊進行快速檢測,保證 700 ms 內快速響應用戶。

    • 晚上睡覺時用戶對誤喚醒是零容忍的,這時候就要偏重喚醒的準確度,將本地檢測過的語音上傳到云端進行二次確認,再決定本地是否響應。




語音識別階段的主要作用是采集用于語音,并將語音轉換為文字,該階段主要做兩件事情:
1. 尋向降噪。尋向的作用就是判斷用戶方向,由用戶方向的麥克風采集語音數(shù)據(jù),保證語音的數(shù)據(jù)是最清晰的。降噪是對環(huán)境音進行消除,提高識別準確率。
2. 識別語音并轉換成文字。為提高特定內容的識別率,一般都會提供熱詞服務,配置的熱詞內容實時生效,并且會提升 ASR 結果的識別權重,在一定程度上提高 ASR 識別的準確率。



語義理解就是嘗試理解人類的語言,即把語音識別的結果轉成結構化的、機器能夠理解的語言。

NLU 的工作邏輯是將用戶的指令進行 Domain(領域)→Intent(意圖)→Slot(詞槽)三級拆分。
例如:“設置一個明早 8 點的鬧鐘”這樣一條指令,經(jīng)過 NLU 處理,用戶的指令則被拆分為如下三級:
  • 領域:“鬧鐘”
  • 意圖:“設置鬧鐘”
  • 詞槽:“明早8點”





  1. 先決策。機器在對話過程中不斷根據(jù)當前的狀態(tài)決策下一步應該采取的最優(yōu)動作。
  2. 再執(zhí)行。如提供結果,詢問特定限制條件,澄清或確認需求,調用各種 Skill 技能(AI 時代的 APP),從而最有效的輔助用戶完成信息或服務的獲取。




NLG 的主要目的是降低人類和機器之間的溝通鴻溝,將非語言格式的數(shù)據(jù)轉換成人類可以理解的語言格式。簡單的 NLG 可以將數(shù)據(jù)進行合并處理,而高級的 NLG 則可以理解數(shù)據(jù)想要表達的意圖,并考慮上下文,呈現(xiàn)出可以輕松閱讀的內容。
目前在一些有比較明顯規(guī)則的領域中,比如體育新聞,已經(jīng)可以借助 NLG 進行新聞的自動發(fā)布了。也許你現(xiàn)在正在看的一篇文章就是由機器生成的~



將文字內容轉換成語音輸出,讓機器跟我們對話。這涉及到兩個過程:

  1. 將從文字內容轉換成語音輸出,讓機器說話。

  2. 合成語音:狹義上專指根據(jù)音素序列(以及標注好的起止時間、頻率變化等信息)生成語音,廣義上它也可以包括文本處理的步驟。





家庭中語音交互的主要應用場景包括:語音查詢資訊、語音控制播放、語音免提撥號、語音控制家電等。

縮略語:ASR:Automatic Speech Recognition,自動語音識別技術NLU:Natural Language Understanding,自然語言理解DM:Dialog Management,對話管理NLG:Natural Language Generation,自然語言生成TTS:Text To Speech,從文本到語音NLP:Natural Language Processing,自然語言處理IPTV:Internet Protocol Television,網(wǎng)際協(xié)議電視OTT:Over The Top,通過互聯(lián)網(wǎng)向用戶提供各種應用服務IMS:Interactive Multimedia Service,交互式多媒體服務IOT:Internet of Things,物聯(lián)網(wǎng)

我們是一群平均從業(yè)年限5 的通信專業(yè)工程師。

關注我們,帶你了解通信世界的精彩!


本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

語音交互:對交互效率提升意義重大,理解能力推動大規(guī)模落地。語音交互的無 接觸屬性與自然性凸顯其對提升交互效率的意義,在數(shù)十年的發(fā)展歷程中,2000 年以 來語音理解能力的發(fā)展推動語音交互以大規(guī)模嵌入產(chǎn)品進入商業(yè)市場。

關鍵字: 智能家居 語音交互 語音助手

(全球TMT2022年5月28日訊)奇瑞汽車全新旗艦產(chǎn)品瑞虎8 PRO正式上市。新車搭載了奇瑞全新一代"Lion 5.0 AI科技智慧座艙",率先采用基于地平線征程3芯片打造的Horizon Halo?️...

關鍵字: 芯片 奇瑞 多模 語音交互

摘 要 :針對家庭用藥的儲藏管理和安全使用等問題,提出一種智能家用醫(yī)藥箱控制系統(tǒng)設計方案。該設計以樹莓派和 STM32 為核心,融合語音交互和圖像識別技術,實現(xiàn)了對家庭藥物的儲藏管理、分類和使用指導。使用樹莓派控制攝像頭...

關鍵字: 智能家用醫(yī)藥箱 語音交互 圖像識別 物聯(lián)網(wǎng)技術 藥物智能儲藏 樹莓派

摘 要:i-mirror 智能家居機器人是在智慧生活的概念下將傳統(tǒng)家居鏡進行改進的智能家居產(chǎn)品。它為居住者提供家電控制、信息獲取、環(huán)境監(jiān)控、休閑娛樂、遠程操作等一系列智能體驗。文中針對智能家居在家庭中的智聯(lián)互通和信息整合...

關鍵字: 智能家居機器人 樹莓派 人臉識別 語音交互

摘? 要:云計算技術和語音識別技術的迅猛發(fā)展使得人工智能的實現(xiàn)變得越來越容易,但目前多個硬件軟件之間的合作并不友好。文中研究并設計了基于云平臺和iOS的語音交互系統(tǒng),同時通過實驗證明了在iOS系統(tǒng)的HomeKit中可以加...

關鍵字: 云計算 人工智能 iOS 語音交互

9月18日,在2020云棲大會上,達摩院公布了語音AI技術的最新突破:端上語音識別和語音合成能力首次達到媲美云端的水平,這意味著未來個人用戶在移動終端即可輕松體驗逼近真人的語音技術。

關鍵字: 達摩院 語音ai 語音交互

  通過語言和聲音來表達自己的意愿是人與人溝通的基本方式,可是人與機器間卻一直存在著溝通上的種種障礙,如何突破這種限制,形成像人與人之間充滿智慧、溫情的人機交互一直是人類努力的方向。iPhone

關鍵字: 人機交互 語音控制 語音交互 ivoka

  上一代系統(tǒng)使用汽車內置功能來提供娛樂與信息系統(tǒng),而下一代汽車信息娛樂系統(tǒng)的功能將源于駕車者的移動設備,如iPhone、iPad和其它智能手機及平板電腦。這是一個巨大的變化。信

關鍵字: 映射技術 語音交互 語音識別 車載語音識別

  在行車過程中,注意力分散會影響駕駛員的操控,容易導致交通事故,車載語音交互技術的出現(xiàn)很好的解決了這個問題。它的重要作用就是提升駕駛的安全性,為用戶創(chuàng)建一個豐富、便捷和安全的車生活。

關鍵字: 華強聚豐 思必馳 電子發(fā)燒友 語音交互

  如今,人機交互技術應用潛力開始凸顯,比如智能手機配備空間跟蹤技術,應用于虛擬現(xiàn)實、遙控機器人及遠程醫(yī)療等的觸覺交互技術,對于有語言障礙的人士的無聲語音識別,還有各種創(chuàng)新技術,如指紋識別、TD

關鍵字: 思必馳 語音交互 車聯(lián)網(wǎng)

中興文檔

229 篇文章

關注

發(fā)布文章

編輯精選

技術子站

關閉