日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 消費電子 > 音視頻及家電
[導讀] (文章來源:OFweek) 語音識別已成為人與機器通過自然語言交互重要方式之一,本文將從語音識別的原理以及語音識別算法的角度出發(fā)為大家介紹語音識別的方案及詳細設計過程。 語言作為

(文章來源:OFweek)

語音識別已成為人與機器通過自然語言交互重要方式之一,本文將從語音識別的原理以及語音識別算法的角度出發(fā)為大家介紹語音識別的方案及詳細設計過程。

語言作為人類的一種基本交流方式,在數(shù)千年歷史中得到持續(xù)傳承。近年來,語音識別技術(shù)的不斷成熟,已廣泛應用于我們的生活當中。語音識別技術(shù)是如何讓機器“聽懂”人類語言?本文將為大家從語音前端處理、基于統(tǒng)計學語音識別和基于深度學習語音識別等方面闡述語音識別的原理。

隨著計算機技術(shù)的飛速發(fā)展,人們對機器的依賴已經(jīng)達到一個極高的程度。語音識別技術(shù)使得人與機器通過自然語言交互成為可能。最常見的情形是通過語音控制房間燈光、空調(diào)溫度和電視的相關(guān)操作等。并且,移動互聯(lián)網(wǎng)、智能家居、汽車、醫(yī)療和教育等領(lǐng)域的應用帶動智能語音產(chǎn)業(yè)規(guī)模持續(xù)快速增長,2018年全球智能語音市場規(guī)模將達到141.1億美元。

目前,在全球智能語音市場占比情況中,各巨頭市場占有率由大到小依次為:Nuance、谷歌、蘋果、微軟和科大訊飛等。

接下來對語音識別相關(guān)技術(shù)進行介紹,為了便于整體理解,首先,介紹語音前端信號處理的相關(guān)技術(shù),然后,解釋語音識別基本原理,并展開到聲學模型和語言模型的敘述,最后,展示我司當前研發(fā)的離線語音識別demo。前端的信號處理是對原始語音信號進行的相關(guān)處理,使得處理后的信號更能代表語音的本質(zhì)特征。

語音活動檢測(Voice Activity DetecTIon, VAD)用于檢測出語音信號的起始位置,分離出語音段和非語音(靜音或噪聲)段。VAD算法大致分為三類:基于閾值的VAD、基于分類器的VAD和基于模型的VAD。

基于閾值的VAD是通過提取時域(短時能量、短時過零率等)或頻域(MFCC、譜熵等)特征,通過合理的設置門限,達到區(qū)分語音和非語音的目的;基于分類的VAD是將語音活動檢測作為(語音和非語音)二分類,可以通過機器學習的方法訓練分類器,達到語音活動檢測的目的;基于模型的VAD是構(gòu)建一套完整的語音識別模型用于區(qū)分語音段和非語音段,考慮到實時性的要求,并未得到實際的應用。

在生活環(huán)境中通常會存在例如空調(diào)、風扇等各種噪聲,降噪算法目的在于降低環(huán)境中存在的噪聲,提高信噪比,進一步提升識別效果。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀
關(guān)閉