搜狗最新發(fā)布個(gè)性化語音識(shí)別技術(shù)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
搜狗輸入法發(fā)布新版本,發(fā)布“個(gè)性化語音識(shí)別”服務(wù),用戶只需更新后點(diǎn)擊APP選擇一鍵登陸賬戶,即可體驗(yàn)。成功開啟“個(gè)性化語音識(shí)別”后,用戶選擇搜狗語音輸入按鈕,可以發(fā)現(xiàn)輸入法已強(qiáng)化學(xué)習(xí)了用戶的個(gè)人詞匯。據(jù)了解,該功能將有效提升用戶個(gè)性化特色詞句的語音識(shí)別準(zhǔn)確率,降低用戶在輸入過程中的手動(dòng)修改次數(shù)。
得益于能解放雙手的便捷性,語音輸入自面世以來就備受大眾青睞。但如何實(shí)現(xiàn)“聽懂”用戶,并快速、準(zhǔn)確的呈現(xiàn)出用戶“所說”,一直是語音輸入領(lǐng)域面臨的一大技術(shù)難題,尤其是對(duì)極具用戶個(gè)人屬性詞句的精準(zhǔn)識(shí)別。比如,用戶需要的是“劉也、梓軒、程志”,語音輸入后得到的很可能是“劉燁、子萱、誠摯”……諸如此類未基于用戶個(gè)人特色針對(duì)性語音識(shí)別的結(jié)果,往往需要用戶再費(fèi)時(shí)費(fèi)力手動(dòng)調(diào)整,反而在一定程度上損害了語音輸入的用戶體驗(yàn)。
針對(duì)這一問題,搜狗語音此次率先推出“個(gè)性化語音識(shí)別”,可基于其大數(shù)據(jù)及領(lǐng)先的AI(人工智能)語音技術(shù)的支持,構(gòu)建起個(gè)人化、個(gè)性化的用戶專屬輸入法服務(wù),從而大幅提高“個(gè)人高頻詞匯”的識(shí)別精準(zhǔn)度,降低用戶的手動(dòng)修改率。
可以說,憑借“個(gè)性化語音識(shí)別”,搜狗率先在語音輸入領(lǐng)域真正實(shí)現(xiàn)了“更懂用戶”,切實(shí)提升了每一個(gè)用戶日常生活中表達(dá)、傳遞信息的效率。對(duì)于語音識(shí)別技術(shù)而言,目前市面上能夠見到的語音輸入產(chǎn)品和工具,在通用場景下的識(shí)別準(zhǔn)確率基本都能“聽懂”用戶;但因?yàn)闇?zhǔn)確率一旦達(dá)到一定高度,相對(duì)再每提升百分之一都要面臨極大的技術(shù)難度。
目前,搜狗通用語音識(shí)別已經(jīng)全面使用了行業(yè)前沿的深度學(xué)習(xí)技術(shù),其中基于DTSS(Deep Transformer-based Sequence to Sequence model)的端到端聲學(xué)模型、神經(jīng)網(wǎng)絡(luò)語言模型和智能標(biāo)點(diǎn)預(yù)測等技術(shù),有效推動(dòng)了搜狗語音識(shí)別的通用效果和體驗(yàn),這在行業(yè)中處于領(lǐng)先水平。此番,“個(gè)性化語音識(shí)別”可以針對(duì)用戶的語音輸入習(xí)慣精準(zhǔn)優(yōu)化,從而使得在保障通用識(shí)別準(zhǔn)確的情況下,用戶常用語的字錯(cuò)誤率相對(duì)下降近40%。極大的減少了修改成本,可謂是攻克中文語音識(shí)別這一“技術(shù)堡壘”至關(guān)重要的一步。
搜狗之所以能率先實(shí)現(xiàn)“個(gè)性化語音識(shí)別”,主要原因有二:一是用戶大數(shù)據(jù)的沉淀與積累,二是搜狗本身就保持領(lǐng)先且持續(xù)快速發(fā)展的AI技術(shù)。
首先,搜狗輸入法擁有大數(shù)據(jù)優(yōu)勢,這是搜狗語音輸入識(shí)別的“護(hù)城河”,也是其他企業(yè)及產(chǎn)品難以比及的地方。以此為基礎(chǔ),搜狗通過大數(shù)據(jù)挖掘處理,使得語音識(shí)別準(zhǔn)確率大幅提升。在提升識(shí)別準(zhǔn)確率的同時(shí),搜狗語音創(chuàng)新式的技術(shù)流程,讓云端系統(tǒng)極大程度上保證了用戶個(gè)性化特征的自動(dòng)處理速度,實(shí)現(xiàn)整個(gè)學(xué)習(xí)個(gè)性化特征的過程在“毫秒級(jí)別”就可以全部自動(dòng)完成。
其次,搜狗AI技術(shù)蓬勃發(fā)展,一方面,不僅擁有以語音交互為核心的人工智能平臺(tái)“搜狗知音”,使得搜狗在語音識(shí)別、語義理解等方面具備領(lǐng)先優(yōu)勢,另一方面,其業(yè)界領(lǐng)先的語音修改能力、智能斷句、標(biāo)點(diǎn)預(yù)測、識(shí)別結(jié)果順滑,以及成績斐然的自然語言處理技術(shù)都能更好地幫助提升“個(gè)性化語音識(shí)別”的準(zhǔn)確率。
語音識(shí)別一直是人機(jī)交互、人工智能鏈接傳統(tǒng)產(chǎn)業(yè)的一項(xiàng)關(guān)鍵性技術(shù),直接影響著未來社會(huì)的智能化發(fā)展進(jìn)程。因?yàn)樵谥悄芗揖?、智能教育、智能醫(yī)療等與用戶日常生活息息相關(guān)的各個(gè)產(chǎn)業(yè)領(lǐng)域,讓智能設(shè)備“聽懂”我們說話是實(shí)現(xiàn)自然交互的先決條件。
當(dāng)前,語音識(shí)別已基本實(shí)現(xiàn)“出口成章”。此次搜狗的“個(gè)性化語音識(shí)別”,可謂再次撕開語音識(shí)別技術(shù)瓶頸,增加了行業(yè)對(duì)于人機(jī)交互實(shí)現(xiàn)“千人千面”的信心。未來,搜狗語音將會(huì)持續(xù)提高和完善語音輸入識(shí)別技術(shù),持續(xù)優(yōu)化“個(gè)性化語音識(shí)別”服務(wù)。相信隨著語音識(shí)別技術(shù)的不斷突破和用戶個(gè)性化內(nèi)容的不斷豐富,搜狗或?qū)⑿纬伞跋M(fèi)級(jí)”的語音個(gè)性化生態(tài)資源,全面實(shí)現(xiàn)定制化語音輸入。從而使每個(gè)用戶都能使用 “更懂自己”的搜狗語音識(shí)別技術(shù),在生活、出行、工作中大幅提升人機(jī)溝通效率,幫助人們表達(dá)和獲取信息更簡單。





