優(yōu)秀的訊飛翻譯機(jī),擁有強(qiáng)大的語(yǔ)音識(shí)別技術(shù)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:砍柴網(wǎng))
如今人工智能的發(fā)展過(guò)程,就如同我們求學(xué)的過(guò)程:不停地努力學(xué)習(xí),不停地?cái)U(kuò)充知識(shí),不停地刷新成績(jī)。當(dāng)成績(jī)刷到語(yǔ)言這一關(guān),翻譯機(jī)出現(xiàn)了。而且為了幫人類越過(guò)語(yǔ)言障礙這條“溝”,翻譯機(jī)做了許多努力,才最終行的“通”?!奥牭们宀拍茏g得準(zhǔn)?!睂?duì)于翻譯機(jī)而言,這句話不光是一句廣告詞,更說(shuō)出了翻譯機(jī)的本質(zhì)。
想要翻譯機(jī)譯的準(zhǔn),首先需要的就是對(duì)你說(shuō)的話有一個(gè)準(zhǔn)確的識(shí)別。就像如果要正確的回答問(wèn)題,就一定要先聽清、聽懂問(wèn)題。如果連你說(shuō)的話識(shí)別出來(lái)都是錯(cuò)的,那還談何翻譯的準(zhǔn)呢?所以翻譯機(jī)工作的第一步,就是從聽懂你說(shuō)話開始。訊飛翻譯機(jī)依托訊飛語(yǔ)音識(shí)別技術(shù),應(yīng)用強(qiáng)大的神經(jīng)網(wǎng)絡(luò)模型,中文語(yǔ)音識(shí)別準(zhǔn)確率超過(guò)98%,并且支持5種漢語(yǔ)方言識(shí)別,2016和2018連續(xù)兩屆包攬CHiME語(yǔ)音識(shí)別大賽冠軍。
所以今天我們就來(lái)扒一扒,有科大訊飛語(yǔ)音識(shí)別技術(shù)傍身的訊飛翻譯機(jī),到底為什么能譯的更準(zhǔn)。記得上學(xué)那會(huì)兒,老師洋洋灑灑講完一個(gè)知識(shí)點(diǎn),總喜歡最后接一句“都聽懂了沒(méi)有?”臺(tái)下的學(xué)生七零八落的點(diǎn)著頭,但也不知道有多少人只是因?yàn)槁犚娏死蠋熣f(shuō)的每個(gè)字而點(diǎn)頭,又有多少人是因?yàn)檎嬲牰嗣烤湓挼暮x而點(diǎn)頭。
市面上的翻譯機(jī),其實(shí)就像是一個(gè)班里水平層次不齊的學(xué)生。老師教學(xué)方式是相同的,但有人資質(zhì)平平,勉強(qiáng)及格,對(duì)外界信息需要一定時(shí)間消化才能反饋(或者不能);而有的人學(xué)習(xí)能力強(qiáng)、成績(jī)優(yōu)秀,對(duì)外界的信息能迅速做出準(zhǔn)確的反應(yīng)。翻譯機(jī)在開始的語(yǔ)音識(shí)別階段,從收到聲音到轉(zhuǎn)換成對(duì)應(yīng)的文字,過(guò)程都是相同的:接收聲音信號(hào)-提取聲音特征-綜合聲學(xué)模型和語(yǔ)言模型-解碼形成文字。
難就難在如何把你說(shuō)的話能夠意思分毫不差、一字不差的識(shí)別出來(lái)。這也就是不同品牌的翻譯機(jī)從一開始拉開差距的地方。為什么說(shuō)識(shí)別的一字不差很難呢?如果在安靜的環(huán)境下說(shuō)著語(yǔ)法、發(fā)音都標(biāo)準(zhǔn)的普通話,機(jī)器可以很容易準(zhǔn)確識(shí)別,而一旦夾雜了多音字、方言口音,或者說(shuō)話環(huán)境嘈雜、有回音等聲音干擾,機(jī)器的識(shí)別過(guò)程就沒(méi)那么輕松了。
在收到了有特征的聲紋信息后,機(jī)器會(huì)通過(guò)聲學(xué)模型組成單詞或拼音,再通過(guò)語(yǔ)言模型來(lái)讓識(shí)別結(jié)果變得更準(zhǔn)確。語(yǔ)言模型是非常重要的,它通過(guò)學(xué)習(xí)詞與詞之間的相互關(guān)系,來(lái)估計(jì)你所說(shuō)的話對(duì)應(yīng)的每個(gè)字的可能性,并利用語(yǔ)言本身的統(tǒng)計(jì)規(guī)律來(lái)幫助提升識(shí)別正確率。如果還了解特定領(lǐng)域或任務(wù)相關(guān)的先驗(yàn)知識(shí),語(yǔ)言模型可以識(shí)別的更準(zhǔn)確。但如果不使用語(yǔ)言模型,機(jī)器面對(duì)大量的聲音信息,識(shí)別出的結(jié)果則會(huì)是一團(tuán)亂麻。
所以說(shuō),機(jī)器也和人一樣,越學(xué)習(xí)、越優(yōu)秀。但不是所有翻譯機(jī)都能有足夠的學(xué)習(xí)資源,而訊飛翻譯機(jī)恰巧就是“飽讀詩(shī)書”的那一個(gè)。眾所周知,科大訊飛深耕人工智能技術(shù),為醫(yī)療、教育、家庭、城市等智能化建設(shè)作出了相當(dāng)?shù)某删?,也因此,訊飛擁有了千萬(wàn)級(jí)各行業(yè)平行領(lǐng)域數(shù)據(jù)的支撐,也因此為語(yǔ)言模型帶來(lái)了豐富的學(xué)習(xí)文本。
隨著對(duì)各行業(yè)學(xué)習(xí)的不斷深入,基于大量垂直領(lǐng)域語(yǔ)料,不斷對(duì)特定垂直領(lǐng)域的語(yǔ)音聽寫模型進(jìn)行訓(xùn)練,這樣一來(lái),機(jī)器不僅能聽懂日??谡Z(yǔ),連那些專業(yè)術(shù)語(yǔ)也能聽懂了。這就是訊飛翻譯機(jī)行業(yè)翻譯官工作的基礎(chǔ)——先聽清楚你在說(shuō)什么,再為你翻譯出專業(yè)的結(jié)果。
打開訊飛翻譯機(jī),我們能看到醫(yī)療、金融、外貿(mào)、法律、體育、能源、計(jì)算機(jī)、電力八大行業(yè)翻譯官。行業(yè)翻譯功能的到來(lái),也就意味著訊飛翻譯機(jī)相較于其他翻譯機(jī),對(duì)你說(shuō)話含義的理解又更深入了一步。另一個(gè)影響翻譯機(jī)識(shí)別能力的關(guān)鍵,是翻譯機(jī)的耳朵——麥克風(fēng)?;叵胍幌?,當(dāng)我們和別人說(shuō)話時(shí),面對(duì)著對(duì)方和背對(duì)著對(duì)方,聽到的清楚程度是有區(qū)別的。
麥克風(fēng)作為翻譯機(jī)的耳朵,如果想要各個(gè)方向都聽的清楚,獲得較好音質(zhì)的音頻,就需要360度無(wú)死角、多帶幾個(gè)麥克風(fēng)在身上。所以,訊飛翻譯機(jī)采用四麥克風(fēng)陣列,利用陣列方位信息進(jìn)行噪聲抑制,將陣列原始信號(hào)與深度學(xué)習(xí)結(jié)合,加強(qiáng)識(shí)別模型訓(xùn)練,以便讓翻譯機(jī)聽得更清楚,從而提高翻譯機(jī)在嘈雜環(huán)境、聲音源過(guò)遠(yuǎn)等情況下的語(yǔ)音識(shí)別準(zhǔn)確率。





