任萍萍:真正的人工智能爆發(fā)即將到來
科大訊飛公司的市場總監(jiān)任萍萍在論壇上指出,隨著近年來深度學(xué)習(xí)概念的提出,2012年語音識別技術(shù)上DNN成功地應(yīng)用,以及2012年CNN在圖像識別上的應(yīng)用,以及2014年機(jī)器翻譯中的應(yīng)用,在深度學(xué)習(xí)、機(jī)器翻譯以及圖象識別等等技術(shù)上的突破,以及我們的大數(shù)據(jù)、我們的運(yùn)算能力不斷加強(qiáng),我們覺得真正的人工智能爆發(fā)即將到來。
以下為演講實(shí)錄:
謝謝大家,很榮幸受到學(xué)院的邀請跟大家一起分享一下關(guān)于人工智能的話題,我們知道生物醫(yī)藥的突破讓人的預(yù)期壽命都會超過100歲,人工智能技術(shù)的突破會讓我們簡單重復(fù)的勞動會被機(jī)器所替代,人們的生活會越來越美好。
當(dāng)下人工智能技術(shù)到底進(jìn)展到什么程度?哪些技術(shù)又有哪些應(yīng)用的突破?我想站在企業(yè)的角度,我們也做了一些嘗試和大家一起來分享一下。
講到人工智能我們不得不回顧60年前的Dartmouth會議,今天我們都說人工智能60周年,這60年當(dāng)中有了幾次的起伏,比如說第二次人工智能的黃金期是90年代,90年代由于信息技術(shù)的發(fā)展解決了大家的問題,同樣人工智能也沒有達(dá)到大家想要的高度。
隨著近年來深度學(xué)習(xí)概念的提出,2012年語音識別技術(shù)上DNN成功地應(yīng)用,以及2012年CNN在圖像識別上的應(yīng)用,以及2014年機(jī)器翻譯中的應(yīng)用,在深度學(xué)習(xí)、機(jī)器翻譯以及圖象識別等等技術(shù)上的突破,以及我們的大數(shù)據(jù)、我們的運(yùn)算能力不斷加強(qiáng),我們覺得真正的人工智能爆發(fā)即將到來。
其實(shí)不僅是我們這樣提,中國的學(xué)術(shù)界在這樣提,產(chǎn)業(yè)界在這樣提,放眼全球大家都在這樣提,2016世界經(jīng)濟(jì)論壇當(dāng)中有十大經(jīng)濟(jì)技術(shù),大家都提到了AR的生態(tài),在人工智能的百年研究當(dāng)中,斯坦福有一份報告當(dāng)中也提出了2030年人工智能與我們的生活將有怎樣的關(guān)系。我們覺得人工智能比我們想象的要快,麥肯錫的一份報告提到我們有45%的工作都會被機(jī)器代替,連CEO20%的工作都會被機(jī)器人代替,所有報告上的展示我就不一一說了。
我們覺得人工智能發(fā)展經(jīng)歷了三個階段,第一個階段我們所說的叫運(yùn)算智能階段,也就是計(jì)算機(jī)計(jì)算的能力和存儲的能力,第二個是感知智能階段,我們會讓計(jì)算機(jī)會說話,就像奧巴馬一樣,說成英文、中文,以及未來還有韓語、日語等多語種,它不僅支持了我們的普通話,還支持了30多種方言,未來外語也會聽得懂,這是第二個階段。我們最后人工智能一定會進(jìn)入到認(rèn)知智能的階段,它不僅能聽會說,它還要能理解、會思考,會幫我們做更多、更復(fù)雜的工作。
講了人工智能的三個階段,其實(shí)在人工智能發(fā)展過程中有一些比較核心技術(shù)的突破,接下來我就會把幾個核心的技術(shù)給大家做一些分享。
我們說的第一個技術(shù)一定是以語音為入口的人機(jī)交互的技術(shù),它會有聲音的識別、學(xué)習(xí)的推理等等,首先我們看一下語音合成的技術(shù),合成的技術(shù)其實(shí)剛剛奧巴馬的聲音就是已經(jīng)很直觀地給大家感受到了,在我們過去的一些比賽當(dāng)中,我們連續(xù)11年獲得了叫做自然度合成的一個比賽的冠軍。在這個比賽當(dāng)中有美國的MIT等等有參加,訊飛有一個數(shù)據(jù)比較好玩,我們連續(xù)參加了七年訊飛都是第一,今年組委會改變了規(guī)則,我們不比中文,我們比亨利語,我們還是獲得了冠軍。
除了合成之外我們又講了識別,識別技術(shù)其實(shí)也有了比較大的突破,今天早上在我們新年論壇主論壇上展示的就是我們主要的識別技術(shù),識別技術(shù)現(xiàn)在連續(xù)語音識別的轉(zhuǎn)寫率,如果是普通話水平的話,差不多能達(dá)到95%以上。其實(shí)我們在去年12月份跟速記員做過一場對比,我們找了五個業(yè)界資深的速記員和我們的機(jī)器進(jìn)行PK,PK的結(jié)果是速記大概在一小時的轉(zhuǎn)寫的準(zhǔn)確率可以達(dá)到70%,機(jī)器可以達(dá)到90%。
同樣我們在12月份也會有發(fā)布一些除了我們的聽見轉(zhuǎn)寫之外,在全球抗噪情況下,在噪音情況下的一些識別率,平時的時候都是比較安靜的情況,在噪聲環(huán)境下識別率到底怎么樣,等等一系列的比賽。





