截至7月12日,科大訊飛(002230.SZ)在蘋果App Store上傳的智能語音軟件“訊飛語點”依舊處于“Waiting For Review”(等待審核)狀態(tài)。
“訊飛語點6月20日提交,蘋果一直到7月5天日通知我們被拒絕上架,理由是我們沒有提供該App在使用中的視頻。”科大訊飛副總裁江濤告訴記者,一般蘋果的應用僅需7-10天就上傳成功。
7月9日上午,科大訊飛又按照蘋果的要求拍了一段視頻繼續(xù)上傳訊飛語點。訊飛方面懷疑,蘋果可能是為其中文版Siri讓路,從而拒絕掉同類第三方產品上架。
7月11日,記者就訊飛語點在蘋果App Store被拒一事向蘋果中國區(qū)公關部致信詢問,截至發(fā)稿時尚未收到回復。
訊飛語點是一款針對個人用戶的智能語音手機軟件,可以實現(xiàn)語音控制打開網頁和程序等功能,和Siri很類似。此前,雖然已經擁有訊飛語音輸入法等B2C產品,但科大訊飛主要收入仍來自B2B的行業(yè)應用。該公司剛剛預告其上半年盈利將同比增長40%-50%,也是得益于其語音識別技術在全國各個行業(yè)的大面積應用,尤其教育行業(yè)。據(jù)了解,由于技術領先,訊飛語音產品授權費用賣得很貴。
蘋果商店受阻
在此之前,訊飛在Android操作系統(tǒng)上推出了“訊飛語點”。訊飛副總江濤指出,之所以率先選在Android系統(tǒng)上線,是因為Android系統(tǒng)更加開放,能實現(xiàn)多任務調取,而蘋果iPhone版有許多功能被迫被放棄。
一位剛剛去訊飛考察過的某知名投資機構副總裁向記者分析,即使訊飛的產品進入蘋果App Store,一樣面臨蘋果Siri的巨大競爭,因為蘋果將Siri集成在操作系統(tǒng)底層,它可以和其它蘋果應用深度綁定。
未來將語音識別植入到手機系統(tǒng)底層是大勢所趨,蘋果、谷歌都已經動手。除此之外,國內的一些手機Android ROM廠商也在開發(fā)類似產品,把語音技術植入到操作系統(tǒng)深層。相比之下,訊飛的B2C手機軟件產品更多做成一個App,例如訊飛語點、訊飛輸入法、開心熊寶。
江濤表示,訊飛也試圖將自己的語音技術賣給蘋果,但由于種種原因未能如愿。蘋果目前用的是全球最大語音技術公司Nuance的產品。按照訊飛的說法,在中文識別技術上,訊飛要強于外來的Nuance。
“我們和蘋果的利益是一致的。”江濤指出,因為蘋果最核心的價值點還是在出售iPhone硬件上。他認為,訊飛語點能讓蘋果用戶獲得更好的體驗從而帶動蘋果硬件銷售。江濤表示,蘋果的Siri進來對訊飛是好事情,“蘋果的市場教育能力是我們不能比的”。
江濤指出,在盈利模式上,訊飛的B2C業(yè)務基本走互聯(lián)網的路線,而互聯(lián)網所有的產品基本特征都是要形成規(guī)模用戶,再根據(jù)服務的特點才形成價值。但他表示目前還不便透露具體的盈利模式,但公司已經有較多的規(guī)劃。
一家同樣在將語音技術用于B2C領域的某移動互聯(lián)網公司高管則分析,目前移動互聯(lián)網的變現(xiàn)鏈條太長,更多的是作為長線的布局,因此這塊業(yè)務短期內不會為訊飛帶來直接的收益。
對手入場
“訊飛的業(yè)務,主要分為語音引擎和語音合成兩塊。”一位不久前剛剛去訊飛考察過的某知名投資機構副總裁指出,目前訊飛的主要收入多來自語音合成這塊,語音引擎的收入剛剛開始。
語音引擎是將人講話的聲音識別出來,而語音合成則是用電腦模擬真人的說話。在語音合成方面,訊飛在國內具有絕對的領先地位,而在語音引擎方面,訊飛可能面臨其他公司的競爭。語音引擎技術的關鍵在于算法和數(shù)據(jù)采樣。在算法上,國際上已經有許多公開的資料、文獻,大家的水平差別不會太大。
真正奠定訊飛在語音引擎領域江湖地位的,是其國內最全的語音數(shù)據(jù)庫。由于訊飛的產品最先在國內大規(guī)模商用,因此相對于其它幾家的語音產品,訊飛的引擎在國內應用的范圍最廣、用戶最多,這讓訊飛積累了豐富的用戶語音數(shù)據(jù)——這些數(shù)據(jù)庫可以讓訊飛的語音識別更加準確。
“等到訊飛的語音數(shù)據(jù)庫積累到一定程度,數(shù)據(jù)就飽和了,就不會對其體驗改進起到什么新的作用,反而會加重其數(shù)據(jù)處理負擔。”國內一家語音識別企業(yè)的高管指出,其它語音識別廠商的技術正在逐步追趕上訊飛,屆時有望打破訊飛在這一領域的壟斷。
對此江濤強調,盡管競爭對手在追趕,但訊飛自己的語音技術也在不斷迭代發(fā)展中,訊飛對自己在技術上的領先抱有信心。
上述投資人近期曾挨個調研過國內主要的語音識別企業(yè),他認為北京的納象立方和另一個從盛大出來創(chuàng)業(yè)的團隊都可能是訊飛的強勁對手。
其中北京納象立方已在業(yè)內小有名氣,該公司由松禾資本投資,納象立方的技術在電視臺等媒體中應用廣泛,中央電視臺和北京電視臺都是其客戶,主要用于電視臺便利地進行字幕制作,該公司也有較強的技術積累。
另外一個從盛大出來的團隊的技術實力也很強。這個團隊此前在摩托羅拉進行語音技術的開發(fā),其負責人名叫黃偉。摩托羅拉的語音識別團隊曾經在業(yè)內有很高的地位,但在金融危機期間,摩托的整個語音識別團隊被賣給了Nuance——全球排名第一的語音技術供應商。
黃偉于2009年7月加入盛大網絡旗下的創(chuàng)新院,并于2010年10月創(chuàng)建了語音分院。2010年五月,他帶領團隊參加由美國國家標準技術署主辦的“聲紋識別評測(Speaker Recognition Evaluation, SRE )”大賽,取得綜合排名第一的好成績,力壓美國麻省理工、斯坦福等名校和機構,并在一些國際比賽中力壓科大訊飛。
但在此后,黃偉由于種種原因離開了盛大創(chuàng)業(yè),他帶領的這一團隊在投資界估值非常之高。有消息稱,黃偉的團隊近期剛剛獲得某上市公司CEO的投資。
上述投資人指出,在B2C業(yè)務上,訊飛的真正對手可能是國內的互聯(lián)網公司。不管是騰訊、百度還是盛大,都非常重視語音這塊業(yè)務。
2010年,騰訊宣布2億打造合肥研發(fā)中心,此后又成立了全資子公司合肥世紀訊微,開發(fā)和訊飛類似的語音技術。知情人士透露,該公司的辦公樓就在訊飛斜對面,并已經從訊飛挖走了幾十號人。在利用語音技術通過互聯(lián)網變現(xiàn)方面,騰訊、百度等顯然有著更豐富的經驗。
“我們和國內的主要互聯(lián)網公司都有合作,主要是賣授權的方式。”江濤強調,訊飛和互聯(lián)網巨頭之間是合作關系。[!--empirenews.page--]





