隨著科技的不斷發(fā)展,無論是虛擬世界還是現(xiàn)實世界都在經(jīng)歷著一場前所未有AI變革戰(zhàn)。
1月16日,百度輸入法搞了一場名為“AI·新輸入 全感官輸入2.0”的發(fā)布會,發(fā)布了其宣稱為“國內(nèi)首款真正意義上的AI輸入法”的百度輸入法AI探索版,百度高級副總裁王海峰表示,“百度輸入法將扮演好溝通橋梁的重要角色,讓人機(jī)交互進(jìn)入一個全新的階段”。
可以說,百度輸入法正是目前的業(yè)內(nèi)標(biāo)桿。這也是第一家真正思考AI時代人機(jī)交互的輸入法產(chǎn)品。
借用AI優(yōu)勢 語音交互開啟“百度式”新體驗
從PC時代到移動互聯(lián)網(wǎng)時代,輸入法可以說完美的呈現(xiàn)了人機(jī)交互的升級變革,尤其是AI技術(shù)的應(yīng)用,讓這種笨重機(jī)械式的搜索工具有了更加人性化的一面,這對于游走于內(nèi)容世界的我們來說無疑是技術(shù)入局后的體驗升級,而語音作為人誕生以來最天然的交互方式但卻一直沒有在這場升級大戰(zhàn)中完美釋放,這對于那些信奉“技術(shù)改變世界”的變革者來說無疑是遺憾的。
自從百度高調(diào)開啟AI戰(zhàn)略以來,百度系產(chǎn)品就進(jìn)行了一系列的智慧化變革,而輸入法作為內(nèi)容和人類銜接的完美橋梁,在這樣一個AI時代也迎來了應(yīng)有的尊重,百度作為內(nèi)容產(chǎn)業(yè)的佼佼者,不僅借助了自己強(qiáng)有力的內(nèi)容產(chǎn)業(yè)閉環(huán),更重要的是在新一輪產(chǎn)業(yè)升級時期,百度把過去的搜索引擎,變成“搜索+信息流”的雙引擎產(chǎn)品。在融入AI之后,把過去搜索引擎時代的人找信息,變成信息、服務(wù)找人。既能讓用戶找到信息,也能讓信息找到用戶,重構(gòu)了新型信息服務(wù)體驗。
據(jù)百度高級副總裁王海峰表示,輸入法是離用戶最近的產(chǎn)品之一,也是AI落地的“橋頭堡”,百度全方位的AI能力正在不斷賦能輸入法,讓輸入法更”聰明“。他也給出了輸入法行業(yè)的“未來畫像”,雖然目前的輸入法產(chǎn)品主要應(yīng)用于手機(jī)端,但未來的輸入法將應(yīng)用于各種智能設(shè)備與用戶的交互,并走向世界,為全球用戶提供更多元的輸入方式。
多樣式玩法激變 革新固有化輸入法邏輯
既然是一款百度輸入法AI探索版,那就不會只停留在AI在語音交互層面的價值,否則“探索”二字將變得毫無意義。
為了更好的激發(fā)用戶的交互熱情,百度輸入法AI探索版的“新探索”推出了凌空手寫,用手指在攝像頭取景范圍內(nèi)的空中手寫,輸入法即可識別并生成文字。乍看這是利用手機(jī)攝像頭和AI技術(shù)的一種新奇玩法,而事實上,這意味著輸入法有了脫離PC和手機(jī)的機(jī)會,比如,在目前已有的案例中,百度輸入法凌空手寫技術(shù)已經(jīng)在小尋手表、小天才電話手表上得到應(yīng)用。
當(dāng)然了,這只是“探索”價值的一面,伴隨著百度語音、視覺、自然語言處理、知識圖譜等百度AI技術(shù)落地輸入法,“全感官”的輸入變成現(xiàn)實。除了語音輸入,百度輸入法AI探索版還推出了拍立活、秀場、凌空手寫等新功能玩法。無論是心愛的偶像,還是日夜陪伴的寵物,“拍立活”功能都可以讓用戶通過自己的動作“驅(qū)動”對方做出相同表情;“秀場”功能運用圖像分割技術(shù),讓用戶“穿越”到不同的虛擬場景之中,科技、清新、賽博朋克多種風(fēng)格隨意挑選,表情創(chuàng)作更具場景感、更加生活化;凌空手寫如同隔空打怪,在空中書寫也能被流暢識別,目前整體識別率已達(dá)到大規(guī)模應(yīng)用的要求。
從百度輸入法AI探索版的表現(xiàn)形式來看,可以說完全打破了用戶對輸入法的固有認(rèn)知,除了敲鍵盤、語音交互這些思維意識形態(tài)存在的畫面感以外,百度輸入法AI探索版完全將用戶拉到了另一個產(chǎn)品空間,通過技術(shù)加碼后的產(chǎn)品形態(tài)不僅更好的吸引了用戶,更重要的是這種新方式的內(nèi)容交互為百度后期迎接產(chǎn)業(yè)升級的萬物互聯(lián)打下了銜接基礎(chǔ),在助推產(chǎn)業(yè)升級的同時也為用戶帶去了更加多元化的場景新體驗。
深挖用戶需求 極致體驗助推人類返璞歸真
不過,作為一款用戶驅(qū)動的產(chǎn)品,玩法的“千姿百態(tài)”無疑是吸引用戶圍觀的有效法寶,但如何釋放用戶的后發(fā)實力,才是產(chǎn)品得以生生不息的關(guān)鍵所在。
而百度輸入法AI探索版作為一款默認(rèn)輸入方式為全語音輸入的產(chǎn)品,無疑是會把語音交互打造成產(chǎn)品的重要亮點,而對于語音交互而言,其首要難題就是如何通過用戶的語音輸出準(zhǔn)確的完成語義表達(dá)呢?為此,百度輸入法特意發(fā)布了在線語音的“流式截斷多層注意力建模”(SMLTA)技術(shù),按其說法,是“世界上首次實現(xiàn)了局部注意力建模識別精度超過全局注意力模型”,以及“世界上第一次大規(guī)模部署在線語音交互注意力模型”。該技術(shù)可以解決傳統(tǒng)模型存在的“時延性”問題,百度方面宣稱其“將在線語音識別精度提升了15%,超越行業(yè)最高水平15%”。
而且,除了語音識別精準(zhǔn)度以外,百度輸入法AI探索版還專門針對方言進(jìn)行了優(yōu)化,通過“方言與方言、方言與普通話的混合語音輸入”技術(shù),從而實現(xiàn)無縫切換,用戶可實現(xiàn)“自由說”。與此類似地,中英文夾雜亦可來回切換。目前為止,百度輸入法應(yīng)當(dāng)是市面上唯一實現(xiàn)了高精度中英文混合語音輸入、方言免切換語音輸入的輸入法產(chǎn)品。
同時,在離線語音識別領(lǐng)域,為解決用戶多元輸入場景的需求,百度持續(xù)優(yōu)化Deep Peak 2系統(tǒng),讓離線語音輸入相對準(zhǔn)確率再次提升,高于行業(yè)平均水平35%。即使用戶處于地鐵、電梯、隧道或人流密集等離線場景中,依然可以借助百度輸入法進(jìn)行精準(zhǔn)的語音輸入。
截至2018年底,百度輸入法月活躍人數(shù)已達(dá)5億,語音日請求量峰值突破5.5億,AR表情使用次數(shù)超過1億。同時,百度海外輸入法全球安裝量超過1億,支持120種語言,覆蓋全球190個國家地區(qū),并與超過100個全球知名IP達(dá)成合作,實現(xiàn)技術(shù)與市場的雙豐收。
縱觀歷史長河,PC時代,輸入法要通過鍵鼠讓我們和機(jī)器交互;移動互聯(lián)網(wǎng)時代,觸摸屏又取代鍵鼠,成了輸入法新的承載者。試想一下,在鍵盤、鼠標(biāo)、觸摸屏等一系列交互手段之后,以智能語音為代表的對話式人工智能將會產(chǎn)生什么樣的產(chǎn)業(yè)形態(tài)呢?
或許,屬于百度的時代將再一次開啟!





