(文章來源:天極網(wǎng))
? ? ?? 語音交互技術是人工智能領域的一大重點,近年來已經(jīng)應用到手機、智能家電、智能硬件等貼近消費電子領域。不過在實際應用中,語音操控的體驗并不是非常好,仍然有不少痛點,繼續(xù)在改善中。
有一個痛點,以前的AI語音是用戶每說一句話都要喊一聲它的名字,如果在下一個命令前沒有再次叫它,它就不會反應。這樣一來,問幾句話就要叫幾聲,真是很累人。
還好,隨著人工智能語音技術的進步,近半年來推出的一些智能新產(chǎn)品已經(jīng)增加了一種語音新技術:連續(xù)語音,或者叫語音連續(xù)識別,總之,這一新技術能夠做到“一次喚醒,連續(xù)識別,多輪對話”,能夠解決上面所說的這種慘痛用戶體驗。
以小米家的小愛同學為例,就可以做到一次喚醒,用戶可以連續(xù)發(fā)送語音指令,并且能隨時打斷它,重新發(fā)出新的指令。米家的一些新產(chǎn)品就已經(jīng)增加了這一功能。百度的AI也有這種一次喚醒多輪對話的語音功能,并且也實際應用到了其AI音箱中,以及其它跟其合作的智能家電產(chǎn)品中。
創(chuàng)維的智能電視、智能空調等新產(chǎn)品都具有智能語音功能,他們的AI語音是內置了百度的。這些智能家電支持用遙控器發(fā)出語音,還支持遠場語音,用戶可以直接對著電視、空調喊話發(fā)指令來操作。近期推出的一些新品也是增加了連續(xù)識別功能,在用“小維小維”喚醒AI后,AI會待命一段時間,這段時間里用戶可以一直與AI對話,不用每交待一個指令之前都要叫一聲小維喚醒它;如果一會沒有用戶指令了,AI才會重新沉睡。實際的體驗相當流暢,可以說完全改善了上文所敘述的痛點。
舊的AI語音大多只能進行單輪對話,無法支持多輪對話,也就是說,AI在你的上一句指令和下一句指令之間建立邏輯聯(lián)系。
單輪對話是指對話內容不包含情景,沒有關聯(lián)上下文內容。這種對話模式導致語音交互更偏向于簡短的操作任務,過于復雜的操作任務,則需要分解成簡短的口令。而新的多輪對話則可以支持在前后幾個命令間建立邏輯關聯(lián)。
指令給出的結果并不是科幻電影中的美國電影,而是又重新進行了一次美國電影的搜索。這一結果當然不夠智能。當然,這說的是一年以前的舊產(chǎn)品,大約2019年以來的新產(chǎn)品都會支持多輪對話了。
除了這些以后,目前還有一些語音技術未成熟,但如果成熟應用的話會給用戶帶來很多便利。比如說,聲紋識別,AI可以識別各個不同人不同用戶的聲音特點,建立用戶檔案,進行個性化推薦,目前這一技術未大規(guī)模應用。
? ? ?





