麻省理工新科技:不開(kāi)口就能說(shuō)話的耳機(jī)
這樣一個(gè)耳機(jī),幾乎是我們過(guò)去幻想中存在的東西,現(xiàn)在卻離我們不再遙遠(yuǎn)。
不用開(kāi)口就能互相交流,我相信你一定在一些小說(shuō)或電影中看到過(guò)類(lèi)似的橋段,最近,來(lái)自麻省理工的一個(gè)研究團(tuán)隊(duì)開(kāi)發(fā)出了一項(xiàng)新的技術(shù),讓這種愿望得以成真。
這個(gè)被稱(chēng)為 AlterEgo 的裝置由計(jì)算機(jī)和可穿戴設(shè)備兩部分組成,計(jì)算機(jī)部分負(fù)責(zé)信息計(jì)算,而可穿戴部分負(fù)責(zé)信息采集以及傳送。如你所見(jiàn),和我們?nèi)粘R?jiàn)到的可穿戴設(shè)備差別很大。雖說(shuō)是原型機(jī),但它看起來(lái)倒更像是用來(lái)矯正人臉部肌肉的儀器。
這個(gè)儀器實(shí)際上也有兩部分,一部分是用于捕捉面部和下頜神經(jīng)肌肉信號(hào)的傳感器,通過(guò)貼合面部部位從而感知神經(jīng)運(yùn)動(dòng);另一部分是骨傳導(dǎo)耳機(jī),用于將信號(hào)處理結(jié)果反饋給佩戴者。
按照官方說(shuō)法,研究人員發(fā)現(xiàn),人的語(yǔ)言信號(hào)實(shí)際上是內(nèi)部開(kāi)始觸發(fā),也就是當(dāng)你要張嘴說(shuō)話之前,神經(jīng)信號(hào)就已經(jīng)出現(xiàn),并到達(dá)下頜部位。這種人眼無(wú)法察覺(jué)到的信號(hào)是可以被捕捉到的,也因此,只要能讓機(jī)器理解這種電信號(hào)的意義,它就會(huì)“理解”你說(shuō)的話,按照這一思路,你就不難理解為何原型機(jī)這樣設(shè)計(jì)。
雖然聽(tīng)上去不好理解,但只要看看它能做什么你就會(huì)知道有多神奇了。在研究人員設(shè)想中,這一設(shè)備是一種新的人機(jī)交流平臺(tái),可以讓你在不開(kāi)口說(shuō)話的情況下進(jìn)行三種操作。
第一種是物聯(lián)網(wǎng)操控,比如你看電視或者聽(tīng)音樂(lè)時(shí),只需要腦海中想要進(jìn)行操作,就能不張嘴,直接控制這些操作,像換電視頻道,切歌這些操作就非常簡(jiǎn)單,這時(shí)的 AlterEgo 相當(dāng)于如今的智能音箱,當(dāng)你不再需要張嘴就能控制家電了。
第二種功能是充當(dāng)個(gè)人助理,語(yǔ)音助手出現(xiàn)這么多年,可我們還是不太習(xí)慣在公共場(chǎng)合喚醒并操控,但有了這個(gè)儀器,你只需要在心里默念一些任務(wù),計(jì)算機(jī)就會(huì)“聽(tīng)懂”并告訴你結(jié)果,比如查詢(xún)時(shí)間,或者詢(xún)問(wèn)天氣,甚至于在超市買(mǎi)東西算總價(jià),都可以直接心里默念,讓 AlterEgo 的內(nèi)置計(jì)算器告訴你結(jié)果,按照官方設(shè)想,這個(gè)不用開(kāi)口的個(gè)人助理可以為你翻譯,幫你搜索,查單詞,進(jìn)行運(yùn)算,以及設(shè)定鬧鐘,你甚至可以在下棋時(shí)讓計(jì)算機(jī)告訴你下一步要怎樣走最合適。
第三種功能是社交。雖然聽(tīng)上去有點(diǎn)夢(mèng)幻,但事實(shí)上,當(dāng)身邊的人都佩戴上 AlterEgo 設(shè)備時(shí),不用開(kāi)口就能聽(tīng)到對(duì)方想表達(dá)的東西也是可以實(shí)現(xiàn)的事情,這就相當(dāng)于將原本要說(shuō)的話直接傳遞到對(duì)方的耳機(jī)里,和第一種方式物聯(lián)網(wǎng)的交流有點(diǎn)類(lèi)似。
設(shè)想當(dāng)中適合的場(chǎng)景很多
以上三種,都是借助于肌肉傳遞出的電信號(hào),通過(guò)人工智能對(duì)于電信號(hào)的理解做出相應(yīng)的判斷,說(shuō)到底,這和人工智能助手理解語(yǔ)音操作的邏輯類(lèi)似,但卻并不容易。
麻省理工學(xué)院媒體實(shí)驗(yàn)室(MIT Media Lab)學(xué)生 Arnav Kapur 表示這個(gè)原型最初目的是構(gòu)建一個(gè)“IA 設(shè)備”,即“ intelligence-augmentaTIon”設(shè)備,正如它的英文名 AlterEgo 所代表的意義“另一個(gè)自己”一樣,他們?cè)O(shè)想這一設(shè)備將來(lái)會(huì)成為人類(lèi)真正的助手,或者用 Kapur 的話說(shuō),“在某些方面融合人與計(jì)算機(jī),并讓我們認(rèn)知擴(kuò)展。”
從現(xiàn)實(shí)意義出發(fā),項(xiàng)目指導(dǎo)老師 PatTIe Maes 教授認(rèn)為,隨著當(dāng)前人與智能手機(jī)越來(lái)越密切的關(guān)系,也帶來(lái)了一定的破壞性。比如在人和人交流時(shí)一旦需要搜索某些結(jié)果或者查詢(xún)信息,交流就會(huì)被手機(jī)強(qiáng)制打斷,而新的交互體驗(yàn)無(wú)疑可以改變這種破壞性,它未必會(huì)替代手機(jī),但它可以做的更好。
當(dāng)然,從目前的研究來(lái)看,AlterEgo 也存在不小挑戰(zhàn),盡管自 19 世紀(jì)以來(lái)研究者就發(fā)現(xiàn)了身體語(yǔ)言表達(dá)和神經(jīng)肌肉信號(hào)之間存在關(guān)聯(lián),但這種關(guān)聯(lián)究竟怎樣表達(dá),如何能讓計(jì)算機(jī)將神經(jīng)肌肉信號(hào)轉(zhuǎn)化成正確的語(yǔ)言,這些都是困難之處。即便目前,研究人員發(fā)現(xiàn)了下頜的特定位置具有可以傳達(dá)電信號(hào)的能力,但要徹底將這種可能性放大到完全可用的情況,還需要很多努力。
另外,你可能會(huì)好奇設(shè)備的準(zhǔn)確率,研究人員對(duì) 10 名測(cè)試者進(jìn)行了 15 分鐘的測(cè)試,讓他們通過(guò)配搭設(shè)備計(jì)算數(shù)學(xué)題,發(fā)現(xiàn)經(jīng)過(guò) AlterEgo 的系統(tǒng),目前在這項(xiàng)目上的準(zhǔn)確度為 92%,這聽(tīng)上去是一個(gè)不錯(cuò)的消息。
而說(shuō)到不用張嘴就能傳遞信號(hào)的其它運(yùn)用方式,來(lái)自佐治亞理工學(xué)院的教授 Thad Starner 說(shuō),“比如在機(jī)場(chǎng)的停機(jī)坪上要控制飛機(jī),那時(shí)候的巨大噪音通常無(wú)法用語(yǔ)音交流,想象一下在類(lèi)似情況下,當(dāng)周?chē)h(huán)境是高噪聲時(shí),航空母艦、發(fā)電廠、印刷機(jī)等地方,這都是一個(gè)有意義的系統(tǒng)。”他還認(rèn)為在一些身體有殘疾的人群中,這個(gè)設(shè)備能幫助他們實(shí)現(xiàn)更好的生活。
盡管 AlterEgo 還處在原型階段,外形也很夸張,不適合佩戴在公共場(chǎng)合。但這項(xiàng)研究無(wú)疑為我們展現(xiàn)了把人工智能技術(shù)的另一種用途,并嘗試讓人和機(jī)器進(jìn)一步“融合”,當(dāng)相關(guān)技術(shù)不斷迭代并成熟時(shí),相信終有一天,我們會(huì)看到令人大吃一驚的消費(fèi)品。





