如何實(shí)現(xiàn)無(wú)需記憶命令的AI語(yǔ)音控制
想想看:語(yǔ)音控制無(wú)處不在——在智能電視、遙控器、智能家居設(shè)備中。然而,大多數(shù)人在第一次嘗試后就不再使用它了。為什么?因?yàn)橹挥挟?dāng)你記住一組嚴(yán)格的命令時(shí),它才有效。漏掉一個(gè)字,系統(tǒng)就會(huì)忽略你。
在VoxControl固件v.2中,這種體驗(yàn)發(fā)生了變化。這是第一次,制造商可以嘗試未來(lái)的設(shè)備應(yīng)該是什么樣子:你自然地說(shuō)話,系統(tǒng)對(duì)你的意思做出反應(yīng),而不僅僅是你的語(yǔ)言。所有這些都直接在您已經(jīng)擁有的ESP32-S3上脫機(jī)運(yùn)行。
為什么重要?
這不僅僅是一個(gè)板的升級(jí)。這是對(duì)未來(lái)設(shè)備將如何傾聽(tīng)和回應(yīng)的一瞥。而不是訓(xùn)練你像機(jī)器一樣說(shuō)話,機(jī)器會(huì)適應(yīng)你。沒(méi)有云服務(wù),沒(méi)有互聯(lián)網(wǎng),沒(méi)有記憶命令——只有自然的聲音輸入,真實(shí)的動(dòng)作輸出。對(duì)于教室、研討會(huì)和演示,它使交互變得毫不費(fèi)力。對(duì)于oem廠商來(lái)說(shuō),這是一個(gè)小而真實(shí)的概念驗(yàn)證,說(shuō)明了語(yǔ)音控制的發(fā)展方向。
用例
基本的機(jī)器人控制。VoxControl v.2可以理解變化,而不是記憶一個(gè)嚴(yán)格的短語(yǔ)。說(shuō)“前進(jìn)”、“前進(jìn)”或“前進(jìn)”——機(jī)器人仍然向前移動(dòng)。這同樣適用于轉(zhuǎn)彎和停車(chē)。
課堂實(shí)驗(yàn)。在機(jī)器人課上,孩子們經(jīng)常忘記“官方”詞匯。現(xiàn)在,一個(gè)學(xué)生可以說(shuō)“向左走”,另一個(gè)說(shuō)“向左轉(zhuǎn)”,兩者都會(huì)使機(jī)器人轉(zhuǎn)彎。重點(diǎn)是學(xué)習(xí),而不是記住小抄。
DIY擴(kuò)展。VoxControl并不局限于機(jī)器人。連接led,風(fēng)扇或小型電機(jī),并映射“停止/停止”來(lái)關(guān)閉它,或“去”來(lái)打開(kāi)它。使用固件v.2,您可以立即將自然語(yǔ)音控制擴(kuò)展到簡(jiǎn)單的DIY項(xiàng)目。
界面原型。如果你好奇人們是如何自然地與設(shè)備交談的,這個(gè)固件是一個(gè)動(dòng)手探索它的方式。通過(guò)測(cè)試不同的短語(yǔ),您可以看到哪些短語(yǔ)感覺(jué)直觀,以及識(shí)別系統(tǒng)應(yīng)該如何響應(yīng)。
它是如何工作的
在引擎蓋下,這是一個(gè)巧妙的技巧。麥克風(fēng)接收語(yǔ)音,ASR模型將其轉(zhuǎn)換為文本,分類(lèi)器將不同的短語(yǔ)映射為相同的動(dòng)作?!扒斑M(jìn)”、“繼續(xù)”或“繼續(xù)”都會(huì)觸發(fā)同樣的行為??雌饋?lái)像理解的東西實(shí)際上是一個(gè)經(jīng)過(guò)精心優(yōu)化的識(shí)別管道,它被打包到ESP32-S3中,并完全在邊緣運(yùn)行。
自己試試
VoxControl的所有者可以請(qǐng)求固件v.2, flash它,并立即看到變化。用你想要的方式說(shuō)出命令,董事會(huì)就會(huì)做出回應(yīng)。前進(jìn)、轉(zhuǎn)彎、停車(chē)——當(dāng)你不需要記住“正確”的短語(yǔ)時(shí),一切都感覺(jué)更流暢、更自然。
請(qǐng)隨時(shí)在Hackster上向我們發(fā)送消息或發(fā)送電子郵件至hi@grovety.com請(qǐng)求固件更新。
接下來(lái)是什么
這次更新僅僅是個(gè)開(kāi)始。如果你們中的許多人要求相同的新單詞或動(dòng)作,我們將在未來(lái)的固件版本中包含它們。通過(guò)嘗試VoxControl v.2,您不僅僅是升級(jí)了一個(gè)板-您正在幫助塑造未來(lái)自然語(yǔ)音控制的工作方式。
分享你的反饋
什么詞最適合你?你希望包括哪些?您的意見(jiàn)將指導(dǎo)下一輪的更新,并使我們更接近我們所期望的傾聽(tīng)方式的設(shè)備。
本文編譯自hackster.io





