如何實(shí)現(xiàn)無需記憶命令的AI語音控制
想想看:語音控制無處不在——在智能電視、遙控器、智能家居設(shè)備中。然而,大多數(shù)人在第一次嘗試后就不再使用它了。為什么?因?yàn)橹挥挟?dāng)你記住一組嚴(yán)格的命令時(shí),它才有效。漏掉一個(gè)字,系統(tǒng)就會(huì)忽略你。
在VoxControl固件v.2中,這種體驗(yàn)發(fā)生了變化。這是第一次,制造商可以嘗試未來的設(shè)備應(yīng)該是什么樣子:你自然地說話,系統(tǒng)對(duì)你的意思做出反應(yīng),而不僅僅是你的語言。所有這些都直接在您已經(jīng)擁有的ESP32-S3上脫機(jī)運(yùn)行。
為什么重要?
這不僅僅是一個(gè)板的升級(jí)。這是對(duì)未來設(shè)備將如何傾聽和回應(yīng)的一瞥。而不是訓(xùn)練你像機(jī)器一樣說話,機(jī)器會(huì)適應(yīng)你。沒有云服務(wù),沒有互聯(lián)網(wǎng),沒有記憶命令——只有自然的聲音輸入,真實(shí)的動(dòng)作輸出。對(duì)于教室、研討會(huì)和演示,它使交互變得毫不費(fèi)力。對(duì)于oem廠商來說,這是一個(gè)小而真實(shí)的概念驗(yàn)證,說明了語音控制的發(fā)展方向。
用例
基本的機(jī)器人控制。VoxControl v.2可以理解變化,而不是記憶一個(gè)嚴(yán)格的短語。說“前進(jìn)”、“前進(jìn)”或“前進(jìn)”——機(jī)器人仍然向前移動(dòng)。這同樣適用于轉(zhuǎn)彎和停車。
課堂實(shí)驗(yàn)。在機(jī)器人課上,孩子們經(jīng)常忘記“官方”詞匯?,F(xiàn)在,一個(gè)學(xué)生可以說“向左走”,另一個(gè)說“向左轉(zhuǎn)”,兩者都會(huì)使機(jī)器人轉(zhuǎn)彎。重點(diǎn)是學(xué)習(xí),而不是記住小抄。
DIY擴(kuò)展。VoxControl并不局限于機(jī)器人。連接led,風(fēng)扇或小型電機(jī),并映射“停止/停止”來關(guān)閉它,或“去”來打開它。使用固件v.2,您可以立即將自然語音控制擴(kuò)展到簡單的DIY項(xiàng)目。
界面原型。如果你好奇人們是如何自然地與設(shè)備交談的,這個(gè)固件是一個(gè)動(dòng)手探索它的方式。通過測(cè)試不同的短語,您可以看到哪些短語感覺直觀,以及識(shí)別系統(tǒng)應(yīng)該如何響應(yīng)。
它是如何工作的
在引擎蓋下,這是一個(gè)巧妙的技巧。麥克風(fēng)接收語音,ASR模型將其轉(zhuǎn)換為文本,分類器將不同的短語映射為相同的動(dòng)作?!扒斑M(jìn)”、“繼續(xù)”或“繼續(xù)”都會(huì)觸發(fā)同樣的行為??雌饋硐窭斫獾臇|西實(shí)際上是一個(gè)經(jīng)過精心優(yōu)化的識(shí)別管道,它被打包到ESP32-S3中,并完全在邊緣運(yùn)行。
自己試試
VoxControl的所有者可以請(qǐng)求固件v.2, flash它,并立即看到變化。用你想要的方式說出命令,董事會(huì)就會(huì)做出回應(yīng)。前進(jìn)、轉(zhuǎn)彎、停車——當(dāng)你不需要記住“正確”的短語時(shí),一切都感覺更流暢、更自然。
請(qǐng)隨時(shí)在Hackster上向我們發(fā)送消息或發(fā)送電子郵件至hi@grovety.com請(qǐng)求固件更新。
接下來是什么
這次更新僅僅是個(gè)開始。如果你們中的許多人要求相同的新單詞或動(dòng)作,我們將在未來的固件版本中包含它們。通過嘗試VoxControl v.2,您不僅僅是升級(jí)了一個(gè)板-您正在幫助塑造未來自然語音控制的工作方式。
分享你的反饋
什么詞最適合你?你希望包括哪些?您的意見將指導(dǎo)下一輪的更新,并使我們更接近我們所期望的傾聽方式的設(shè)備。
本文編譯自hackster.io





