第一個神經(jīng)語音模塊的制造商:tinyTTS套件
多年來,我們通過播放MP3片段讓電路板“說話”。非常適合用于演示—直到您需要新單詞或?qū)崟r值。少量固定的短語、大的閃光足跡和缺乏靈活性意味著每次更改都需要重復。
我們問了一個不同的問題:微控制器能在飛行中產(chǎn)生聲音嗎?云TTS幾年前就證明了這個想法;我們希望在邊緣上,在使用小電池的硬件上也能有同樣的自由。
因此,我們將CrowPanel Advance 5.0 HMI (ESP32-S3, Arduino/LVGL)與基于Himax HX6538 (Cortex-M55 + Ethos-U55)構(gòu)建的GRC TinyTTS Kit配對進行合成。變化是即時的:不再播放-設備在說話。
演示流程很簡單:
?用戶在PC上輸入文本。
?文本通過USB發(fā)送到CrowPanel (ESP32-S3)。
?CrowPanel通過UART將文本轉(zhuǎn)發(fā)到TinyTTS工具包。
?HX6538可以實時合成語音。
?音頻通過模塊的3.5毫米插孔播放到外部揚聲器或耳機。
是的,你可以輸入任何你想要的文本。甚至有幾個段落會被大聲朗讀。
為什么它很酷
當董事會不是在假裝聲音,而是在創(chuàng)造聲音時,感覺就不一樣了。
?任何短語,不只是一個庫。
?數(shù)字,日期,傳感器值生成的需求。
?帶有精確細節(jié)的動態(tài)警告。
?閃存留下干凈-沒有成堆的音頻文件。
?離線工作-沒有云,沒有延遲。
這就是按下播放鍵和進行對話的區(qū)別。
適合的地方
我們認為TinyTTS可以在以下方面發(fā)揮作用:
?能讀出有效值的傳感器,
?設備會說出自己的錯誤,
?機器人講述他們的行動,
?帶有靈活對話的玩具或?qū)W習工具包,
?在正確的時間發(fā)出正確警報的安全系統(tǒng)。
但老實說,這只是我們的猜測。真正的“哇”可能來自我們想象不到的地方。
已知的限制
?最適合短至中等文本;很長的段落是可以的,但不是主要目標。
?語音質(zhì)量調(diào)整為MCU內(nèi)存,而不是高保真。
?有限的聲音/語言(現(xiàn)在只有英語)。
?需要外部揚聲器(通過3.5毫米插孔)。
硬件要求
?CrowPanel Advance 5.0 HMI (ESP32-S3, Arduino/LVGL)
?GRC TinyTTS套件(Himax HX6538, Cortex-M55 + Ethos-U55) -目前僅限預訂-聯(lián)系我們hi@grovety.com
?USB-C線(用于閃爍CrowPanel)
?UART跳線(TX/RX + GND)
?有源揚聲器或耳機(3.5毫米插孔)
布線
?CrowPanel TX→TinyTTS RX
?CrowPanel RX→TinyTTS TX
?GND→GND
?音頻輸出:3.5毫米插孔上的TinyTTS→揚聲器
?電源:USB-C (CrowPanel)和5v (TinyTTS)
將CrowPanel上的UART1-OUT開關(guān)設置為WM模式(見圖)。
固件和軟件
?Flash CrowPanel與提供的Arduino草圖(LVGL文本輸入+ UART輸出)。
?GRC TinyTTS套件帶有預先閃現(xiàn)的固件,用于設備上合成。
?源代碼和示例可在GitHub。
運行Demo
?通過USB-C連接CrowPanel到您的PC并上傳演示草圖。
?Wire CrowPanel?GRC TinyTTS over UART。
?將揚聲器插入TinyTTS上的3.5毫米音頻插孔。
?啟動CrowPanel
?從python/app中運行一個應用程序,在PC上輸入文本,將其發(fā)送到CrowPanel,然后按CrowPanel觸摸屏上的“Say”。
?TinyTTS模塊將合成并播放語音。
接下來是什么
這個設置不僅僅是一個演示——它是一個測試新想法的游樂場。使用GRC TinyTTS工具包,您可以快速原型語音功能,并看到它們在真實硬件中的感覺。一旦原型按您想要的方式工作,您就可以將GRC TinyTTS套件放入另一個環(huán)境- Arduino項目,甚至直接放入工作設備中。這樣,同樣的技術(shù)可以順利地從實驗轉(zhuǎn)移到生產(chǎn)。
總結(jié)
當一塊光禿禿的木板突然開始說話時,那是一種奇怪而又快樂的感覺。這讓我想起了我做第一個無線電接收機的時候,打開它——它說話了。
本文編譯自hackster.io





