你的位置:首頁 > 傳感技術(shù) > 正文

低功耗語音識別技術(shù)應(yīng)該如何增加到電視遙控器中?

發(fā)布時間:2020-09-01 來源:Scott Haylock,QuickLogic的產(chǎn)品營銷總監(jiān) 責任編輯:lina

【導讀】虛擬助理被集成到家中更多的設(shè)備中,亞馬遜最近宣布,它將為Alexa推出包括耳塞、眼鏡和戒指在內(nèi)的多種新型設(shè)備,為消費者提供更多獲取信息的途徑。
 
虛擬助理被集成到家中更多的設(shè)備中,亞馬遜最近宣布,它將為Alexa推出包括耳塞、眼鏡和戒指在內(nèi)的多種新型設(shè)備,為消費者提供更多獲取信息的途徑。
 
在這些新的語音產(chǎn)品中反復(fù)出現(xiàn)的主題是無線和免提的,可輕松地連接到手機或其他主機上,并聆聽指令。其內(nèi)部技術(shù)是一個支持無線連接的藍牙射頻芯片組和運行喚醒字引擎(WWE)的專用嵌入式處理器來識別語音命令。
 
這種趨勢的另一個例子是,每一臺新的平板電視、機頂盒和媒體播放器都配備了遙控器,他們也將很快完全無線和免提。當然,當你想要語音控制的時候,很多人仍然會使用舊的紅外視線遙控模式或者按鍵對話,但這些都很快就過時了。用戶需要一個能無縫響應(yīng)命令的設(shè)備,而不是像對講機那樣必須按住通話鍵的設(shè)備。與最近亞馬遜的電子產(chǎn)品浪潮類似,下一代電視遙控器將是無線和免提的。
 
然而,遙控設(shè)計也帶來了一些獨特的挑戰(zhàn)。例如,遙控器通常不可充電;它們通常使用標準的AA電池。遙控器不僅需要在嘈雜的環(huán)境中表現(xiàn)良好,而且需要在距離你身體3到9英尺的地方,還可以將信息以無線方式即時傳輸?shù)街鳈C設(shè)備上(如電視)。
 
此外,消費者更喜歡使用不需要頻換更換的耐用電池,從本質(zhì)上講,遙控器的性能必須像亞馬遜Echo Dot一樣,但同時功耗還要比入耳式耳機更少。
 
設(shè)計功能強大、高效節(jié)能的遙控器是一個挑戰(zhàn),需要創(chuàng)新的藍牙解決方案和音頻處理解決方案,因為其中每一個改進都會延長電池壽命。
 
使用藍牙5.0/LE解決了傳統(tǒng)紅外的幾個問題。首先,藍牙是一個符合標準的解決方案,因此設(shè)備很容易與現(xiàn)有的藍牙設(shè)備進行通信。此外,藍牙5.0/LE提供了與WiFi設(shè)備相當?shù)膫鬏敺秶?,這非常適合語音遙控器。傳統(tǒng)的藍牙解決方案已經(jīng)針對手機和筆記本電腦進行了優(yōu)化,這些手機和筆記本電腦的電池容量更大,而且藍牙的功耗也沒有那么大。
 
Atmosic公司的創(chuàng)新解決方案,可以顯著降低5倍功耗,與競爭解決方案相比,電池壽命可延長3至5倍。
 
 
低功耗語音識別技術(shù)應(yīng)該如何增加到電視遙控器中?
 
除了極低功耗的藍牙設(shè)計外,還可以使用一個二次喚醒接收器,該接收器功耗可以更低(比標準接收器低20到50倍),使整個藍牙SoC進入深度睡眠狀態(tài);該設(shè)備可以通過另一臺主機的特殊模式喚醒。我們不會在這里詳細介紹這項技術(shù),因為它只適用于少量的專用遙控器。
 
第三種低功耗技術(shù)是利用能量收集來獲取射頻無線能量以延長電池壽命。許多家庭和建筑物都有大量的射頻能量(通常在ISM波段),當遙控器放在桌子上時,可以采集這些能量。根據(jù)能量水平,一個裝置可以獲得幾十微瓦的能量。最終目標是在可能的情況下替代電池電源,將電池的壽命延長到幾年,而目前遙控器的壽命只有6到9個月。對于工業(yè)和特殊用途的遙控器,還可以使用其他能源技術(shù),如太陽能、熱能和運動能量收集。
 
如前所述,要實現(xiàn)真正的免提操作,遙控器必須同時像智能揚聲器一樣工作,但也要像入耳式耳機一樣節(jié)能。像QuickLogic這樣的公司已經(jīng)開發(fā)出高度優(yōu)化、超低功耗的配套器件來配合藍牙芯片組來應(yīng)對這一挑戰(zhàn)。
 
藍牙連接的語音遙控器基本上有三種模式:待機模式、喚醒詞檢測模式和數(shù)據(jù)傳輸模式,功耗也是逐步增加。
 
在待機狀態(tài)下,藍牙和伴生芯片處于休眠狀態(tài),等待周圍環(huán)境中的一些喚醒詞。實現(xiàn)這一點最節(jié)能的方法之一是使用Vesper的麥克風喚醒聲音功能,該功能僅消耗10µA,等待環(huán)境聲超過預(yù)先配置的閾值。在一個典型的起居室用例中,系統(tǒng)在80%的時間內(nèi)處于這種模式。
 
一旦達到閾值水平,就會從麥克風觸發(fā)一個中斷,并喚醒伴隨芯片;此時進入喚醒字檢測模式。伴隨芯片的MCU可以啟動并運行WWE一段時間,以檢測關(guān)鍵字是否被說出。第三方解決方案(如Retune DSP的VoiceSpot WWE)可以在Cortex-M4上運行,只需使用一個麥克風,無需使用多麥克風自適應(yīng)波束形成的計算密集型解決方案,而多麥克風自適應(yīng)波束形成通常是中場(3到9英尺)語音識別所需的。
 
除了明顯的節(jié)省處理器資源外,從系統(tǒng)中減少每一個麥克風還可節(jié)省400至650µA(有功功率)。如果檢測到喚醒字,它會中斷并喚醒藍牙芯片進入數(shù)據(jù)傳輸模式。這是必要的,因為在喚醒字之后的用戶字需要以脈沖編碼調(diào)制(PCM)或壓縮數(shù)據(jù)的形式傳送到主機(如電視)。
 
如果沒有檢測到喚醒字,系統(tǒng)將恢復(fù)到初始待機模式。一些配套芯片,如QuickLogic的芯片,有專用的低功耗聲音檢測(LPSD)硬件,以降低喚醒字檢測模式中使用的平均系統(tǒng)功率。例如,有些風扇聲音有一個高分貝聲壓,但顯然不是講話。LPSD硬件有足夠的智能來感知這一點,并忽略聲音,以避免不必要地運行WWE額外功耗。
 
藍牙5.0/LE非常適合數(shù)據(jù)傳輸模式,因為它可以在低功耗的按需數(shù)據(jù)包中傳輸數(shù)據(jù)。一個理想的伴侶應(yīng)該有足夠的存儲空間和處理能力,以便在將語音數(shù)據(jù)發(fā)送到藍牙設(shè)備之前對其進行壓縮,一個典型的例子是運行Opus音頻編碼器。
 
作者:
Scott Haylock:QuickLogic的產(chǎn)品營銷總監(jiān)。他擁有超過20年的片上系統(tǒng)經(jīng)驗,并擁有密歇根州立大學的學士學位。
 
Srinivas Pattamatta:Atmosic Technologies業(yè)務(wù)開發(fā)的副總裁。他在無線和其他通信技術(shù)方面也有超過20年的經(jīng)驗。獲得俄勒岡州立大學電氣工程碩士學位和圣克拉拉大學工商管理碩士學位。
 
免責聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請電話或者郵箱聯(lián)系小編進行侵刪。
 
 
推薦閱讀:
2021寧波國際照明展覽會
ADI教你如何把PLL鎖定時間從4.5 ms 縮短到 360 μs?
如何使用重定時器和轉(zhuǎn)接驅(qū)動器保持以太網(wǎng)信號完整性?
Frontline推出InShop 先進的工業(yè)4.0軟件解決方案,有效提升整個車間的制造品質(zhì)與產(chǎn)能 
致工程師系列之五:優(yōu)化寬禁帶材料器件的半橋和門驅(qū)動器設(shè)計
要采購麥克風么,點這里了解一下價格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉