設為主頁(yè)  加入收藏
 
·I2S數字功放IC/內置DSP音頻算法功放芯片  ·馬達驅動(dòng)IC  ·2.1聲道單芯片D類(lèi)功放IC  ·內置DC/DC升壓模塊的D類(lèi)功放IC  ·鋰電充電管理IC/快充IC  ·無(wú)線(xiàn)遙控方案  ·直流無(wú)刷電機驅動(dòng)芯片
當前位置:首頁(yè)->方案設計
電子設備中的語(yǔ)音和音頻控制進(jìn)展
文章來(lái)源:永阜康科技 更新時(shí)間:2023/5/17 11:37:00
在線(xiàn)咨詢(xún):
給我發(fā)消息
張代明 3003290139
給我發(fā)消息
小鄢 2850985542
給我發(fā)消息
李湘寧 2850985550
13713728695
 

作者:貿澤電子Mark Patrick

言語(yǔ)是人們表達思想和愿望的一種有效方式。在工業(yè)時(shí)代到來(lái)之前,人類(lèi)發(fā)現動(dòng)物可以被訓練用來(lái)識別和響應讓它們執行某些任務(wù)的基本命令。

下一個(gè)合乎邏輯的發(fā)展應該是開(kāi)發(fā)一種使用聲音信號與機器進(jìn)行交流,并指揮機器行動(dòng)的方法。近年來(lái),以語(yǔ)音和音頻作為電子設備的控制界面越來(lái)越受歡迎,并且這種技術(shù)也在不斷發(fā)展,以滿(mǎn)足用戶(hù)的期望和新應用的要求。

在本文中,我們將解釋用語(yǔ)音和音頻信號控制電子設備和機器的好處,并回顧如何實(shí)現這種控制。我們還將展示這種控制界面現在可以如何能夠嵌入到離線(xiàn)設備,以及它們提供的音頻控制體驗如何能夠大幅度改善。

使用語(yǔ)音控制電子設備

采用語(yǔ)音控制實(shí)現與機器交互有幾個(gè)明顯好處:

• 對人類(lèi)來(lái)說(shuō),語(yǔ)音是一種直觀(guān)的交流形式,這種口頭傳達指令的方式更容易。

• 即使一個(gè)人的眼睛和手正在用于其它事情,語(yǔ)音交流仍然可能。實(shí)時(shí)的語(yǔ)音控制也很方便,例如在駕車(chē)等某些應用場(chǎng)景下,試圖通過(guò)觸摸來(lái)控制車(chē)內其它設備是違法的。

• 語(yǔ)音是控制機器的一種有效媒介,采用語(yǔ)音控制機器,可以在不需要復雜指令的情況下進(jìn)行監聽(tīng)和響應。

• 在設備中集成語(yǔ)音控制能夠最大限度地減少許多設備對觸屏的需求。這對于處于遠程或便攜式電池供電設備來(lái)說(shuō)尤其理想,在這些設備中,減小尺寸和降低功耗是常見(jiàn)的設計挑戰。對于具有多個(gè)用戶(hù)的應用來(lái)說(shuō),去掉觸屏控制也更加符合衛生要求。

• 如圖1所示,對于某些殘疾人來(lái)說(shuō),觸屏控制可能是一種不現實(shí)的選擇,因而語(yǔ)音可以成為一種有效的支持工具。通過(guò)語(yǔ)音與機器進(jìn)行交互可用于執行諸如開(kāi)門(mén)之類(lèi)的任務(wù),或者通過(guò)遠程通信來(lái)傳輸個(gè)人最近的健康狀況。


圖1:聲控機器人助手。(來(lái)源:Shutterstock的PaO_STUDIO)

語(yǔ)音控制設備的音頻前端(AFE)包括麥克風(fēng)陣列和信號處理模塊。AFE能夠處理來(lái)自多通道麥克風(fēng)陣列的信號,以消除任何背景噪聲或設備本身回放產(chǎn)生的干擾。然后,該信號被發(fā)送到“喚醒詞(wake-word)”檢測引擎,例如經(jīng)過(guò)在設備上預先編程,可識別出“Alexa”或“OK Google”等單詞。通過(guò)使用多種信號處理算法,能夠消除多種不需要的干擾信號。語(yǔ)音控制解決方案的組成部分包括:

麥克風(fēng)陣列:語(yǔ)音激活系統需要一個(gè)或多個(gè)麥克風(fēng)來(lái)捕獲音頻控制信號。在選擇麥克風(fēng)陣列時(shí),重要的考慮因素包括尺寸、成本、性能和穩健性。優(yōu)化組合來(lái)自多麥克風(fēng)陣列的不同信號有助于提高音頻信號鏈的信噪比(SNR)。

到達方向(DoA)檢測器:用于確定用戶(hù)相對于被控設備的位置,以便麥克風(fēng)陣列可以將波束調整為語(yǔ)音的方向。

波束成形器:它接受來(lái)自DoA檢測器的聲音,同時(shí)去除來(lái)自其他方向的聲音。其性能取決于麥克風(fēng)陣列的幾何形狀、SNR以及波束寬度和背景噪聲水平等。

聲學(xué)回聲消除器(AEC):它會(huì )消除設備揚聲器本身的播放信號(例如,設備揚聲器正在播放音樂(lè )時(shí)收到語(yǔ)音指令),以便清晰地拾取用戶(hù)語(yǔ)音指令。

自適應干擾消除器(AIC):它能夠消除來(lái)自其他聲音源的外部噪聲,這些噪聲很難用傳統的波束成形器消除,例如,其他設備產(chǎn)生的較大噪聲。

喚醒詞檢測器:將來(lái)自AFE的經(jīng)過(guò)處理語(yǔ)音信號與喚醒詞庫進(jìn)行比較,例如可使用喚醒詞檢測算法的“Hey Google”,這種算法通常是機器學(xué)習模型的一部分。更大的模型則更準確,例如,1MB訓練模型比64kB模型更準確,但處理強度更大。需要大的喚醒詞模型來(lái)準確地檢測喚醒詞,從而減少錯誤警報的數量。

D類(lèi)音頻放大器

該控制界面的語(yǔ)音處理部分經(jīng)過(guò)大量開(kāi)發(fā),現在即使是低成本的設備也能提供準確的語(yǔ)音識別能力。然而,界面的音頻端受到的關(guān)注明顯較少,這意味著(zhù)與高端音頻設備相比,許多早期智能揚聲器和其他支持音頻的物聯(lián)網(wǎng)(IoT)設備所產(chǎn)生的音質(zhì)較差。

與語(yǔ)音控制相關(guān)的任何新產(chǎn)品都可能被認為分散了人們對這些缺點(diǎn)的關(guān)注。然而,隨著(zhù)智能設備越來(lái)越廣泛采用,消費者對其提供的音頻體驗期望也越來(lái)越高。傳統AB類(lèi)音頻放大器的低效率使其無(wú)法用于低功率物聯(lián)網(wǎng)設備,幸運的是,幾家芯片制造商最近推出了一系列高級D類(lèi)音頻放大器,體現了對以前可用音頻放大器的重大改進(jìn),其中許多產(chǎn)品都是專(zhuān)門(mén)為在智能技術(shù)和物聯(lián)網(wǎng)設備中實(shí)現高品質(zhì)音頻而開(kāi)發(fā)。

德州儀器 (Texas Instruments)的TAS277015W輸入音頻放大器能夠提高響度和音頻質(zhì)量,它具有更強的語(yǔ)音捕獲能力,意味著(zhù)語(yǔ)音控制設備的操作更容易、更自然。Maxim Integrated(現在屬于A(yíng)nalog Devices旗下品牌)開(kāi)發(fā)了MAX98357 和MAX98358 D類(lèi)放大器,效率達到92%,可提供3.2W的AB類(lèi)音頻性能,這些放大器的簡(jiǎn)化框圖如圖2所示。Diodes Incorporated的PAM8106具有較低功耗,使其能夠在由1.5V鉛酸電池和3.5V鋰離子電池驅動(dòng)的設備中很好地運行。


圖2:Maxim Integrated D類(lèi)音頻放大器簡(jiǎn)化框圖。(來(lái)源:Maxim Integrated)

離線(xiàn)語(yǔ)音控制

亞馬遜的Alexa和谷歌助手(Google Assistant)等基于云的解決方案很容易用于具有穩定互聯(lián)網(wǎng)連接的設備,但對于那些沒(méi)有穩定互聯(lián)網(wǎng)或根本沒(méi)有連接的設備來(lái)說(shuō),離線(xiàn)語(yǔ)音控制則是一個(gè)更好的解決方案。例如,如果某個(gè)產(chǎn)品需要響應簡(jiǎn)單的單詞指令,如go、stop、reset等(通常稱(chēng)為關(guān)鍵字識別),那么在設備本身進(jìn)行本地處理則很有意義。使用低成本的嵌入式微控制器可以實(shí)現簡(jiǎn)單的關(guān)鍵字指令系統,例如可使用恩智浦(NXP)基于EdgeReady MCU的離線(xiàn)本地語(yǔ)音控制解決方案。它采用i.MX RT交叉MCU,開(kāi)發(fā)人員能夠快速將語(yǔ)音控制集成到他們的產(chǎn)品中。恩智浦基于i.MX RT106S的解決方案包括SLN-LOCAL2-IOT開(kāi)發(fā)工具包,如圖3所示。

該開(kāi)發(fā)工具包配備了在FreeRTOS上運行的全部集成軟件,并提供有軟件開(kāi)發(fā)工具包(SDK),以便快速驗證概念。離線(xiàn)語(yǔ)音控制也有助于解決許多消費者的隱私問(wèn)題,因為他們擔心自己的系統容易受到在線(xiàn)黑客的攻擊。


圖3:恩智浦的SLN-LOCAL2-IOT離線(xiàn)語(yǔ)音控制解決方案。(來(lái)源:恩智浦)

結論

語(yǔ)音和音頻正在快速成為許多智能設備的首選控制界面,這種技術(shù)尤其適合在低功耗和便攜式物聯(lián)網(wǎng)設備中使用,因為它能夠消除對昂貴且耗電的數字顯示器的要求。許多早期系統的音頻質(zhì)量較差,只能使用云連接解決方案來(lái)實(shí)現。

然而,隨著(zhù)新一代高效D類(lèi)音頻放大器的出現,使制造商能夠確保其設備為消費者提供高質(zhì)量的音頻體驗。而且現在也可提供一些其它解決方案,能夠在互聯(lián)網(wǎng)連接不穩定或根本沒(méi)有互聯(lián)網(wǎng)連接的情況下實(shí)現設備的語(yǔ)音控制。這些創(chuàng )新表明,隨著(zhù)人們越來(lái)越習慣這種控制界面,語(yǔ)音控制技術(shù)有能力適應新的需求,而且這種發(fā)展趨勢還會(huì )不斷繼續。

 
 
 
    您可能對以下產(chǎn)品感興趣  
產(chǎn)品型號 功能介紹 兼容型號 封裝形式 工作電壓 備注
NDP6802 NDP6802是一款超高電壓線(xiàn)性穩壓器,寬輸入電壓范圍:4V至85V;輸出電壓:3.3V/5.0V/12V;最大輸出電流:80mA SOT89-3/SOT89-5 4V-85V 85V輸入電壓,80mA,超高電壓線(xiàn)性穩壓器
 
 
·藍牙音箱的音頻功放/升壓/充電管
·單節鋰電內置升壓音頻功放IC選型
·HT7179 12V升24V內置
·5V USB輸入、三節鋰電升壓型
·網(wǎng)絡(luò )主播聲卡專(zhuān)用耳機放大IC-H
 
M12269 河北發(fā)電機組 HT366 ACM8629 HT338 

業(yè)務(wù)洽談:手機:13713728695(微信同號)   QQ:3003207580  EMAIL:panbo@szczkjgs.com   聯(lián)系人:潘波

地址:深圳市寶安西鄉航城大道航城創(chuàng )新創(chuàng )業(yè)園A5棟307/309

版權所有:深圳市永阜康科技有限公司  備案號:粵ICP備17113496號

在线亚洲人成电影_中文有码国产精品欧美激情_免费大片一级a一级久久三_av天堂东京热无码专区