在用于聲音和語音控制的傳感器技術方面,創(chuàng)新在各個方面進行著,從音頻設備本身到軟件和算法,以及MEMS麥克風本身的重大改進。人工智能驅動的數據分析
FierceElectronics最近與迪米特里奧斯Damianos,技術與市場分析師和自定義項目業(yè)務開發(fā)談到YoleDéveloppement公司(Yole)對這一趨勢以及如何最終將導致聲音事件檢測,語音識別和環(huán)境感知,甚至是未來的應用程序,如情感/同情傳感使用語音(亞馬遜和蘋果已經擁有專利)。
隨著語音控制的發(fā)展,設計工程師將需要考慮技術的獨特要求和問題。
FierceElectronics(FE):您已經說過,MEMS和傳感器的下一個創(chuàng)新將是用于聲音和語音控制的音頻。但是它已經不在這里了嗎?有什么不同?
Dimitrios Damianos(DD):是的,它在這里。自2003年將MEMS麥克風用于第一部摩托羅拉Razr手機以來,就一直使用它們。從那時起,它們已經走了很長一段路:他們取代了傳統(tǒng)的駐極體電容麥克風(ECM),以提供更好的性能,靈敏度和更低的成本,并且每年出貨數十億個。
自幾年前以來,語音控制作為人機界面(HMI)一直風靡一時?,F在有許多設備包括語音/虛擬個人助理(VPA),例如智能手機,智能手表,以及最近的智能揚聲器和汽車。音頻方面的創(chuàng)新實際上是在更大,更全面的范圍內進行的:MEMS麥克風不僅需要一流的性能(靈敏度),而且還需要低功耗,因為它們用于始終開啟的設備中。另外,必須捕獲高質量的聲音,以便進行有效的處理和高質量的渲染。您知道計算機科學中的概念:垃圾回收,垃圾清理,這意味著如果您想從數據中獲取某些上下文,則它至少必須具有一定的質量。這就是為什么MEMS麥克風持續(xù)改進的原因。
在系統(tǒng)級別,您還需要考慮從設備到音頻編解碼器的整個音頻鏈,音頻軟件和算法(降噪,波束成形等),數字信號處理器(DSP),最后是音頻放大器和揚聲器。因此,在所有這些變量的優(yōu)化上,特別是在使用AI分析數據方面,創(chuàng)新正在各個方面進行,這最終將導致聲音事件檢測,語音識別和上下文感知。