日本人与黑人做爰视频网站-中文字幕粉嫩av-91精品国产三级在线观看,k8久久久一区二区三区,美女打扑克网站,天天干天天插

中文
中文  /   English

聲加科技基于 Arm MCU 的語音拾取與增強技術

2022-05-10 1233 發布:聲加科技

背景


人們已愈發習慣使用真無線立體聲 (TWS) 耳機接打電話。無線耳塞不僅佩戴輕便,還可讓用戶在解放雙手的同時進行其他活動。此外,在參加遠程會議時開啟主動降噪 (ANC) 功能也逐漸成為一個普遍現象。


目前的耳機麥克風通常呈一定角度置于嘴部后方,而人們在說話時,聲波會向前方輻射,因此耳機麥克風的拾音效果往往不如手機麥克風理想 (手機麥克風可以靠近嘴部放置)。另外,由于耳機的電池容量和處理器性能有限,在使用TWS耳機通話時,用戶也很難獲得和手機麥克風一樣的通話質量。


人工智能方法與麥克風陣列相結合


為補償語音信號 (尤其是高頻分量、提供清晰音質等) 向前輻射引起的振幅衰減,常采用雙麥克風陣列形成空間定向波束,以增強特定方向的增益,同時消除其他方向的干擾噪聲。


考慮到用戶不同的佩戴角度,波束成形是一個自適應估計過程。這也就意味著如果周圍環境嘈雜,估計誤差就會增大。故而為了避免消除用戶聲音的情況,只能保留來自近似方向的殘留動態噪聲。


機器學習算法的出現則打破了這一限制。深度神經網絡具有較強的非線性建模能力以及對動態噪聲干擾的良好識別性能,區別于傳統的利用統計信號分析來區分噪聲和語音的方法。然而,受限于計算平臺的資源,神經網絡模型本身的魯棒性以及泛化能力在網絡剪枝和量化后也會有所降低,可能不足以覆蓋所有的使用場景。


將自適應波束成形和機器學習方法相結合,可以提升降噪性能,從而使解決方案能夠在嘈雜環境中更好地進行自適應調整。同時,波束成形能夠在空間上濾除周圍環境中的干擾噪聲,從而提高神經網絡輸入信號的信噪比 (SNR)。因此,資源有限的模型也可以穩定地運作。


請看下圖的對比:


1-請看下圖的對比-1.png

圖1:基于空間濾波和頻譜估計的傳統雙麥克風陣列波束成形語音增強


1-請看下圖的對比.png

圖2:人工智能增強的雙麥克風解決方案


可以看出,圖2與圖1有顯著差異。借助深度學習算法,我們可以更準確地區別語音成分和噪聲成分,并補充高頻諧波,從而使語音更加飽滿清晰。


在邊緣部署人工智能語音增強技術的挑戰

返回