日本人与黑人做爰视频网站-中文字幕粉嫩av-91精品国产三级在线观看,k8久久久一区二区三区,美女打扑克网站,天天干天天插

中文
中文  /   English

聲加科技助力小米首款支持本地命令詞語音喚醒TWS耳機上市

2019-09-25 650 發(fā)布:admin

9 24 日,小米新一代真無線藍牙耳機 Air 2正式亮相,在外形和功能上都較一代有了非常大的變化。小米官方海報廣告詞宣稱“智能真無線,輕松舒適戴”,并且將“智能語音喚醒,雙麥克風(fēng)降噪”作為其首條宣傳賣點。目前該產(chǎn)品已在小米商城開放預(yù)約,927日正式上市。

小米1.png

小米Air2宣傳海報,圖片來源于小米官網(wǎng)

Air2的語音喚醒到底有多智能呢?據(jù)本次算法技術(shù)支持方案商——聲加科技CEO邱鋒海介紹,此次小米Air2采用了聲加科技提供的耳機本地語音識別方案,與市面同類產(chǎn)品最大的不同是能直接在Air2耳機端完成多命令詞語音識別,急速響應(yīng)命令——用戶在播放音樂時無需喚醒語音助手“小愛同學(xué)”,可直接向耳機發(fā)出語音指令“上一首/上一曲”,“下一首/下一曲”,迅速實現(xiàn)自由切歌,無需再等待語音助手喚醒手機進行響應(yīng),大大提高了用戶使用體驗。

小米2.png

小米Air2宣傳海報,圖片來源于小米官網(wǎng)

邱鋒海表示,耳機搭載語音助手已經(jīng)成為目前TWS耳機的主流趨勢,但目前市面上絕大部分產(chǎn)品使用的還是以基于手機的語音識別方案,用戶每一次的語音指令都要首先喚醒手機語音助手,造成響應(yīng)速度較慢(切換歌曲需要等待5~6秒),不少用戶因此放棄了語音喚醒功能,寧可使用手勢或按鍵,甚至只能拿出手機進行操作,體驗欠佳。其原因主要受限于耳機運算能力較弱以及電池續(xù)航時間短,給耳機端進行精確的語音識別造成了極高難度。而聲加科技的小資源關(guān)鍵詞喚醒(KWS)有限語音命令方案攻克了技術(shù)難點,可實現(xiàn)喚醒低功耗計算方案,KWS啟動和手機語音交互,有限語音命令實現(xiàn)切歌、調(diào)音量等基本操作。在算法所需資源消耗上,低至30Mips, 50KBytes memory的喚醒詞模型(m4f平臺),模型規(guī)模可變,能根據(jù)產(chǎn)品計算資源快速調(diào)整模型,還能整合聲加自有前端語音增強,優(yōu)化整體性能。

除此之外,耳機使用場景復(fù)雜且運算資源受限,如果只依靠基于深度學(xué)習(xí)的小資源語音識別模型,在嘈雜環(huán)境下會存在誤識率高、識別率低的問題。而Air2同時還搭載了聲加科技的雙麥SVE降噪技術(shù),如定向拾音、環(huán)境降噪(尤其是風(fēng)噪抑制)等,能有效降低通話時的環(huán)境噪聲,即使身處嘈雜環(huán)境,也能保障高清晰的語音識別以及通話質(zhì)量。


聲加科技SVE(Soundplus Voice Enhancement)降噪技術(shù)可以廣泛應(yīng)用于耳塞式耳機、半入耳式耳機、入耳式耳機、頭戴式耳機、掛耳式耳機等,是通過雙麥克風(fēng)陣列,精準計算通話者說話的方位,在保護主方向目標語音的同時,去除環(huán)境中的各種干擾噪聲,例如其他人的講話聲、交通工具產(chǎn)生的噪音、風(fēng)噪聲等等,有效抑制90%的反向環(huán)境噪聲,由此降低環(huán)境噪聲最高可達30dB,保證高品質(zhì)通話效果。讓使用者無論身處何種嘈雜環(huán)境,都可細語輕聊,無懼干擾。其核心技術(shù)包括:

回聲消除AEC:

支持單通道回聲抵消、雙通道立體聲回聲抵消,可在設(shè)備自身播放大音量時輕松喚醒,ERLE>30dB。


聲源定位Direction of arrival estimation:

支持多源定位;可在強混響及噪聲干擾情況下準確定位目標聲源;工作信噪比可低至0db以下;DOA分辨率<10°。


波束形成Beamforming:

保護目標語音的同時,去除噪聲干擾與散射噪聲,大幅提高語音識別率;穩(wěn)態(tài)噪聲抑量>30dB,非平穩(wěn)噪聲印制量>24dB。

?

關(guān)鍵詞喚醒、有限語音命令詞識別Key word spotting、command:

基于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,根據(jù)前端算法進行深度優(yōu)化,精確辨識關(guān)鍵詞,超低誤喚醒。消耗資源配置靈活(小模型超低資源占用;資源豐富時可實現(xiàn)高性能識別),可應(yīng)用于耳機、手環(huán)、手表等可穿戴智能設(shè)備。5米喚醒率>93%,3米喚醒率>97%,誤喚醒<2次/48H。


基于機器學(xué)習(xí)降噪/識別

已成功用于聲學(xué)建模,與標準GMM模型相比語音識別率實現(xiàn)了大幅改進,DNN是全連接神經(jīng)網(wǎng)絡(luò),解決了局部最優(yōu)解的問題;卷積神經(jīng)網(wǎng)絡(luò)CNN降低模型體積,充分利用語譜中的局部信息;循環(huán)神經(jīng)網(wǎng)絡(luò)RNN可以對時間序列進行建模,適合處理語音信號。對動態(tài)/穩(wěn)態(tài)噪聲均有效(~30dB)同時保護語音成分,表現(xiàn)魯棒。


音效:

EQ均衡:通過對各種不同頻率的電信號的調(diào)節(jié)來補償揚聲器和聲場的缺陷,補償和修飾各種聲源及其它特殊作用。

虛擬環(huán)繞聲:在雙聲道立體聲的基礎(chǔ)上,不增加聲道和音箱,把聲場信號通過電路處理后播出,使聆聽者感到聲音來自多個方位。

?

?SVE開啟前后對比(風(fēng)噪):

風(fēng)噪1.jpg


*點擊下方音頻文件,馬上感受聲加科技SVE強大功能: