日本人与黑人做爰视频网站-中文字幕粉嫩av-91精品国产三级在线观看,k8久久久一区二区三区,美女打扑克网站,天天干天天插

中文
中文  /   English

獲數千萬元Pre-A輪融資 聲加科技要解決復雜場景下的“語音交互”

2020-01-15 5024 發布:admin

近日,智能聽覺領域的創新公司——聲加科技對外宣布,其已于2019年11月完成數千萬元的Pre-A輪融資,由廈門半導體投資集團領投、搜狗跟投。這也是聲加科技繼中科創星和萬魔聲學后又斬獲的兩大知名資本,將主要用于聲學算法的持續迭代、部分技術的授權,以及開拓新市場、優化商業模式等,實現為客戶提供模組、整體系統等多樣形態的產品和服務。

image.png

聲加科技CEO邱鋒海


廈門半導體表示,智能語音市場增長潛力巨大,但現有聲學技術的商業應用仍然處于初級階段,主要涉及物理聲學等基礎學科的聲學技術,其中的語音前端處理便是實現語音交互的瓶頸之一。而要解決語音前端的諸多問題,需要像聲加科技這樣具有多年聲學前端處理技術積累的團隊,不斷改善算法從而提升語音信號處理質量,進而提高各種環境下的語音識別率。聲加的技術均為自行研發,其能提供全場景的前端語音處理方案,包括近場到遠場語音增強、語音喚醒、語音命令詞識別等全系列算法、模組解決方案,團隊技術實力強勁。

?

?另一位投資方搜狗則表示,本次投資聲加看重的就是聲加在聲學和語音領域十余年的技術積累,其成熟領先的通信聲學核心技術以及復雜場景下的軟硬件降噪技術能夠有效幫助搜狗提升智能語音硬件的遠場交互體驗,進一步鞏固搜狗智能語音產品在行業的領先位置。

?

聲加科技是一家專注于通信聲學核心技術的創業公司,致力于在復雜場景下,為人與人通信、人與機器交互提供更清晰、更舒適、更自由的使用體驗,最終實現人機完全交融的愿景。

?

隨著智能手機與平板電腦的長足發展,我國智能終端產業已形成高度成熟的供應鏈。在家電的語音控制應用開始爬升、智能音箱被看作是家庭端的流量入口后,真正做到無線化的TWS耳機,因為集通話、健身追蹤、語音助理等功能于一體,并得益于與手機協同使用的場景,被寄予“萬物互聯”交互入口的期望,已逐漸成為當前市場的最強熱點。權威報告顯示,TWS耳機不僅保持著高度增長的市場規模,國內市場更是因為華為、小米、OPPO等手機廠商的參與,顯得多元又創新。

?

據聲加科技CEO邱鋒海介紹,在經歷了技術探索和市場啟動兩個階段后,以真無線耳機為代表的智能語音產品,正在給人們帶來更好的交互體驗并改變著用戶的習慣。智能語音產品主要有前端語音處理、語音識別、語音合成和自然語言處理四個技術環節。其中,作為流程第一步的聲學前端處理,相當于扮演者人類“耳朵”的角色。?


image.png

聲加科技的核心技術及應用場景


2018年年初,依托于中科院聲學所人才和科研資源成立的聲加科技,憑借團隊十余年的技術積累,在近、中、遠場的語音交互上,都做了技術研發和市場實踐。產品形態包括提供領先的復雜場景下的“端”上的語音處理方案與及技術,以及從芯片、模組、PCBA到工業設計的一站式產品方案。

?

其中,在近場語音交互場景中,聲加科技根據其語音信號模型,成功研發包括SVE AI單麥、雙麥通話降噪方案、FBmic+雙麥通話降噪方案、雙麥+骨導(VPU)降噪方案、AI+雙麥通話降噪方案、耳機多麥克陣列通話降噪方案、小資源關鍵詞喚醒(KWS)有限語音命令方案等。

?

在遠場語音交互場景中,以智能音箱為代表,要面對回聲、混響、動態范圍的挑戰。聲加科技可以實現360度全方位喚醒、回聲抵消、混響抑制、聲源定位、定向拾音、噪聲抑制、精準識別及喚醒、動態范圍控制等,可滿足復雜場景5米距離的語音交互需求。其遠場拾音解決方案還可廣泛應用在智能穿戴產品、筆記本、電腦、智能車載、智能能家居智能玩具、機器人等多種產品。

?

目前已落地的應用產品包括OPPO Free ENCO真無線耳機、華為FreeBuds悅享版TWS耳機、榮耀Flypods青春版TWS耳機、小米Air系列TWS耳機、小米戶外藍牙音箱、萬魔EM001耳機、萬魔EM004耳機、京東京魚座TWS耳機等。終端授權設備總數近400萬套。2020年計劃研發更低功耗的2MIC麥克風陣列芯片和模組,并將市場擴大到工業、醫療、教育等場景。

image.png

聲加科技部分產品展示


過去幾十年里,國內音頻消費市場的需求長期處于兩極分化的狀態:一個極端是極度發燒,另一個極端是只要聲音夠響、能聽懂。然而,2014年11月,亞馬遜的Echo智能音箱橫空出世,聲學和AI的結合讓很多高性能的聲學算法需要分別在終端和云端實現并優化,高指標的需求讓聲學從“隱學”幾乎變成了“顯學”。隨后也引發了包括智能音箱、真無線智能耳機等音頻產品的火爆,聲學應用變得如火如荼。

?

“盡管目前各家都宣稱,語音識別的正確率高達95%以上,但這項數據是建立在實驗環境之下,而現實中的對話/通話環境往往是復雜而多變的。比如在嘈雜的咖啡廳,高速行駛的地鐵里,移動中的聲源等等。這就要求聲學前端處理技術不斷改善,實現噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能,提升語音信號處理質量,進而提高各種環境下的語音識別率。這也是聲加團隊要致力突破的方向。”邱鋒海表示。