聲加科技專注聲學前沿技術和語音交互 解決語音前端
在海量的數據紅利下,云端計算軟硬件系統的算力增長使其能夠快速處理海量數據,再加上邊緣計算的能力增強、功耗降低等因素,語音交互的“基礎設施”已逐漸成熟。
11月8日,以“硬科技發展西安,硬科技改變世界,硬科技決勝未來”為主題的“2018西安全球硬科技產業博覽會”在西安市曲江會展中心隆重開幕,并于當日上午九點正式對外開放。作為2018全球硬科技創新暨“一帶一路”創新合作大會人氣最高、最受關注的活動之一,將持續至11日的博覽會上有近300家企業參展,預計總參展人數超過8000人。
據悉,本屆博覽會展覽總面積達2萬平方米,共設置中國科學院、國防科工、軍民融合、硬科技“八路軍”(光電芯片、信息技術、生物技術、人工智能、智能制造、航空航天、新能源、新材料)等15個主題展區,參展單位包括硬科技領域相關的國際企業,硬科技國內知名企業、獨角獸企業,大型集團企業,中科院系統、國防科工系統,西安市各開發區、重點高校院所、硬科技龍頭骨干企業,以及20個國內城市和5個國外友好城市代表團,集中展示硬科技“八路軍”產業發展代表性企業及成就為重點的國內外硬科技領域前沿新技術、新產品。
其中,來自中科院聲學所、專注于聲學前沿技術和語音交互的科技創新公司——聲加科技,攜其多麥克風遠場拾音解決方案,包括高性能6麥克風陣列模組以及低功耗3麥克風陣列模組,亮相博覽會中科院主題展區。雖然展會現場的噪音環境非常嘈雜,廣播、人聲、混響、回聲等干擾源使得現場的平均噪音在80dB左右,但是聲加所展示的拾音模組仍然在3米的距離可以很容易的被喚醒,吸引了一大批參展觀眾前來互動,現場同時展示了聲加科技的近場拾音方案代表作品之一藍牙耳機語音增強算法的原理以及應用。
?作為硬科技的代表性企業,成立于今年1月的聲加科技是一家致力于解決全場景下的語音前端處理技術型新興創企。其專注于通信聲學核心技術,依托中科院聲學所雄厚的人才和科研資源,以產學研一體化為全場景用戶提供軟硬一體化的語音前端拾音解決方案,包括麥克風陣列的算法、模組以及麥克風陣列,關鍵詞喚醒(KWS)以及喚醒詞定制訓練模型。并可提供產品設計等定制化方案以幫助用戶加速產品上市。
CEO邱鋒海介紹到,從上世紀50年代,語音識別從單一模式匹配到70年代的模式和特征分析,再到90年的統計方法(HMM+GMM),直到2010年后,深度神經網絡(DNN)取得了巨大的成功,基于DNN技術的應用也呈爆炸式增長。同時,語音識別、自然語言理解、語音合成性能等技術大幅提升,互聯網、移動互聯網的高速發展也為算法引擎提供了大量的數據“糧食”。在海量的數據紅利下,云端計算軟硬件系統的算力增長使其能夠快速處理海量數據,再加上邊緣計算的能力增強、功耗降低等因素,語音交互的“基礎設施”已逐漸成熟。因此,智能語音交互應用的興起也就順理成章。
隨著巨頭們對智能音箱和智能耳機的不斷投入,智能語音產品已經越來越被人們熟知。作為智能聽覺的引領者和創新者,聲加科技主要團隊來自于中科院聲學所、清華大學、南京大學和中國科學技術大學等國內一流科研院所。核心團隊成員亦大多師出中科院聲學所,平均在業界擁有超過十五年工作經驗,博士以上學歷人員占比80%以上。核心技術包括回聲消除ACE(支持單聲道和立體聲回聲消除)、混響抑制(去除房間混響導致的語音拖尾)、聲源定位(利用麥克風陣列,實現360度全方位語音信號采集,并通過聲源定位來確定目標說話人的方向)、定向拾音(在保護主方向語音的同時,去除環境中的語音、電視噪聲等非平穩干擾)、噪聲抑制(去除空調、胎噪等平穩噪聲以及環境z紅的語音、電視等非平穩噪聲的波束成形算法)、關鍵詞喚醒KWS(支持Dual-wake、Free-out、One-shot等獨有的定制功能,同時支持多倫對話功能)。
目前,聲加科技可為B端客戶提供復雜場景下的近場、中場、遠場語音交互技術方案,以及從芯片、模組、PCBA到工業涉及的一站式產品方案。邱鋒海表示,10萬年前,語言的出現大大加速了人類社會進化和發展的進程。時至今日,聽和說依然是人類最基本、最常用和最靈活的交流方式,同時也是最好的人機交互方式。在經歷了計算機命令式交互到圖形界面觸摸交互,再到信息時代/高級信息時代的自然交互、和情感交互……毫無疑問,語音交互將會成為泛在的人機交互方式。聲加科技將一如既往的致力于在復雜聲場景下,為人與人通信、人與機器交互提供更清晰、更舒適、更自由的使用體驗,最終實現人機完全交融的愿景。
據悉,本次本屆博覽會分別在A館和B4館舉行,兩館面積分別超過10000平米。其中,A館以特裝和集中展示為主,B4館則采用特展+標準展位結合。展出產品均為最“硬”、最“炫”、最“前沿”的技術成果和產品,期間還伴隨參展企業的新品發布會、主題演講、產品演示、技術解析、現場推介、合作洽談等主題活動,是硬科技領域當之無愧的頂級盛宴。