聲加科技攜語音前端解決方案亮相“2018西安全球硬科技產(chǎn)業(yè)博覽會”
11月8日,以“硬科技發(fā)展西安,硬科技改變世界,硬科技決勝未來”為主題的“2018西安全球硬科技產(chǎn)業(yè)博覽會”在西安市曲江會展中心隆重開幕,并于當(dāng)日上午九點(diǎn)正式對外開放。作為2018全球硬科技創(chuàng)新暨“一帶一路”創(chuàng)新合作大會人氣最高、最受關(guān)注的活動之一,將持續(xù)至11日的博覽會上有近300家企業(yè)參展,預(yù)計(jì)總參展人數(shù)超過8000人。
2018西安全球硬科技產(chǎn)業(yè)博覽會現(xiàn)場
?
據(jù)悉,本屆博覽會展覽總面積達(dá)2萬平方米,共設(shè)置中國科學(xué)院、國防科工、軍民融合、硬科技“八路軍”(光電芯片、信息技術(shù)、生物技術(shù)、人工智能、智能制造、航空航天、新能源、新材料)等15個主題展區(qū),參展單位包括硬科技領(lǐng)域相關(guān)的國際企業(yè),硬科技國內(nèi)知名企業(yè)、獨(dú)角獸企業(yè),大型集團(tuán)企業(yè),中科院系統(tǒng)、國防科工系統(tǒng),西安市各開發(fā)區(qū)、重點(diǎn)高校院所、硬科技龍頭骨干企業(yè),以及20個國內(nèi)城市和5個國外友好城市代表團(tuán),集中展示硬科技“八路軍”產(chǎn)業(yè)發(fā)展代表性企業(yè)及成就為重點(diǎn)的國內(nèi)外硬科技領(lǐng)域前沿新技術(shù)、新產(chǎn)品。
其中,來自中科院聲學(xué)所、專注于聲學(xué)前沿技術(shù)和語音交互的科技創(chuàng)新公司——聲加科技,攜其多麥克風(fēng)遠(yuǎn)場拾音解決方案,包括高性能6麥克風(fēng)陣列模組以及低功耗3麥克風(fēng)陣列模組,亮相博覽會中科院主題展區(qū)。雖然展會現(xiàn)場的噪音環(huán)境非常嘈雜,廣播、人聲、混響、回聲等干擾源使得現(xiàn)場的平均噪音在80dB左右,但是聲加所展示的拾音模組仍然在3米的距離可以很容易的被喚醒,吸引了一大批參展觀眾前來互動,現(xiàn)場同時展示了聲加科技的近場拾音方案代表作品之一藍(lán)牙耳機(jī)語音增強(qiáng)算法的原理以及應(yīng)用。
聲加科技市場總監(jiān)馮穎秋為物聯(lián)網(wǎng)企業(yè)高管講解產(chǎn)品
?
作為硬科技的代表性企業(yè),成立于今年1月的聲加科技是一家致力于解決全場景下的語音前端處理技術(shù)型新興創(chuàng)企。其專注于通信聲學(xué)核心技術(shù),依托中科院聲學(xué)所雄厚的人才和科研資源,以產(chǎn)學(xué)研一體化為全場景用戶提供軟硬一體化的語音前端拾音解決方案,包括麥克風(fēng)陣列的算法、模組以及麥克風(fēng)陣列,關(guān)鍵詞喚醒(KWS)以及喚醒詞定制訓(xùn)練模型。并可提供產(chǎn)品設(shè)計(jì)等定制化方案以幫助用戶加速產(chǎn)品上市。
據(jù)其CEO邱鋒海介紹,從上世紀(jì)50年代,語音識別從單一模式匹配到70年代的模式和特征分析,再到90年的統(tǒng)計(jì)方法(HMM+GMM),直到2010年后,深度神經(jīng)網(wǎng)絡(luò)(DNN)取得了巨大的成功,基于DNN技術(shù)的應(yīng)用也呈爆炸式增長。同時,語音識別、自然語言理解、語音合成性能等技術(shù)大幅提升,互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的高速發(fā)展也為算法引擎提供了大量的數(shù)據(jù)“糧食”。在海量的數(shù)據(jù)紅利下,云端計(jì)算軟硬件系統(tǒng)的算力增長使其能夠快速處理海量數(shù)據(jù),再加上邊緣計(jì)算的能力增強(qiáng)、功耗降低等因素,語音交互的“基礎(chǔ)設(shè)施”已逐漸成熟。因此,智能語音交互應(yīng)用的興起也就順理成章。
隨著巨頭們對智能音箱和智能耳機(jī)的不斷投入,智能語音產(chǎn)品已經(jīng)越來越被人們熟知。作為智能聽覺的引領(lǐng)者和創(chuàng)新者,聲加科技主要團(tuán)隊(duì)來自于中科院聲學(xué)所、清華大學(xué)、南京大學(xué)和中國科學(xué)技術(shù)大學(xué)等國內(nèi)一流科研院所。核心團(tuán)隊(duì)成員亦大多師出中科院聲學(xué)所,平均在業(yè)界擁有超過十五年工作經(jīng)驗(yàn),博士以上學(xué)歷人員占比80%以上。核心技術(shù)包括回聲消除ACE(支持單聲道和立體聲回聲消除)、混響抑制(去除房間混響導(dǎo)致的語音拖尾)、聲源定位(利用麥克風(fēng)陣列,實(shí)現(xiàn)360度全方位語音信號采集,并通過聲源定位來確定目標(biāo)說話人的方向)、定向拾音(在保護(hù)主方向語音的同時,去除環(huán)境中的語音、電視噪聲等非平穩(wěn)干擾)、噪聲抑制(去除空調(diào)、胎噪等平穩(wěn)噪聲以及環(huán)境z紅的語音、電視等非平穩(wěn)噪聲的波束成形算法)、關(guān)鍵詞喚醒KWS(支持Dual-wake、Free-out、One-shot等獨(dú)有的定制功能,同時支持多輪對話功能)。
聲加科技展出展品
?
目前,聲加科技可為B端客戶提供復(fù)雜場景下的近場、中場、遠(yuǎn)場語音交互技術(shù)方案,以及從芯片、模組、PCBA到工業(yè)涉及的一站式產(chǎn)品方案。邱鋒海表示,10萬年前,語言的出現(xiàn)大大加速了人類社會進(jìn)化和發(fā)展的進(jìn)程。時至今日,聽和說依然是人類最基本、最常用和最靈活的交流方式,同時也是最好的人機(jī)交互方式。在經(jīng)歷了計(jì)算機(jī)命令式交互到圖形界面觸摸交互,再到信息時代/高級信息時代的自然交互、和情感交互……毫無疑問,語音交互將會成為泛在的人機(jī)交互方式。聲加科技將一如既往的致力于在復(fù)雜聲場景下,為人與人通信、人與機(jī)器交互提供更清晰、更舒適、更自由的使用體驗(yàn),最終實(shí)現(xiàn)人機(jī)完全交融的愿景。
?