將聲矢量技術帶入消費級市場
文:深圳市機器人協會 楊小彬2018年第三期
互聯網發展至今,面對人工智能大時代的到來,智慧、高效、便捷的人工智能研發應用,發展智能產業成為科技行業工作的重中之重。協會特派記者走進深圳海岸語音技術有限公司,對石偉總經理進行了智能語音行業相關專訪。
記者:智能語音作為人工智能應用最成熟的技術之一,科技巨頭、初創公司紛紛布局,海岸語音是怎樣定位與布局?
石偉:從人機交互形式出發,語音識別無疑是人工智能產品與用戶之間,最便捷有效的交流形式。語音交互技術鏈條較長,包括語音識別前端處理、語音識別、語義理解、語音合成等環節。在語音識別方面,百度、科大訊飛、谷歌等技術領先。我們主要做語音識別前端處理的技術,是一家專注于智能聽覺感知技術的人工智能初創企業,面向物聯網和人工智能時代,提供軟、硬件結合加云端引擎的一體化智能聽覺感知技術解決方案。
記者:海岸語音的產品及應用有哪些?
石偉:有別于傳統的標量麥克風技術,我們產品所采用的是聲學矢量傳感技術,可同時測量聲場的聲壓信息和方向信息,該技術最早源于潛艇的矢量水聽器,在空氣中的應用極少。我們團隊歷經8年研發,打造出AI時代必不可少的機器耳朵:VecSense™智能聲矢量傳感器。該傳感器是世界首款消費級聲矢量傳感器,可以應用在機器人、智能音箱、家電等諸多領域。
記者:海岸語音的核心競爭力體現在哪些方面?
石偉:把產品做小、成本做低(幾美元)左右,是我們研發的方向。目前VecSense™智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性,使其在智能語音、機器人、智能家居、無人機、穿戴式設備以及智能車載等領域都有廣闊的應用前景。
作為AI時代機器必備的器件之一,“機器耳朵”需要更多的信息實現其智能的特性,這是傳統的標量麥克風所面臨的局限性。雖然在聲學傳感器的發展史上,各大研究機構嘗試了多種不同的方式獲取除了聲壓信息以外的聲音方向信息,但這些技術都具有各類不同的缺陷使其無法在消費級產品中使用。我們在小尺寸的單顆傳感器封裝內實現平面360°聲音定向,并內置多種語言/音頻智能算法。不僅在聽音辨位、抑制干擾、遠場拾音方面表現出超強的性能,因其獨特的信號特性還能做到出色語音分離,讓智能機器同時聽懂多個說話人的指令。
在數量、尺寸、功耗和成本方面,一顆VecSense™傳感器對應四至八顆傳感器組成的麥克風陣列,顯然具有突出的優勢:尺寸減少70%,功耗降低90%,同時本成可降低90%。
深圳海岸語音技術有限公司創始人、總經理 石偉
記者:海岸語音發展過程中有遇到哪些困難?
石偉:目前我們產品還未正式推向市場,產品還在不斷優化,找到行業典型應用是將要面臨的一大挑戰。在未來推向市場的時候,產品的正式落地希望能夠找到知名度較高的產品或廠商背書,進一步打開市場。
記者:石總怎么看待科技巨頭與初創公司在智能語音領域的發展模式?
石偉:科技巨頭主要打造開發者生態系統,使用算法平臺吸引開發者,實現數據的快速積累、產品的快速迭代。在智能語音領域國內目前科大訊飛是做的比較完善,一整條產業鏈相關技術產品都有涉及,將自身語音技術植入相關合作伙伴的產品中,以推動智能語音和人工智能技術在家居、車載、可穿戴等領域的落地。
初創公司目前以垂直領域和細分場景為突破口,切入產品場景應用。初創企業不求大求全,而是結合自身優勢做最“性感”的技術和產品。
記者:海岸語音未來有些什么規劃?
石偉:海岸語音目前專注語音識別前端處理,未來將從前端向一整條語音技術鏈條進行滲透,實現音頻和視頻融合的人機交互。我們會將底層的技術打包為完整的交互解決方案,服務B端客戶。
中傳動網版權與免責聲明:
凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.hysjfh.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。
本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊
- 運動控制
- 伺服系統
- 機器視覺
- 機械傳動
- 編碼器
- 直驅系統
- 工業電源
- 電力電子
- 工業互聯
- 高壓變頻器
- 中低壓變頻器
- 傳感器
- 人機界面
- PLC
- 電氣聯接
- 工業機器人
- 低壓電器
- 機柜