智慧AI,智享未來
文:中國傳動網(wǎng)2018年第一期
科大訊飛副總裁于繼棟
年初,2018深圳機器人創(chuàng)新與發(fā)展論壇在深圳威尼斯睿途酒店隆重舉辦,本次論壇以“創(chuàng)新驅(qū)動灣區(qū)智造”為主題,來自全國機器人及人工智能領域產(chǎn)業(yè)上下游的精英大咖、專家學者齊聚一堂,共同探討推動新的一年機器人產(chǎn)業(yè)在技術、應用、金融和服務等方面的創(chuàng)新應用。論壇上,科大訊飛副總裁于繼棟以《智慧AI,智享未來》為題演講,現(xiàn)將全文發(fā)布,以饗讀者。
經(jīng)過2015年到2018年三年時間,從數(shù)據(jù)上能夠看出整個機器人產(chǎn)業(yè)已經(jīng)進入了高速發(fā)展的狀態(tài),未來三到五年內(nèi),機器人非常有可能達到萬億級規(guī)模。智能機器人是人工智能一個非常重要的載體,因為提到人工智能,所有人的第一反應就是有各種各樣的人形機器人,所以機器人本身就是一個AI在物理世界的載體,機器人時代可能凝聚了這樣四種不同層面的智能,包括運動智能、感知智能、運算智能、認知智能,現(xiàn)在人類比機器人厲害很多的地方在于認知這一塊,但是認知智能最近幾年一直在快速地發(fā)展,相信很快就會取得成果。
現(xiàn)在業(yè)界有兩個通用的方向,第一類是用現(xiàn)在DNN算法加上大數(shù)據(jù),加上一些專家知識,從而形成一些在不同行業(yè)不同場景下快速應用的人工智能方案,第二類是如何運用算法去模擬人的大腦,使得AI完全像人一樣的去思考和決策。各個企業(yè)和機構還有科研單位都在不同的方向探索,科大訊飛其實也在這兩個方向都有各自的布局。
人工智能有三級推進體系,第一層是基礎算法,就是過去DNN到CNN、到現(xiàn)在的JNA、RNA的算法,第二層被稱之為技術體系,是把通用的算法通過數(shù)據(jù)、結構化、決策組合成的一套技術體系,第三層是應用體系,是技術的落地場景應用。科大訊飛在過去十幾年建立了非常行之有效的算法、技術、應用推進體系,在最近幾年整個AI的發(fā)展中也獲得非常多的成績,包括科大訊飛在去年參加的最權威的語音遠場識別技術比賽,獲得了全球第一的成績。
現(xiàn)在深圳機器人廠家?guī)缀?0%以上都在用訊飛的遠場識別方案,其中六麥克風陣列方案去年已經(jīng)發(fā)布,現(xiàn)在有很多的合作伙伴在用這樣的方案了。另外,科大訊飛在語音合成、語音識別、圖象識別、自動駕駛圖像識別技術上也紛紛取得了世界第一的成績。AI通過現(xiàn)在的算法已經(jīng)達到了普通人的說話自然度,未來可能做得比普通人還要更好。
另一方面,科大訊飛在認知方面也獲得了很大的進步,但全世界范圍內(nèi)人工智能的認知領域還是遠弱于正常人。認知技術非常難,也是人工智能取得突破的非常關鍵一點,所以現(xiàn)在各個領域也都在嘗試這樣的一些技術,相信隨著技術的進步,這一突破很快會產(chǎn)生,從此可以讓機器人真正地自我學習、進步。
實際上,在認知學習的一些領域,尤其在特定的一些專家領域,人工智能已經(jīng)獲得很大的進步。例如科大訊飛在國家醫(yī)師資格考試領域?qū)崿F(xiàn)了機器人可以通過學習試卷、書籍上的知識后,和人一樣參加考試,并且取得了前一百名這樣優(yōu)異的成績。同時,科大訊飛也成為首批國家新一代人工智能開放創(chuàng)新平臺,這得益于訊飛從2010年開始到現(xiàn)在為止將近七年半時間,持續(xù)地把最先進的技術開放給合作伙伴。
從數(shù)據(jù)上來看,2017年年底該開放平臺上的合作伙伴達到了五十萬家,在深圳這樣創(chuàng)新聚集的地方已經(jīng)超過了三萬家合作伙伴在使用科大訊飛的技術;另外活躍的終端也達到十五億,每天的語音交互次數(shù)達到四十億。
以科大訊飛輸入法為例,去年平均每個人每天在訊飛輸入法上使用的次數(shù)達到15.2次,這個數(shù)據(jù)在前年大概只有7次。可以看到隨著語音能力的提升,大家用語音的頻次也在快速地增長。而以機器人終端,每天平均交互次數(shù)達到了53次之多,機器人已將成為人工智能典型的載體,它在未來還可能成為人機交互最主要的智能終端。人類90%的信息來源于視覺,但是80%的信息輸出都是靠語音。所以機器人需要非常強的語音交互能力才能夠?qū)崿F(xiàn)跟人類自然地交流,幫助人們解決問題,或者創(chuàng)造新的生活方式。
科大訊飛開放平臺對開發(fā)者的支持也是業(yè)界最豐富的。從軟件,到芯片,到軟硬一體化,包括一站式整體解決方案,包括在2017年6月發(fā)布的成品級解決方案MORFEI,使得開發(fā)應用的門檻大大地降低,開發(fā)速度大幅度提升。2017年10月科大訊飛發(fā)布了新一代AIUI開放平臺2.0,解決了開發(fā)者很多的“痛點”,包括開發(fā)升級、輸入輸出多樣化、語義聯(lián)系、個性化等,現(xiàn)在平臺已把一百多個技能、六十多個內(nèi)容開放給合作伙伴。
科大訊飛希望將開發(fā)分成兩類,一是原來的應用開發(fā),二是通過他們的能力去創(chuàng)造一些新的技能和新的內(nèi)容發(fā)布在科大訊飛的平臺上,然后共建一個開發(fā)者生態(tài)。未來每個應用開發(fā)者都能夠獲取到遠不止一百個的內(nèi)容,甚至是幾千、幾萬乃至更多的內(nèi)容。
科大訊飛希望開發(fā)者能夠快速地構建自己的應用,并且成品級解決方案MORFEI已經(jīng)有快速集成的案例。為此,科大訊飛在云端增加了一些能力,希望通過云端框架,實現(xiàn)云和端的聯(lián)系,讓開發(fā)者能夠快速的接入。AIUI把過去的所有的單點能力組合在了一起,科大訊飛希望AIUI通過持續(xù)地迭代、集成,讓開發(fā)者未來只要集中關注他們的工作就可以了,而不用去關注如何使用單點技術。
過去叫極客時代,現(xiàn)在則進入產(chǎn)業(yè)時代,包括科大訊飛也發(fā)布了芯片方案,2麥DSP就是其中最新推出的方案,它只有芝麻粒大小,卻能夠?qū)崿F(xiàn)3米距離95%左右的識別率,并且功耗非常低,科大訊飛希望這樣的芯片能夠應用到越來越多的終端上去。
科大訊飛整體的思路就是希望把算法軟核跟開源硬件結合在一起,促進整個行業(yè)的快速發(fā)展。例如MORFEI麥克風,它是業(yè)界第一個實現(xiàn)全方位拾音功能的,把它放置在桌面上、墻上、天花板上都可以,這樣的拾音性能可以促進一些智能家居上的應用。此外,MORFEI還提供了遠場精準識別、多合成發(fā)音人自由切換等能力,未來還會有分布式的拾音能力。考慮到大部分開發(fā)者沒有聲學結構設計經(jīng)驗,科大訊飛推出聲學評估服務,可以幫用戶檢驗產(chǎn)品的遠場交互性能是否達到標準。
另外科大訊飛最新的一個機器人解決方案RAIBOO主要應用在商場的智能導購、客服營銷。科大訊飛希望機器人服務合作伙伴能夠一起接入線上,融入線下,把機器人輸送到各種各樣應用場景中去。科大訊飛不光為合作伙伴提供技術,在后臺還是一套大數(shù)據(jù)的營銷平臺,通過線上跟線下數(shù)據(jù)的整合,為所有的企業(yè)提供營銷服務,這樣才能發(fā)揮機器人更大的應用價值。
中傳動網(wǎng)版權與免責聲明:
凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(wǎng)(www.hysjfh.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權屬于原版權人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅(qū)與傳動公眾號獲取更多資訊

關注中國傳動網(wǎng)公眾號獲取更多資訊
- 運動控制
- 伺服系統(tǒng)
- 機器視覺
- 機械傳動
- 編碼器
- 直驅(qū)系統(tǒng)
- 工業(yè)電源
- 電力電子
- 工業(yè)互聯(lián)
- 高壓變頻器
- 中低壓變頻器
- 傳感器
- 人機界面
- PLC
- 電氣聯(lián)接
- 工業(yè)機器人
- 低壓電器
- 機柜