新一代人工智能發展方向及技術框架
文:中國電子協會《新一代人工智能發展白皮書(2017)》2018年第一期
隨著信息時代的來臨,人類生產生活的數據基礎和信息環境有了大幅提升,人工智能正從學術驅動轉變為應用驅動,從專用智能邁向通用智能,比歷史上任何一個時期都要更加接近于人類智能水平,進入了新的發展階段。全球各國均圍繞新一代人工智能技術及產業發展進行前瞻布局,我國也已將其提升到了國家戰略層面。基于此,本白皮書重點圍繞新一代人工智能面臨的新形勢、驅動的新因素、呈現的新特征,對架構、算法、系統等技術演進方向作出研判,詳細梳理了包括云計算、大數據兩大基礎平臺和機器學習、模式識別、人機交互三大通用技術的技術體系,深入論證了新一代人工智能產業邊界和范圍,劃分了基礎層、技術層、應用層三大產業化領域,研究了智能傳感器、智能芯片、算法模型、語音識別、圖像視頻識別、文本識別、智能機器人、智能制造系統、智能安防、智能駕駛等具體產業化方向的產業規模、核心技術、主要產品、典型企業,歸納了近年來全球和我國在人工智能領域的投融資特征趨勢,并對國內外人工智能的技術及產業發展狀況進行了系統對比和趨勢展望,最后提出了發展理念、治理體系、創新能力、發展基礎、資本環境、行業組織、全球統籌共七項措施建議,進一步推動我國人工智能相關的前沿新興產業持續健康快速發展,有力支撐信息化與工業化深度融合邁上新臺階。
新一代人工智能發展方向
人工智能發軔于1956年在美國達特茅斯(Dartmouth)學院舉行的“人工智能(ArtificialIntelligent,簡稱AI)夏季研討會”,在20世紀50年代末和80年代初先后步入兩次發展高峰,但因為技術瓶頸、應用成本等局限性而均落入低谷。當前,在新一代信息技術的引領下,數據快速積累,運算能力大幅提升,算法模型持續演進,行業應用快速興起,人工智能發展環境發生了深刻變化,跨媒體智能、群體智能、自主智能系統、混合型智能成為新的發展方向,人工智能第三次站在了科技發展的浪潮之巔。
(一)人工智能簡要發展歷程
從誕生至今,人工智能已有60年的發展歷史,大致經歷了三次浪潮。第一次浪潮為20世紀50年代末至20世紀80年代初;第二次浪潮為20世紀80年代初至20世紀末;第三次浪潮為21世紀初至今。在人工智能的前兩次浪潮當中,由于技術未能實現突破性進展,相關應用始終難以達到預期效果,無法支撐起大規模商業化應用,最終在經歷過兩次高潮與低谷之后,人工智能歸于沉寂。隨著信息技術快速發展和互聯網快速普及,以2006年深度學習模型的提出為標志,人工智能迎來第三次高速成長,如圖1所示。
1、第一次浪潮:人工智能誕生并快速發展,但技術瓶頸難以突破。
符號主義盛行,人工智能快速發展。1956年到1974年是人工智能發展的第一個黃金時期。科學家將符號方法引入統計方法中進行語義處理,出現了基于知識的方法,人機交互開始成為可能。科學家發明了多種具有重大影響的算法,如深度學習模型的雛形貝爾曼公式。除在算法和方法論方面取得了新進展,科學家們還制作出具有初步智能的機器。如能證明應用題的機器STUDENT(1964),可以實現簡單人機對話的機器ELIZA(1966)。人工智能發展速度迅猛,以至于研究者普遍認為人工智能代替人類只是時間問題。
模型存在局限,人工智能步入低谷。1974年到1980年。人工智能的瓶頸逐漸顯現,邏輯證明器、感知器、增強學習只能完成指定的工作,對于超出范圍的任務則無法應對,智能水平較為低級,局限性較為突出。造成這種局限的原因主要體現在兩個方面:一是人工智能所基于的數學模型和數學手段被發現具有一定的缺陷;二是很多計算的復雜度呈指數級增長,依據現有算法無法完成計算任務。先天的缺陷是人工智能在早期發展過程中遇到的瓶頸,研發機構對人工智能的熱情逐漸冷卻,對人工智能的資助也相應被縮減或取消,人工智能第一次步入低谷。
2、第二次浪潮:模型突破帶動初步產業化,但推廣應用存在成本障礙。
數學模型實現重大突破,專家系統得以應用。進入20世紀80年代,人工智能再次回到了公眾的視野當中。人工智能相關的數學模型取得了一系列重大發明成果,其中包括著名的多層神經網絡(1986)和BP反向傳播算法(1986)等,這進一步催生了能與人類下象棋的高度智能機器(1989)。其它成果包括通過人工智能網絡來實現能自動識別信封上郵政編碼的機器,精度可達99%以上,已經超過普通人的水平。與此同時,卡耐基·梅隆大學為DEC公司制造出了專家系統(1980),這個專家系統可幫助DEC公司每年節約4000萬美元左右的費用,特別是在決策方面能提供有價值的內容。受此鼓勵,很多國家包括日本、美國都再次投入巨資開發所謂第5代計算機(1982),當時叫做人工智能計算機。
成本高且難維護,人工智能再次步入低谷。為推動人工智能的發展,研究者設計了LISP語言,并針對該語言研制了Lisp計算機。該機型指令執行效率比通用型計算機更高,但價格昂貴且難以維護,始終難以大范圍推廣普及。與此同時,在1987年到1993年間,蘋果和IBM公司開始推廣第一代臺式機,隨著性能不斷提升和銷售價格的不斷降低,這些個人電腦逐漸在消費市場上占據了優勢,越來越多的計算機走入個人家庭,價格昂貴的Lisp計算機由于古老陳舊且難以維護逐漸被市場淘汰,專家系統也逐漸淡出人們的視野,人工智能硬件市場出現明顯萎縮。同時,政府經費開始下降,人工智能又一次步入低谷。
3、第三次浪潮:信息時代催生新一代人工智能,但未來發展存在諸多隱憂。
新興技術快速涌現,人工智能發展進入新階段。隨著互聯網的普及、傳感器的泛在、大數據的涌現、電子商務的發展、信息社區的興起,數據和知識在人類社會、物理空間和信息空間之間交叉融合、相互作用,人工智能發展所處信息環境和數據基礎發生了巨大而深刻的變化,這些變化構成了驅動人工智能走向新階段的外在動力。與此同時,人工智能的目標和理念出現重要調整,科學基礎和實現載體取得新的突破,類腦計算、深度學習、強化學習等一系列的技術萌芽也預示著內在動力的成長,人工智能的發展已經進入一個新的階段。
人工智能水平快速提升,人類面臨潛在隱患。得益于數據量的快速增長、計算能力的大幅提升以及機器學習算法的持續優化,新一代人工智能在某些給定任務中已經展現出達到或超越人類的工作能力,并逐漸從專用型智能向通用型智能過渡,有望發展為抽象型智能。隨著應用范圍的不斷拓展,人工智能與人類生產生活聯系的愈發緊密,一方面給人們帶來諸多便利,另一方面也產生了一些潛在問題:一是加速機器換人,結構性失業可能更為嚴重;二是隱私保護成為難點,數據擁有權、隱私權、許可權等界定存在困難。
(二)新一代人工智能的主要驅動因素
當前,隨著移動互聯網、大數據、云計算等新一代信息技術的加速迭代演進,人類社會與物理世界的二元結構正在進階到人類社會、信息空間和物理世界的三元結構,人與人、機器與機器、人與機器的交流互動愈加頻繁。人工智能發展所處的信息環境和數據基礎發生了深刻變化,愈加海量化的數據、持續提升的運算力、不斷優化的算法模型、結合多種場景的新應用已構成相對完整的閉環,成為推動新一代人工智能發展的四大要素,如圖2所示。
1、人機物互聯互通成趨勢,數據量呈現爆炸性增長
近年來,得益于互聯網、社交媒體、移動設備和傳感器的大量普及,全球產生并存儲的數據量急劇增加,為通過深度學習的方法來訓練人工智能提供了良好的土壤。目前,全球數據總量每年都以倍增的速度增長,預計到2020年將達到44萬億GB,中國產生的數據量將占全球數據總量的近20%。海量的數據將為人工智能算法模型提供源源不斷的素材,人工智能正從監督式學習向無監督學習演進升級,從各行業、各領域的海量數據中積累經驗、發現規律、持續提升。
2、數據處理技術加速演進,運算能力實現大幅提升
人工智能領域富集了海量數據,傳統的數據處理技術難以滿足高強度、高頻次的處理需求。人工智能芯片的出現加速了深層神經網絡的訓練迭代速度,讓大規模的數據處理效率顯著提升,極大地促進了人工智能行業的發展。目前,出現了GPU、NPU、FPGA和各種各樣的AI-PU專用芯片。相比傳統的CPU只能同時做一兩個加減法運算,NPU等專用芯片多采用“數據驅動并行計算”的架構,特別擅長處理視頻、圖像類的海量多媒體數據。在具有更高線性代數運算效率的同時,只產生比CPU更低的功耗。
3、深度學習研究成果卓著,帶動算法模型持續優化
2006年,加拿大多倫多大學教授杰弗里·辛頓提出了深度學習的概念,極大地發展了人工神經網絡算法,提高了機器自學習的能力,例如谷歌大腦團隊在2012年通過使用深度學習技術,成功讓電腦從視頻中“認出”了貓。隨著算法模型的重要性進一步凸顯,全球科技巨頭紛紛加大了這方面的布局力度和投入,通過成立實驗室,開源算法框架,打造生態體系等方式推動算法模型的優化和創新。目前,深度學習等算法已經廣泛應用在自然語言處理、語音處理以及計算機視覺等領域,并在某些特定領域取得了突破性進展,從有監督式學習演化為半監督式、無監督式學習。
4、資本與技術深度耦合,助推行業應用快速興起
當前,在技術突破和應用需求的雙重驅動下,人工智能技術已走出實驗室,加速向產業各個領域滲透,產業化水平大幅提升。在此過程中,資本作為產業發展的加速器發揮了重要的作用,一方面,跨國科技巨頭以資本為杠桿,展開投資并購活動,得以不斷完善產業鏈布局,另一方面,各類資本對初創型企業的支持,使得優秀的技術型公司迅速脫穎而出。據美國技術研究公司VentureScanner的調查報告顯示,截至到2017年12月,全球范圍內總計2075家與人工智能技術有關公司的融資總額達到65億美元。同時,美國行業研究公司CBInsight公布了對美國人工智能初創企業的調查結果,這類企業的融資金額約是2012年的10倍。目前,人工智能已在智能機器人、無人機、金融、醫療、安防、駕駛、搜索、教育等領域得到了較為廣泛的應用。
(三)新一代人工智能主要發展特征
在數據、運算能力、算法模型、多元應用的共同驅動下,人工智能的定義正從用計算機模擬人類智能演進到協助引導提升人類智能,通過推動機器、人與網絡相互連接融合,更為密切地融入人類生產生活,從輔助性設備和工具進化為協同互動的助手和伙伴,如圖3所示。主要特征如下:
1、大數據成為人工智能持續快速發展的基石
隨著新一代信息技術的快速發展,計算能力、數據處理能力和處理速度實現了大幅提升,機器學習算法快速演進,大數據的價值得以展現。與早期基于推理的人工智能不同,新一代人工智能是由大數據驅動的,通過給定的學習框架,不斷根據當前設置及環境信息修改、更新參數,具有高度的自主性。例如,在輸入30萬張人類對弈棋譜并經過3千萬次的自我對弈后,人工智能AlphaGo具備了媲美頂尖棋手的棋力。隨著智能終端和傳感器的快速普及,海量數據快速累積,基于大數據的人工智能也因此獲得了持續快速發展的動力來源。
2、文本、圖像、語音等信息實現跨媒體交互
當前,計算機圖像識別、語音識別和自然語言處理等技術在準確率及效率方面取得了明顯進步,并成功應用在無人駕駛、智能搜索等垂直行業。與此同時,隨著互聯網、智能終端的不斷發展,多媒體數據呈現爆炸式增長,并以網絡為載體在用戶之間實時、動態傳播,文本、圖像、語音、視頻等信息突破了各自屬性的局限,實現跨媒體交互,智能化搜索、個性化推薦的需求進一步釋放。未來人工智能將逐步向人類智能靠近,模仿人類綜合利用視覺、語言、聽覺等感知信息,實現識別、推理、設計、創作、預測等功能。
3、基于網絡的群體智能技術開始萌芽
隨著互聯網、云計算等新一代信息技術的快速應用及普及,大數據不斷累積,深度學習及強化學習等算法不斷優化,人工智能研究的焦點,已從單純用計算機模擬人類智能,打造具有感知智能及認知智能的單個智能體,向打造多智能體協同的群體智能轉變。群體智能充分體現了“通盤考慮、統籌優化”思想,具有去中心化、自愈性強和信息共享高效等優點,相關的群體智能技術已經開始萌芽并成為研究熱點。例如,我國研究開發了固定翼無人機智能集群系統,并于2017年6月實現了119架無人機的集群飛行。
4、自主智能系統成為新興發展方向
在長期以來的人工智能發展歷程中,對仿生學的結合和關注始終是其研究的重要方向,如美國軍方曾經研制的機器騾以及各國科研機構研制的一系列人形機器人等。但均受技術水平的制約和應用場景的局限,沒有在大規模應用推廣方面獲得顯著突破。當前,隨著生產制造智能化改造升級的需求日益凸顯,通過嵌入智能系統對現有的機械設備進行改造升級成為更加務實的選擇,也是“中國制造2025”、德國工業4.0、美國工業互聯網等國家戰略的核心舉措。在此引導下,自主智能系統正成為人工智能的重要發展及應用方向。例如,沈陽機床以i5智能機床為核心,打造了若干智能工廠,實現了“設備互聯、數據互換、過程互動、產業互融”的智能制造模式。
5、人機協同正在催生新型混合智能形態
人類智能在感知、推理、歸納和學習等方面具有機器智能無法比擬的優勢,機器智能則在搜索、計算、存儲、優化等方面領先于人類智能,兩種智能具有很強的互補性。人與計算機協同,互相取長補短將形成一種新的“1+1>2”的增強型智能,也就是混合智能,這種智能是一種雙向閉環系統,既包含人,又包含機器組件。其中人可以接受機器的信息,機器也可以讀取人的信號,兩者相互作用,互相促進。在此背景下,人工智能的根本目標已經演進為提高人類智力活動能力,更智能地陪伴人類完成復雜多變的任務。
新一代人工智能技術框架
與早期人工智能相比,新一代人工智能正在全新信息環境、海量數據基礎和持續演進、不斷豐富的戰略目標的引領下,依托于云計算、大數據兩大基礎平臺和機器學習、模式識別和人機交互三大通用技術,以新型計算架構、通用人工智能和開源生態系統為主要導向,持續搭建和完善技術框架體系,不斷逼近技術奇點,深刻變革人類生產生活。
(一)新一代人工智能的技術演進
1、從原有的CPU架構,轉變為GPU并行運算架構深
度學習算法運行于CPU架構的指令需求過于復雜。
機器學習領域的泰斗杰弗里·辛頓開啟了深度學習在人工智能領域研究的浪潮,大數據技術帶來的數據洪流滿足了深度學習算法對于訓練數據量的要求,但是算法的實現還需要更快更強大的處理器予以支撐。傳統的主流CPU架構如X86、ARM等往往需要數百甚至上千條指令才能完成一個神經元的處理,對于并不需要太多的程序指令,卻需要海量數據運算的深度學習的計算需求,并不能很好地匹配與適應。
GPU架構具備與深度學習相匹配的并行運算能力。GPU(圖形處理器)最初是個人電腦、工作站、游戲機和一些移動設備上運行繪圖運算工作的微處理器,可以快速處理圖像上的每一個像素點,其海量數據并行運算的能力與深度學習需求非常符合。當前主流的CPU只有4核或者8核,可以模擬出12個處理線程來進行運算,但是普通級別的GPU就包含了成百上千個處理單元,高端的甚至更多,這對于多媒體計算中大量的重復處理過程有著天生的優勢。吳恩達教授領導的谷歌大腦研究工作結果表明,12顆英偉達(Nvidia)公司的GPU可以提供相當于2000顆CPU的深度學習性能,為技術的發展帶來了實質性飛躍,被廣泛應用于全球各大主流深度學習開發機構與研究院所。
2、從單一算法驅動,轉變為數據、運算力、算法復合驅動
缺少數據支撐與運算力保證的算法驅動模式難以持續發展。人工智能發展以實現計算智能為重要研究方向,充分利用現代高性能計算機的快速計算和記憶存儲能力,設計出神經計算、模糊計算和進化計算等求解算法,解決優化篩選、單點搜索、邏輯推理等實際應用問題。盡管深度學習概念和淺層學習算法已經被提出多年,但是一直進展緩慢,究其原因是缺乏海量的數據積累和與之相匹配的高水平計算能力,無法對算法模型進行持續的改進與優化,只停留在理論研究階段,距離實際應用存在不小的差距。
數據、運算力和算法復合驅動模式引發人工智能爆發式增長。與早期人工智能相比,新一代人工智能體現出數據、運算力和算法相互融合、優勢互補的良好特點。數據方面,人類進入互聯網時代后,數據技術高速發展,各類數據資源不斷積累,為人工智能的訓練學習過程奠定了良好的基礎。運算力方面,摩爾定律仍在持續發揮效用,計算系統的硬件性能逐年提升,云計算、并行計算、網格計算等新型計算方式的出現拓展了現代計算機性能,獲得更快的計算速度。算法方面,伴隨著深度學習技術的不斷成熟,運算模型日益優化,智能算法不斷更新,提升了模型辨識解析的準確度。
3、從封閉的單機系統,轉變為快捷靈活的開源框架
專家系統本地化特性限制了人工智能發展步伐。以往的人工智能專家系統是基于本地化專業知識進行設計開發,以知識庫和推理機為中心而展開,推理機設計內容由不同的專家系統應用環境決定,單獨設定模型函數與運算機制,一般不具備通用性。同時,知識庫是開發者收集錄入的專家分析模型與案例的資源集合,只能夠在單機系統環境下使用且無法連接網絡,升級更新較為不便。
開源框架推動構建人工智能行業解決方案。人工智能系統的開發工具日益成熟,通用性較強且各具特色的開源框架不斷涌現,如谷歌的TensorFlow、Facebook的Torchnet、百度的PaddlePaddle等,其共同特點均是基于Linux生態系統,具備分布式深度學習數據庫和商業級即插即用功能,能夠在GPU上較好地繼承Hadoop和Spark架構,廣泛支持Python、Java、Scala、R等流行開發語言,與硬件結合生成各種應用場景下的人工智能系統與解決方案。
4、從學術研究探索導向,轉變為快速迭代的實踐應用導向
學術導向難以滿足復雜數據信息背景下的創新需求。隨著人工智能的不斷發展,分化產生了不同的學術流派,以符號主義、聯結主義、進化主義、貝葉斯學派、類推學派等為典型。不同學派按照各自對人工智能領域基本理論、研究方法和技術路線的理解,以學術研究為目的進行探索實踐,一定程度上推動了人工智能理論與技術的發展。在如今數據環境改變和信息環境變化的背景下,現實世界結構趨向復雜,單純依靠課題立項和學術研究無法持續推動人工智能滿足當前現實世界的模擬與互動需求,快速變化的應用環境也容易導致理論研究與實際應用相脫節,影響人工智能技術對經濟發展和社會進步的積極拉動作用。
快速迭代的實踐應用導向加速形成技術發展正循環。目前,人工智能圍繞醫療、金融、交通、教育、零售等數據較集中且質量較高的行業的實踐需求,在算法模型、圖像識別、自然語言處理等方面將持續出現迭代式的技術突破,在深度應用中支撐人工智能實現“數據-技術-產品-用戶”的往復正循環,由學術驅動向應用拉動轉化。在人工智能技術準備期,由于提供數據支撐較少,技術提升度慢,一旦進入應用期,大量的優質數據有助于分析技術弊端,通過對相關技術進行改進升級,提升了產品的應用水平,用戶在得到更好的產品體驗后,繼續為應用平臺創造了更大規模的后臺數據,用來進行下一步的技術升級與產品改良,由此進入了大規模應用階段。在技術快速迭代發展的過程中,數據累積和大規模應用起到了至關重要的作用,能夠持續推動人工智能技術實現自我超越。
(二)新一代人工智能技術體系
新一代人工智能技術體系由基礎技術平臺和通用技術體系構成,其中基礎技術平臺包括云計算平臺與大數據平臺,通用技術體系包括機器學習、模式識別與人機交互。在此技術體系的基礎上,人工智能技術不斷創新發展,應用場景和典型產品不斷涌現。
1、云計算:基礎的資源整合交互平臺
云計算主要共性技術包括虛擬化技術、分布式技術、計算管理技術、云平臺技術和云安全技術,具備實現資源快速部署和服務獲取、進行動態可伸縮擴展及供給、面向海量信息快速有序化處理、可靠性高、容錯能力強等特點,為人工智能的發展提供了資源整合交互的基礎平臺。尤其與大數據技術結合,為當前受到最多關注的深度學習技術搭建了強大的存儲和運算體系架構,促進了神經網絡模型訓練優化過程,顯著提高語音、圖片、文本等辨識對象的識別率。
2、大數據:提供豐富的分析、訓練與應用資源
大數據主要共性技術包括采集與預處理、存儲與管理、計算模式與系統、分析與挖掘、可視化計算及隱私及安全等,具備數據規模不斷擴大、種類繁多、產生速度快、處理能力要求高、時效性強、可靠性要求嚴格、價值大但密度較低等特點,為人工智能提供豐富的數據積累和價值規律,引發分析需求。同時,從跟蹤靜態數據到結合動態數據,可以推動人工智能根據客觀環境變化進行相應的改變和適應,持續提高算法的準確性與可靠性。
3、機器學習:持續引導機器智能水平提升
機器學習指通過數據和算法在機器上訓練模型,并利用模型進行分析決策與行為預測的過程。機器學習技術體系主要包括監督學習和無監督學習,目前廣泛應用在專家系統、認知模擬、數據挖掘、圖像識別、故障診斷、自然語言理解、機器人和博弈等領域。機器學習作為人工智能最為重要的通用技術,未來將持續引導機器獲取新的知識與技能,重新組織整合已有知識結構,有效提升機器智能化水平,不斷完善機器服務決策能力。
4、模式識別:從感知環境和行為到基于認知的決策
模式識別是對各類目標信息進行處理分析,進而完成描述、辨認、分類和解釋的過程。模式識別技術體系包括決策理論、句法分析和統計模式等,目前廣泛應用在語音識別、指紋識別、人臉識別、手勢識別、文字識別、遙感和醫學診斷等領域。隨著理論基礎和實際應用研究范圍的不斷擴大,模式識別技術將與人工神經網絡相結合,由目前單純的環境感知進化為認知決策,同時量子計算技術也將用于未來模式識別研究工作,助力模式識別技術突破與應用領域拓展。
5、人機交互:支撐實現人機物交叉融合與協同互動
人機交互技術賦予機器通過輸出或顯示設備對外提供有關信息的能力,同時可以讓用戶通過輸入設備向機器傳輸反饋信息達到交互目的。人機交互技術體系包括交互設計、可用性分析評估、多通道交互、群件、移動計算等,目前廣泛應用在地理空間跟蹤、動作識別、觸覺交互、眼動跟蹤、腦電波識別等領域。隨著交互方式的不斷豐富以及物聯網技術的快速發展,未來肢體識別和生物識別技術將逐漸取代現有的觸控和密碼系統,人機融合將向人機物交叉融合進化發展,帶來信息技術領域的深刻變革。
(三)國內外技術對比分析
1、發達國家基礎平臺布局完善,國內仍缺乏自主核心技術。
國外企業技術領先且大量布局公有云業務領域,大數據業務經驗成熟、分工明確且數據開放程度較高。云計算方面,國外云計算企業基礎技術相對領先,服務器虛擬化、網絡技術(SDN)、存儲技術、分布式計算、OS、開發語言和平臺等核心技術基本上都掌握在少數國外公司手中,憑借著強大的創新和資本轉化能力,有能力支持技術不斷推陳出新。同時,國外企業在細分領域都有所布局,形成了完善的產業鏈配合,提供各種解決方案的集成,可以滿足多場景使用要求。大數據方面,國外公司在大數據技術各個領域方面分工明確,有的專注于數據挖掘,有的專注于數據清洗,也有的專注于數據存儲與管理。同時,國外從事大數據技術研發的企業有很大一部分是由傳統的數據公司轉型而來,如IBM、甲骨文(Oracle)、易安信(EMC,2015年10月被戴爾公司收購)等,這類公司在大數據概念興起之前就早已充分接觸數據領域業務,在數據科學領域有較強的研發能力。國外數據保護制度相對完善,數據開放標準成熟,為大數據技術研發提供了良好的外部環境。
國內企業自主核心技術有待提高,數據開放程度偏低且缺乏必要的保護。云計算方面,國內雖然有阿里、華為、新華三、易華錄等一批科技公司大力投入研發資源,但核心技術積累依然不足,難以主導產業鏈發展。大數據方面,國內企業仍處于“跟風”國外企業的發展階段,在數據服務內核等方面缺乏積淀與經驗,未能完全實現從IT領域向DT(數據技術)領域的轉型。同時,國內數據應用環境相對封閉,政府公共數據開放程度較低,數據安全保護等級有待提高,數據安全風險評估制度與保障體系有待完善,對大數據技術的升級發展形成了一定的限制因素。
2、發達國家在機器學習和人機交互領域具備先發優勢,國內企業存在技術差距與人才短板。
國外機構發力機器學習主流開源框架,積極開發人機交互下一代新型技術。機器學習方面,目前較為流行的開源框架基本都為國外公司或機構所開發,例如TensorFlow、Torchnet、Caffe、DMTK、SystemML等,同時注重大數據、云計算等基礎支撐信息技術對機器學習研究的促進作用,以及機器學習的應用實踐,已進入研發穩定階段。人機交互方面,國外技術企業基于觸控技術、可穿戴設備、物聯網和車聯網的發展基礎,正在積極開發性價比更高的下一代人機交互新型技術,以對現有產品進行升級并降低成本。
國內機器學習基礎理論體系尚不成熟,缺乏人機交互專業領域人才培養環境。機器學習方面,盡管國內學者在數據挖掘層面取得了一定的研究成績,但對于機器學習的底層技術、實現原理及應用方法缺乏足夠的重視,導致關鍵技術環節缺失與重要領域邊緣化,不利于在國際主流機器學習技術角逐中展開有效競爭。人機交互方面,研究者需要具備數學、計算機學和心理學等相關背景,復合型較強,相比于國外高校都設立單獨的人機交互專業,國內高校開設的專業相對傳統,缺乏交叉復合型人才的培養機制,亟需建立人機交互領域技術人才培養的良好環境。
3、國內外模式識別研究水平基本處于同一起跑線,重點聚焦于語音識別與圖像識別。
國內外研究領域基本一致,圍繞前沿技術領域開展持續創新。目前,國內外企業均在圍繞模式識別領域的基礎理論、圖像處理、計算機視覺以及語音信息處理展開集中研究,探索模式識別機理以及有效計算方法,為解決應用實踐問題提供關鍵技術。國外科技公司在模式識別各領域擁有多年的技術積累,深入語音合成、生物認證分析、計算機視覺等前沿技術領域,具備原創性技術突破能力;國內企業在模式識別前沿技術研發方面與國外同行處于并跑狀態,除百度、訊飛等行業龍頭外,眾多初創公司也加入了模式識別研究的技術與應用創新,催生了一批有創意的新型產品。
語音識別和圖像識別準確率明顯提升,國內企業中文語音識別技術相對領先。國內外企業均致力于提高語音識別和圖像識別準確率,谷歌和微軟分別表示旗下的語音識別產品技術出錯率已降至8%和6.3%,微軟研究院開發的圖像識別系統在世界著名的圖片識別競賽ImageNet中獲得多個類別評比的第一名,為下一步的商業化應用奠定了良好基礎。同時,國內企業重點突破中文語音識別技術,搜狗、百度和科大訊飛三家公司各自宣布旗下的中文語音產品識別準確率達到了97%,處于業內領先水平。
中傳動網版權與免責聲明:
凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.hysjfh.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。
本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊
- 運動控制
- 伺服系統
- 機器視覺
- 機械傳動
- 編碼器
- 直驅系統
- 工業電源
- 電力電子
- 工業互聯
- 高壓變頻器
- 中低壓變頻器
- 傳感器
- 人機界面
- PLC
- 電氣聯接
- 工業機器人
- 低壓電器
- 機柜