【中國傳動網 技術前沿】 近年來,人工智能(AI)已經成為了一種非常流行的表達方式。上個世紀是一個富有創新的世紀,特別是在數學方面,為實現人工智能帶來了希望,可是很多技術上和概念上的差距讓各種各樣的方案都胎死腹中。然而,得益于過去20年來在計算能力、數據累積、數學工具等方面取得的巨大進步,而且所有這些都能以更低的成本實現,今天,人工智能已經開始融入各個行業。
為了使機器能夠理解周圍的世界,科技的發展從生物學方面獲得了啟發。通過眼睛可以獲得80%的信息,使得人類可以自我定位、并且和在他們視力范圍內的世界進行互動。
因此,大多數人工智能方面的研究都是集中在分析來自于視覺系統圖像的能力上。來自于生物學方面的另一個啟發是允許機器分析這些圖像的數學結構:人工神經網絡、人類大腦的微型結構復制品。
存在多種不同的神經網絡,主要取決于神經元之間的連接的拓撲,所使用的聚合函數、閾值函數和反向傳播方法。這些數學方法都是人工智能領域的一部分,稱為“深度學習”,通常被分為兩部分:訓練和推理。
根據要實現的目標不同,絕大多數的神經網絡都有著種類非常多的“訓練”算法(有監督的或無監督的)。算法可根據在網絡輸入處呈現的數據集修改突觸權重。訓練的目標是使神經網絡可以從示例中“學習”。
如果正確執行訓練,則網絡將提供與訓練數據集的輸入值非常相似的輸出響應。推理引擎是對應于演繹推理的模擬的軟件算法,在深度學習的情況下是神經網絡。該軟件通常嵌入在設備中。
在過去10年中,深度學習在許多領域都取得了進展。基于圖像的技術包括面部識別、虹膜和手勢監控、對象和自由空間檢測,以及最新的行為識別。
從市場角度來看,從汽車上可以注意到最驚人的進展,因為這些用于高級駕駛輔助系統(ADAS)的技術被用在了檢測障礙物、識別指示牌、信號燈、汽車、行人以及其他類似的目標上。圖像來自于布置在車身及其周圍的一系列攝像頭,而訓練是在位于數據中心的特定的計算機上進行的。對于半自動駕駛的車輛,推理算法是內嵌在引擎控制單元(ECU)內的,對于機器人駕駛或全自動駕駛的車輛,推理算法是完全內嵌在計算機內的。
生物識別技術是深度學習被廣泛使用的另一個主要部分。我們發現它的算法用于個人身份驗證,例如最新的智能手機很多都采用3D面部識別。在國土安全領域,通過專用攝像機的使用,面部識別被用于邊境控制以及身份證明文件的制作。
基于深度學習的虹膜識別也越來越多地用于移動設備的個人身份認證。未來,我們可以在這一部分中添加行為識別,雖然目前仍處于研發階段,不過所取得的初步成果已經令人鼓舞了。深度學習已經可以集成在手勢識別中,但目前主要集中在娛樂、車載計算機、游戲和商用無人機控制領域。在過去10年中,很多公司在人工智能領域的投資持續增加。市場研究機構Yole預計到2025年復合年增長率將達到50%,收入主要集中在使用深度學習的技術上。
不可否認,人工智能的發展也離不開專門的硬件開發。值得注意的是,視覺處理器的設計者和研發人員還通過嵌入式操作系統和軟件開發工具包(SDK)提供了軟件層。
這使得實施軟件解決方案變得非常容易,而且可以讓硬件的性能發揮到最大。市場上已經有很多專屬于平臺的開發工具包可選,例如:ARM公司的embedOS、NVIDIA公司的Jetson、Xilinx公司的XSDK以及CEVA公司的CDNN工具包。
為嵌入式系統開發人工智能的企業,必須在開發其解決方案時考慮這個后加的軟件層,并將其設計為與不同類型的硬件兼容。隨著其發展勢頭的繼續,人工智能視覺系統將迎來一個光明的未來,無論是硬件層面、專用處理器市場,還是軟件層面,都將有越來越強大的算法,以期在物體、面部和手勢識別方面實現更高的精度。