隨著蘋果公司秋季發布會的落幕,其推出的“3Dtouch”技術被稱為是“人機交互”界的技術革命,“3Dtouch”也成為了各大搜索引擎的熱搜詞。維視圖像作為一家致力于視覺傳感器研發及應用的公司,在此也要腦洞大開的談一下機器認知技術。從第一次工業革命,也就是機器擁有了動力開始,“機器”(這里的機器是廣義的機器,包括所有民用或工業設備)就不斷向著人類能力的方向發展。由此帶來的“人機交互(人和機器的溝通交流)”、“機器認知(機器理解客觀世界)”技術,逐漸發展為不同的細分專業。“機器認知”技術的基礎是機器“感知器官”,也就是機器的信息來源,主要是各種類型的傳感器。
接觸類傳感器:接觸類傳感器是最早被研發出來的機器認知“器官”。像壓力傳感器、電容傳感器等所有以“接觸式”為信息獲取方式的都屬于此類。典型應用包括:電梯的超載警告系統;智能手機屏幕;各類運動機構的閉環限位裝置等。本次要說的“3Dtouch”其實也屬于這一類,但它是其中的佼佼者。傳統的智能手機,內置程序只能從屏幕獲取四類信息:輕點、雙擊、單向滑動、雙向滑動。所有的APP都只能依據這些信息來源執行相應步驟。而“3Dtouch”屏幕增加了壓力感應器,所以用戶可以向手機多輸入一種命令“重壓”,這使得用戶跟手機之間的“溝通”就多了一種手段。所以,“3Dtouch”在手機行業可謂是“新技術”,但是在科研領域,這不算是特別了不起的技術。
光電傳感器:這是一種非接觸式傳感器,發射端的光線被遮擋以后,就可以得到一個脈沖信號。典型應用包括:自動水龍頭開關、紅外感知阻斷器等。此類傳感器能感知的對象行為非常單一,反饋的信號也只有兩種——“有/無”,主要在一些項目中充當信號輔助設備。
視覺傳感器:俗稱攝像頭。狹義的講,它不屬于傳感器類別。但是從“機器認知”的角度講,它卻是最好的傳感器。攝像頭可以獲取客觀世界中的顏色、紋理、形狀、輪廓等各種信息,將其存儲在“圖像”信號中,然后借助圖像處理算法獲取有用的信息,并傳遞給機器。這里的視覺傳感器不同于我們手機攝像頭、數碼相機等民用設備,相機之所以能被稱為傳感器,主要是因為相機能客觀真實的反映被攝對象。以維視圖像的MV-EM120M黑白CCD相機為例,相機在拍攝過程中所有影響圖像灰度等級的因素均可以在程序中得到控制。比如:曝光時間、增益、圖像AD位數等。相機可以感知到極其細微的灰度變化,如下圖所示的透明材料中的透明液體檢測。
了解了“機器感知”常用傳感器特點功能后,我們很容易發現,要想提升機器感知能力,必須要提升傳感器的信息獲取量,那么視覺傳感器必然是未來“機器認知”技術發展的核心部件。“機器認知”包括兩部分:機器感知——機器獲取信息;機器認識——對獲取到的信息進行分析處理。上面針對傳感器做了簡單分析,下面進一步對機器感知手段做個介紹。
機器感知手段——視覺傳感器:我們知道了機器感知客觀事件的最佳“器官”為工業相機,那么,什么是工業相機?怎么給機器配置合適的工業相機?這些問題具體可以參考“如何準確認知工業相機”一文,這里重點闡述視覺傳感器和機器的結合關系。“機器認知”概念的提出是較前沿的提法,這不同于傳統的自動化編程機器,“機器認知”的核心是機器可以“思考”,可以隨著客觀世界的變化而判斷自己的動作。那么,機器對物體的感知越細致,可供判斷的依據也就越充分。下圖展示了兩種不同傳感器對同一物體的“認識”,很顯然采用專業成像系統的圖片能夠提供更多的信息。所以隨著“機器認知”和“人機交互”的提出,勢必對視覺傳感器,也就是工業相機提出了新的要求和新的挑戰。
機器認識手段——圖像處理算法:“機器認知”的第二點也非常重要,感知器官獲取到了信息,但是該信息不一定是機器能夠直接識別的,那么必然要通過一種手段把該信息轉換為機器語言,這種轉換手段就是“圖像處理算法”。由于不同的項目需求和科研需求,針對工業相機獲取的圖像的分析算法各不相同。像開源的算法平臺openCV在民用行業用的比較多,基于衣服圖片來搜索對應衣服款式的“衣+”就是依托此平臺開發。而面向教學科研領域的XAVIS組態式圖像處理開發平臺是面向開發者的收費軟件,該軟件包含了300多個常用圖像處理算子,是業內為數不多的以中文界面開發的組態式系統。
當然了,“機器認知”是一種很前沿的概念,包含的前沿技術非常多,學科跨度也很大。本文由“3Dtouch”引申而來,希望能給行業內外的讀者一點啟發,將不同領域、行業的先進技術和經驗融會貫通,相信未來科幻電影中的智能機器人不會離我們太遠的。