數據模型又叫黑箱模型,指基于數據的模型,相關的概念包括人工智能,數據挖掘,機器學習等。數據模型有幾個不足,首先,得有大量的數據;其次,數據的分布必須合理;其三,分析方法得恰當,否則存在于數據之上的模型可能和事實并不吻合。數據建模的軟件也很多,例如專業軟件SAS,而Hadoop與Oracle也提供數據分析包,云計算服務商則提供物美價廉的計算服務,機器學習的研發人員可能還習慣用Python,R語言。還有很多計算工具,如Excel也是非常實用的工具,而Matlab提供非常豐富的機理仿真和數據分析工具。從人工經驗,到數據分析,到機理規律,是對事物越來越理性的刻畫。完美的建模過程,應該包括三個步驟。人工經驗是模糊的,也是引發思考的;數據分析,已經在慢慢量化,初步揭示了事物之間的聯系;深層次的機理規律才是真正揭示了事物因素間的必然聯系。嚴謹的建模過程,最好是三者吻合,最起碼是兩者互相驗證,互相補充,單純依賴一種結果是可怕的。
例如,傳感器裝再多,也不可能無處不在,因為傳感器需要成本,而且需要有合適的安裝位置。合適的機理模型,加上傳感器數據的驗證(或者通過傳感器數據確定機理模型的參數等,專業術語叫辨識),就可以獲得空間、時間維度更完整的信息。
德國的優勢在于人工經驗和機理規律,弱勢在于數據分析能力(德國人口少,信息技術和數據分析技術很難廣泛頻繁運用,所以數據分析技術并不發達)。所以德國的模型是基于機理規律的,是直觀的。
日本的精益制造中,非常突出人工經驗。而美國的優勢在于數據分析和機理規律,弱勢在于人工經驗。美國NI公司的最新嵌入式控制器網絡同步精度小于100ns,體現了美國人對數據的孜孜不倦的追求。TS16949質量體系,也體現了美國人對數據的鐘愛,是早期工業化與信息化融合的優秀范本。
中國在數據分析上有一定的優勢,弱勢在于人工經驗和機理規律,也就是專業軟件。長期起來,各類專業軟件都是盜版的。加上中國產學研脫節比較嚴重,很多大學的研究成果是無法深究的。如果建立合適的產學研通道,學校的老師和博士還是有能力的。研究成果無法深究,很多時候不是能力問題,而是和社會溝通不夠,從論文到論文,沒有把理論應用到實踐。如何將院所研究與企業實踐做到完美的融合,是當下中國智能制造急需克服的成果轉化的事情。
綜合起來,人工經驗、機理規律和數據分析各有利弊。各個行業和公司,需要采用合適的建模方法,以最大程度提高公司和產品的核心競爭力。中國當下已經有非常低成本的獲取工業數據的辦法(得益于百度云、阿里云的飛速發展)。數據回來了,人工經驗分析下曲線,也已經可以獲得有意義的信息了;通過數據分析,即使是只用Excel,也可以解決很多問題。阿里云對于采集、存儲與數據分析都非常低廉。建立統一的工業互聯網也許痛苦,但子系統依靠儀表以及原有的控制系統,采集數據并不那么難。即使實在不行,還可以借鑒TS16949質量體系,采用表格,也可以回來有價值的數據。
工業化與信息化融合是智能制造的必經之路,打磨和應用這三把利刃是最大的基本功。