【中國傳動網 行業動態】 有些人可能認為大數據分析是機器學習或人工智能的同義詞,但其實這并不正確。雖然這些技術的某些方面可能被用于大數據的分析應用中,但只關注它們肯定會造成混淆和不切實際的期望。圍繞人工智能的炒作,暗示當將其應用于大數據時,會自動生成有用的信息。它可以在最終用戶很少或沒有努力的情況下產生結果。然而,數據分析用戶的體驗往往卻截然不同。
專注于創業公司的分析公司CBInsights認為,當前人工智能處于一種非理性的“繁榮”。人工智能技術的實際應用與營銷炒作之間存在負相關性,這會對用戶造成混淆。
例如,某供應商分享了一個案例研究,聲稱他們使用了以人工智能為中心的數據分析解決方案來解決生產問題。在演示文稿中,供應商展示了他們發現的生產過程和產品結果之間的相關性公式。該回歸公式是一個很好的工具,但說它就等同于人工智能顯然是種誤導。公式使用的甚至不是回歸變量;它是機器學習算法的一個最基本形式,也是在MicrosoftExcel2007數據分析工具包中就引入的一個功能。
一個有著10多年歷史的功能,被重新包裝和炒作為人工智能,表明在對認知計算的理解方面出現了混淆。這其中的一部分原因是人們缺乏對什么是人工智能、機器學習、深度學習和其它形式"認知計算"的理解,以及對監督和無監督變量的論據。
這種炒作與痛苦的現實形成了鮮明對比,現實是很多企業收集到的大量數據甚至沒有被分析或利用,從而無法提供有價值的信息,不能被工程師和分析人員用其來生成可執行的信息。
過程數據分析
雖然許多先進技術(包括人工智能)可用于數據分析應用程序,但大數據分析的重點不應放在技術上。相反,重點應該放在用戶體驗上,以及如何將信息加速應用到過程優化中。
重點應該放在精通這一領域的專家(SME)——過程工程師、數據分析專家等,以及他們在數據中尋找信息的能力上。不管數據分析應用程序中使用的是什么技術,目標始終是讓沒有太多數據科學專業知識的用戶能夠訪問和實施該解決方案。
設計良好的數據分析應用程序,應該使行業專家能夠獲取相應的信息。當數據分析應用程序挖掘其它功能時,應該在過程專家可以訪問的易于使用的功能環境中實現這些創新。
數據分析應用程序應該使用可用的技術幫助最終用戶獲得成功。如果采用的是機器學習或人工智能,那很好,但數據分析應用程序不應僅限于這些功能,或其它為了市場炒作而限制其他功能。有許多算法和創新技術,都可以為想要挖掘數據洞察力的用戶提供幫助。
算法功能可以包括為了進行數據清理的數字信號處理、過程信號中的形狀檢測以及分布式計算的Map-reduce模型。無論是調用機器學習、人工智能、還是其它算法,都不是重點。重點是幫助最終用戶更快地獲得成功。
數據連接
認知計算算法是過程制造和工業物聯網(IIoT)解決方案中,進行數據分析的重要組成部分,但只是其中的一部分。其它方面還包括數據整理(這是必要的數據連接),清理和以及為了使用而進行的數據語境化。數據分析應用程序的重點,必須包括這些準備步驟,以便加快從數據連接到信息發布的速度。
此外,數據分析應用程序應使用戶能夠將分析擴展到所需的任何級別。最終用戶將繼續擴展使用數據分析應用程序以及對特定算法的需求。因此,數據分析應用程序應包括通過RESTAPI、OData等特性對其它算法的可擴展性,并將算法集成到用戶體驗中。
側重問題解決
當數據分析應用程序允許用戶關注問題而不是技術時,用戶可以將精力更集中于如何快速獲得所需的結果。下文將從制藥、電力、冶煉、石化和造紙行業中出現的實際問題中,解析大數據分析的應用。
●制藥實驗室分析
問題:當從實驗室轉向全面生產時,在實驗室中實現的反應,不能在規模生產時重復。使用手動方法和現有的數據管理工具(如電子表格),很難找到原因。
解決方案:通過大數據分析,將匯集與實驗室和全面生產相關的不同來源的數據進行分析。這使得制藥企業能夠快速比較這兩個過程,并確定關鍵的區別,調整規模生產的參數以提高產量。
●發電廠污染控制
問題:工廠運行人員無法從工廠的自動化系統中快速獲取足夠的信息,實時控制污染減排設備。這經常會導致添加過量的化學藥品,從而產生額外的成本。
解決方案:數據分析應用程序處理信息的能力,可以快速地控制污染減排系統,就像控制其它任何過程變量一樣,對化學物品如氮氧化物、硫磺氧化物的使用進行優化,減少汞的排放,在延長設備壽命的同時,降低化學藥品的成本。
●冶煉運營控制
問題:像冶煉一樣受到嚴格管制并且高能耗的生產工藝,很難用傳統的電子表格來描述。因此,要平衡多個因素,并在成本、環境因素和能效之間做出最佳權衡幾乎是不可能的。
解決方案:數據分析被用于分析多個變量之間的關系,這使得在任何給定時間,基于關鍵變量來控制過程都變得更容易。通過嘗試各種可能方案,簡化了為不斷變化的成本或新法規而進行的配比調整。
●煉油反應床監控
問題:由于煉油廠的工況復雜,會造成各種問題,因此難以預測反應床的結垢。來自各傳感器的數據往往帶有噪音,因此就很難確定實際趨勢并采取相應的糾正措施。
解決方案:數據分析解決方案利用其數據清洗和膠囊技術,消除噪聲,并確定導致加速結垢的關鍵運行工況。在穩態條件下創建基準,使您可以很容易地確定何時出現問題,并執行預測性維護。
●紙漿和紙張質量評價
問題:制漿機的制漿工藝可根據可用性混合各種木材品種。要想驗證原料的變化會不會對最終產品產生負面影響是很困難的,這主要是因為從制漿到成品的時間很長。
解決方案:數據分析應用以歷史紙漿數據為基礎,確定紙漿的最終產品質量。然后,在紙漿輸送到造紙機之前,生產者開始測試紙漿,并利用這些信息,準確預測最終產品的關鍵特性。
使用正確的數據分析應用程序,將有助于制造企業實現效率提升的目標。當前的炒作和承諾,將會隨著時間的推移而變得成熟,數據分析將成為工業環境中所期望的和穩定的必要組成部分。但是,具有行業專家和專業知識的最終用戶將會領先一程。
集成人工智能、機器學習和其它技術,將使數據分析應用程序能夠從大數據中更快的生成可執行的信息。
有效數據分析的4個要求
要實現IIoT的好處,需要重新審視軟件分析產品。目標是找到一個產品,可以提供完整和靈活的方法,從生產數據中提取有價值的信息。數據分析軟件,可以給過程專家提供第一手的有價值的數據信息,使他們能夠自定義分析并改進生產結果。
能為IIoT的實施提供有價值的數據分析需要注意以下4個方面:
1.生產率提升
這需要一種應用方法,以便工程師和分析人員可以很容易地使用該軟件,作為他們調查和發現工作的一部分,以快速改善生產。分析工具必須適合具有專業知識以及對工廠了解的人員使用,而不是那些軟件領域方面的專家但不了解該工藝過程的人員,如程序員、數據專家。
2.時間序列數據
任何IIoT實施的核心,都是來自傳感器的模擬數據。這些數據通常難以操作、清理和情景化。典型的手動解決方案需要在Excel表中或編程腳本中花費數小時來自定義。IIoT的數據分析工具,應促進和加速對時間序列數據的調查,以便工程師能夠專注于發現和洞察而不是數據的處理或操作。
3.數據種類和語境
這允許傳感器數據由與其關聯的批處理或資產來組織管理,也可以很容易地被分解為連續過程中的機器狀態和條件。這一點很重要,因為最典型的工況是新舊數據混合在一起,或者混合了來自不同來源的控制數據。
4.協作支助
這使得團隊成員之間以及一個或多個設施之間的共享發現和討論成為可能。這需要能從任何平臺(包括PC、平板電腦和智能手機)上運行的任何瀏覽器訪問數據分析軟件。因此,為了從采集的數據中獲得最大收益,過程制造企業應該尋找了解數據背景以及企業面臨的業務和過程挑戰的系統供應商。這些供應商可以在集成協議、部署和體系結構方面進行大量的提升,使過程工廠能夠集中精力,從各種IIoT方案中獲得最大的價值。