人工智能之于工業,應當是融入者而非顛覆者
2018年1月13日,由極客邦科技InfoQ中國主辦的AICon全球人工智能與機器學習技術大會在北京國際會議中心召開。此次大會以“助力人工智能落地”為主題,匯聚了國內外知名企業和頂尖人工智能專家,分享落地案例、探討技術實踐,為參會嘉賓提供了選型方案,提前預估相關風險和收益,助推技術落地行業。
來自北京天澤智云科技有限公司的CTO劉宗長分享了《云計算、邊緣計算、CPS與工業智能》的主題演講。
劉宗長從工業智能的定義展開演講。未來的智能工業系統,能實現無憂的工業環境。要達到這個目標需要做到以下三點:
第一、不斷提升工業的價值,用公式:質量÷成本×客戶價值表示,即用最小的成本生產出最高質量的產品;
第二、讓隱性問題顯性化,從原來被動式解決問題變成預防和避免問題,實現三個零:零意外停機、零缺陷、零浪費;
第三、讓工業知識民主化,通過數據挖掘和建模,讓知識不僅僅服務于某一個企業,而是以一種方式在不同企業當中流轉。
如何將工業智能落地?劉宗長提出了“ABCDE+O” 技術體系 – A代表建模分析技術,B代表商業分析技術,C代表賽博平臺技術,D代表數據管理技術,E代表工程技術,O代表運營技術,這一龐大的技術體系將計算機科學、智能建模分析與工業領域知識有效地融合,是工業智能真正落地的全面支撐。
天澤智云首席顧問,美國NSF智能維護系統中心主任李杰教授提出,無論是人工智能還是深度學習或者任何一種技術,當進入工業領域時,都必須滿足3S的條件:
Standard(標準化):即如何與現有工業系統的標準化體系相結合,包括方法論、建模過程、數據質量、模型評價、容錯機制、基于預測的操作規程、不確定性管理等各方面的標準化。如果不能夠和現在已有標準相互去融合,則很難真正將技術融入工業,更無從去產生價值。
Systematic(體系化):在技術層級和應用層級方面的體系化,需要建立一套協同體系,明確智能化在部件級、設備級、系統級和社區級等不同層級中的任務邊界及相互的接口。我們在工業里面發現無論是離散型制造還是流程型制造,單點突破很難做到價值提升,一定是整體系統導入才能實現。
Sustainable(穩定可持續):與人工智能預測的可解釋性和結果的確定性相似,工業智能要能夠做到同一組數據和同一個模型,不同的人來訓練得到的結果都一樣,否則怎么做到制造系統的標準化和一致性管理呢?神經網絡也好,深度學習也好,如果它的結果不可復現,就很難融入到體系里面去。
因此,人工智能技術進入工業領域,應當是融入的方式,而非顛覆者的姿態。
之后劉宗長通過分享天澤智云在風電領域的實踐案例,為在場嘉賓深入淺出地講解了如何將計算機科學、智能建模分析與工業領域知識有效地融合,為風電產業實現智能化的價值提升。
中國風電行業在過去10年中蓬勃發展,然而風電產業的成本高昂,尤其運維成本和管理成本占了非常大的比例。針對這一挑戰,天澤智云自主研發了WindInsight風場智能運維系統,對風場運營進行精準預測與管理、對風機進行健康管理、對運維策略進行優化,這些都為風機智能化應用和風場的智能化升級提供了很大的機會空間。
實體空間中的對象是風機和風場,基于風機運行產生的各類數據進行分析,可以對關鍵部件健康狀態和風機的發電性能進行對稱建模,這樣就在賽博空間里建立了風機的鏡像模型。基于風機的運行狀態進行維護策略優化時,可以結合對未來三天內每臺風機的預測發電量等信息制定成本最優的排程決策,還可以結合發電量預測給電網調度提供更好的決策。
賽博空間里這些模型是哪里來的呢?針對風電應用中常用的場景,比如怎么預測葉片結冰,怎么預測葉片斷裂和破損等等,用戶可以在GenPro這樣的工業智能分析建模平臺中結合自己的歷史數據完成建模,并且部署到前面的生產環節當中去。接下來我們分別從生產管理、健康管理和運維管理三個方面介紹人工智能如何發揮價值。
風機發電性能分析
即便風場中的每臺風機都在運行,但運行效率可能是不一樣的,該如何更合理地評價呢?風電效率最大的問題是對標方式怎么評價,受地形、季節和天氣等因素的影響,當這些因素不在同一個狀態時,很難進行合理量化。
這里可以引入精益中的對標理念,將個體與歷史最優實踐做對標。如某一臺風機隨著時間,功率曲線發生了偏移,我們就知道什么時間點損失的功率最大;另外,同一個風場,同一個時間點,一臺風機與其他風機集群做比較。對發電性能進行建模之后,就可以用標準的風速曲線輸入到所有風機里面,從風場視角能夠找到哪些是狀態好的風機,哪些是狀態不好的風機,進而做優先級排序,或者電網里面做功率分配,是非常好的參考。
故障的預測性診斷
影響一臺風機狀態的維度非常多,而且不同的信號對應的故障模式和部件也不一樣。一個很大的問題是很難對這些數據貼標簽,大部分情況下都是非監督式的學習。
面向風機健康狀態的建模方法,我們采用了非監督式的模式識別算法。比如,一臺風機,我們只知道它什么時間是正常的,用模式識別方法把正常模式記錄下來。接下來的數據都與正常模式進行比對,判斷它的偏移。在模式識別過程當中,我們采用了自組織映射圖(SOM),對幾十個維度特征進行降維,映射到相對低維環境當中。建立了這樣的模型之后,實時監測數據與之對比,通過它們之間的差異性來判斷現在的狀態和健康狀態差異有多大,以及哪個特征貢獻度最明顯。
具體講一個場景 - 傳動鏈的振動分析。風機傳動鏈里面有很多振動信號,通常會被傳回到專業的振動分析師服務團隊,分析師再去判斷這些頻譜里面是否存在故障。
這里的問題是,幾千臺風機只有幾十個分析師幫助管理狀態。所以,每出一次診斷報告,周期大概需要一個月時間。振動分析師是知識以人作為載體非常典型的例子。人去做分析的效率比較低,導致每一次分析的成本和周期也相對高一些。我們探索的方法是,把這個分析過程中使用的信號處理和特征工程算法用一個分析流程記錄下來,再用機器學習算法對這些分析師用來判斷傳動鏈狀態的特征進行建模,從而代替人對振動信號進行初步的分析,對于疑似故障的振動文件,再將故障狀態推薦和判據信息發給振動分析師進行確診。
我們從一個振動文件中會抽取200多個健康特征,這些特征會根據運行工況呈現不同的分布狀態,我們對一個風場里面上百臺風機的數十萬個振動文件中進行了特征挖掘,找到里面絕大多數風機特征分布狀態的模式,這樣就形成了一個全局的基線。接下來把每一個風機的狀態特征跟訓練好的基線進行對比,做差異性判斷。
圖中顏色越鮮亮的地方,表示差異性越強,也就是這臺風機的狀態與集群的差異性越明顯。之后對差異貢獻度進行分析,做故障進行定位,對背后所對應的振動文件進行分析,就能找到相應的故障模式。這樣的過程基本上能夠實現實時的分析,并且可以把初步的診斷結果和判據推送給振動分析師,進行最后的確診,這個過程就把效率提升了很多。
運維排程的優化
我們知道了哪些設備出現了早期故障,接下來該在什么時間點把故障排除,用什么樣的排程計劃,使成本降到最低?成本有很多構成來源,包括交通、人力資源成本、維護的基礎設施工具等等,最重要的一點是,維護的風機需要停機,所造成的發電損失如何控制。最理想的方式是在風速比較小的時候維護,風速比較高的時候保持發電。所以運維排程需要考慮的因素非常多。
以外賣騎手調度過程做一個類比。餓了么的外賣騎手調度,比如同樣一個訂單,幾十個騎手都是備選人群,先預測送單時間,基于預測結果,在一個優化的框架里面進行優化,然后再迭代,在很多很多種可能性里面去尋找最優的可能。
對于我們風場排程也是一個道理。需要排程的有十幾個維護任務,該讓誰做什么任務,在什么時間點去做,這里面也有非常多的優化空間。這其中我們最注重的是優化性能。舉個例子,一個風場僅僅做20個維護任務,需要對應兩艘船和三個維護小組,這背后的成本可能就已經達到上億。
最初我們選擇動態規劃的方式,包括基于像CPLEX或Gurobi的商用求解軟件,但是發現它的性能非常差,大概求解完一次的排程達到最優結果要20小時左右。后來又嘗試了其他機器學習方法,比如像遺傳算法、粒子群等等,發現求解時間從幾十個小時變成十幾分鐘,但客戶體驗仍然不夠好,我們希望做到1分鐘以內。
因此,我們做了多層的遺傳算法,它的框架根本而言是基于對決策流程的拆解。第一個層次里對最優維護順序進行排程,先不考慮時間窗,只考慮先后順序,先后順序搜索到最優情況后,再判斷這個順序里面最優時間窗是什么,比如一個任務和另一個任務的最優間隔是什么。如此,就比單層的遺傳算法的效率提升了幾十倍。
看一個真實的案例效果,對17組不同維護任務進行排程,如果用Gurobi優化引擎求解時間大于20小時,用多層遺傳算法的方法求解時間約50-70秒。優化前完成全部任務需要20個小時,成本是5萬多元;優化之后,無論是完成的時間還是總成本,都減少了30%以上。
這個過程里能夠發現,在獲取到跟設備狀態相關洞察之后,如何給它最好的決策,以此形成了洞察到決策到執行的完整閉環。只有形成了這樣真正的閉環,才能不斷迭代提升工業當中的價值。

提交
駿業日新 大展宏圖 | 天澤智云上海分公司成長記
在智能化落地過程中我們學到了什么?
工業智能技術在軌道交通領域的應用實踐分享
基于GenPro的工業智能建模案例分享
工業智能為軌道交通安全高效運營保駕護航 天澤智云與您相約RT FORUM