随着互联网、物联网等快速兴起与普及,当前社会数据的增长速度比以往任何时期都要迅猛[1-4]。数据规模呈井喷式增长,数据种类日渐丰富,数据结构愈加复杂,在浩瀚的大数据洪流中淘出“真金白银”,已成为世界各国的共识。2012 年美国政府投资 2 亿美元启动“大数据研究和发展计划”[5],认为数据是“未来的新石油”,将大数据上升到国家战略层面。2014 年我国工信部发布《大数据白皮书》指出大数据对传统信息技术带来了革命性的挑战和颠覆性的创新,正悄然改变着我们的生活以及理解世界的方式,并渗透到了各个领域[6]。2015 年国务院印发了《促进大数据发展行动纲要》,明确表示数据是国家的基础性战略资源,并引导和鼓励各个领域在大数据分析方法及关键应用技术等方面开展探索研究[7]。
在机械领域,风力发电设备、航空发动机、高档数控机床等大型机械装备正在朝着高精、高效方向发展,装备的安全可靠运行举足轻重,必须依靠故障诊断理论与方法保驾护航。由于需要诊断的装备群规模大、每台装备安装的测点多、数据采样的频率高、装备从开始服役到寿命终止的数据收集历时长,所以获取了海量的数据,推动故障诊断领域进入了“大数据”时代。例如:中国华电集团公司新能源远程诊断平台监测着蒙东、黑龙江、山东、浙江等国内 17 个区域,包含库伦、七台河、虎头崖、舟山长白等 110 个风场的 4 000 余台风机,通过获取振动与 SCADA 系统信号,实时反映风机的运行状态;三一重工远程监测系统对泵车、起重机、搅拌车等十大类、百余种、十万余台工程机械装备进行在线管控,目前已积累了 1 100 亿条以上的数据,并且以每天 1 000 万条的速率增长;通用公司统计指出[8]未来 15 年将增加大约 33 000 辆柴电动力机车,每台机车发动机需要监测其牵引电机、散热器风扇、压缩机、交流发电机、发动机和涡轮机六大系统,到 2025 年仅仅机车发动机就需要部署 396 000 个传感器进行监测,数据量极大;劳斯莱斯公司实时监控着全世界数以万计的飞机发动机,每台发动机约有 100 个传感器,采集着振动、压力、温度、速度等信息,每年利用卫星传送着千万亿字节(Petabyte, PB)级的数据,并产生约 5 亿份诊断报告。
由以上案例可见,机械大数据不仅具有大数据的共性,更有本领域的特性[9]:① 大容量,数据量达到 PB 级以上,依靠诊断专家和专业技术人员手动分析很不现实,需要新理论与新方法进行自动分析;② 低密度,机械装备在服役过程中长期处于正常工作状态,导致监测数据蕴含的信息重复性大,数据价值密度低,需要数据提纯;③ 多样性,数据涵盖了多种装备不同工况下多物理源辐射出的大量信息,信息之间相互耦合,导致故障信息表征十分困难;④ 时效性,机械装备各部分紧密关联,微小故障就可能快速引起连锁反应导致装备受损,需要保证数据处理的时效性,高效诊断故障并及时预警。
1 国内外研究现状
从广义上讲,机械智能故障诊断通常包括如图 1 所示的三个环节:① 信号获取:获取机械装备辐射出的多物理监测信号,反映装备健康状态;② 特征提取:通过分析获取的监测数据,提取特征揭示故障信息;③ 故障识别与预测:基于提取的特征,通过人工智能模型与方法识别并预测故障。国内外学者在以上每个环节都开展了大量的研究工作,限于篇幅要求,本文未能详细罗列所有相关文献,只选取了近年来代表性的工作予以综述。
1.1 信号获取利用先进的传感技术获取响应信号表征机械装备的运行状态,是机械故障诊断的前提。由于机械装备故障信息常常表现在动力学、声学、摩擦学、热力学等多物理场,国内外学者已经开始从不同物理场获取响应信号开展故障诊断研究。 1.1.1 振动信号获取美国国家航空和宇宙航行局 TUMER 等[12]用三向加速度传感器获取直升机振动信号。意大利比萨大学 SAPONARA 等[13]研究了航天器正常测试与噪声干扰下低 G 加速度采集系统的建模、灵敏度分析和原型设计等。英国曼彻斯特大学 SINHA 等[14]研究了如何优化旋转机械振动信号获取的问题。西安交通大学 LEI 等[15]采用多个振动传感器对行星齿轮箱健康状态进行监测。东南大学王荣等[16]针对旋转机械状态监测中振动信号高效获取的问题,提出轴向及径向振动传感器优化布置方法。重庆大学汤宝平等[17]综述了无线传感器网络在机械装备状态监测中的应用,指出其低成本、低功耗、网络化、多功能化将是未来发展方向。 1.1.2 声场信号获取加拿大皇后大学 AIDA 等[18]对比了非接触式空气耦合超声传感器和接触式压电超声传感器在旋转机械健康监测中的优劣。爱尔兰贝尔实验室 SCANLON 等[19]利用非接触式麦克风传感器获取旋转机械的声音信号进行剩余寿命预测。波兰矿业冶金学院 GLOWACZ[20]获取直流感应电机的电流信号监测其转子导条的健康状态。合肥工业大学 ZHANG 等[21]利用实时近声场全息技术监测结构的瞬态振动。中国科学技术大学 ZHANG 等[22]布置路边声场,通过获取声音信号并消除多普勒效应诊断火车轴承故障。 1.1.3 声发射信号获取韩国昌原文星大学 GU 等[23]采集声发射信号描述主轴退化过程中裂纹扩展情况。英国布鲁内尔大学 NIKNAM 等[24]获取低速轴承多工况下的声发射信号区分其干摩擦与润滑状态下的健康状态。澳大利亚伍伦贡大学 CAESARENDRA 等[25]利用声发射信号监测高速、中速、低速等运行条件下回转支承轴承的健康状态。哈尔滨工业大学 HAN 等[26]采集声发射信号对轴承的健康状态进行监测。北京化工大学李潇等[27]通过获取声发射信号检测海洋平台裂纹、腐蚀、断铅等各类损伤。
1.2 特征提取以信号处理技术为基础的特征提取是实现机械故障信息表征的主要途径。当机械装备出现故障时,通常在时域、频域和时频域都有不同程度的体现,国内外学者针对不同域机械故障信息提取问题展开了丰富的研究工作。 1.2.1 基于时域信息的特征提取西班牙加泰罗尼亚理工大学 PRIETO 等[34]使用统计指标结合曲线成分分析方法提取电机轴承局部缺陷的故障特征。美国宾夕法尼亚州立大学 MARK[35]使用时域同步平均技术消除齿轮啮合振动中的谐波影响,进而实现时域信息的特征提取。巴西塞阿拉联邦大学 MOURA 等[36]利用去趋势波动分析方法表征风机信号的长程相关性特征。清华大学 CHU 等[37]利用轴心轨迹及庞加莱截面等技术研究了转子碰摩故障机理。哈尔滨工业大学陈予恕[38] 指出可将实测振动数据进行相空间重构,再根据表征能量分布的奇异谱实现机械故障特征提取。北京化工大学 CHEN 等[39]提出基于数学形态学的信号处理方法并用于轴承健康状态的特征提取。东南大学 YAN 等[40]利用排列熵度量旋转机械非线性行为,并提取轴承故障特征。 1.2.2 基于频域信息的特征提取意大利摩德纳大学 BELLINI 等[41]利用快速傅里叶变换提取转子的故障特征。英国哈德斯菲尔德大学 GU 等[42]提出改进的双谱分析方法,实现电机故障的特征提取。意大利米兰理工大学 BORGHESANI 等[43]提出基于倒频谱预白化的轴承故障特征提取方法。加拿大魁北克大学 LAMRAOUI 等[44]使用循环平稳分析提取刀具在高速铣削下的颤振和磨损特征。西安交通大学屈梁生等[45]回顾、总结和展望了全息谱技术在非稳态信息处理和旋转机械故障特征提取中的应用。华南理工大学 HE 等[46] 提出基于离散频谱相关技术的阶次跟踪方法,实现变工况下风机齿轮箱的故障特征提取。苏州大学 FAN 等[47]基于旋转机械信号在频域稀疏的特性,提出基于稀疏分解的齿轮箱故障特征方法。
1.3 故障识别与预测以提取的特征作为输入,采用人工智能模型与方法识别这些特征携带的故障信息,实现机械装备故障的自动识别与寿命预测,是机械智能故障诊断的目标。 1.3.1 故障识别美国卫奇塔州立大学 TAMILSELVAN 等[56]建立信念神经网络识别航空发动机的健康状态。丹麦科技大学 SCHLECHTINGEN 等[57]提出了基于神经网络的风电机组故障在线智能诊断方法。加拿大阿尔伯塔大学 LEI 等[58]提出了加权 K 最近邻算法,用于识别齿轮裂纹发展。英国思克莱德大学 WEST 等[59] 采用分层聚类算法智能识别核电站设备的故障。澳大利亚莫纳什大学 AMAR 等[60]使用基于振动谱图的神经网络实现了轴承故障识别。英国思克莱德大学 AL-BUGHARBEE 等[61]首先通过奇异谱分析清洗数据噪声,再使用自回归模型评估滚动轴承的故障程度。马来西亚大学 SEERA 等[62]综述了混合智能模型在电机故障诊断中的应用。北京化工大学高金吉[63]论述了装备故障自愈的研究意义、研究原理及可能途径。空军工程大学张琳等[64]采用基于专家系统的智能诊断方法识别导弹系统的健康状态。中国科技大学 SHEN 等[65]研究了通用支持向量分类器在旋转机械智能诊断中的应用。上海交通大学 JIANG 等[66]结合改进奇异值分解与连续隐马尔科夫模型识别了轴承故障。华南理工大学李巍华等[67] 提出了基于萤火虫神经网络的轴承智能诊断方法。湖南大学ZENG等[68]采用基于灵活凸包的最大间隔分类方法智能识别滚动轴承的故障。西安交通大学 LEI 等[1]提出基于局部连接神经网络的智能故障诊断方法,用于机械大数据诊断。1.3.2 寿命预测美国普渡大学 GEBRAEEL 等[69]提出基于神经网络的寿命预测方法,通过加速轴承寿命实验进行验证。意大利米兰理工大学 ZIO 等[70]通过系统动态失效数据建立失效迹模式参考库,进而提出数据驱动的模糊寿命预测方法。美国佐治亚理工学院 CHEN 等[71]采用自适应神经模糊推理系统结合粒子滤波技术预测直升机齿轮箱的剩余寿命。加拿大康考迪亚大学 TIAN[72]通过建立基于神经网络的预测方法评估轴承剩余使用寿命。希腊佩特雷大学 LOUTAS 等[73]使用概率支持向量回归方法实现轴承剩余使用寿命的预测。澳大利亚西澳大学 SIKORSKA 等[74]对比了模糊经验、神经网络、统计模型、物理模型等在工业剩余寿命预测中的优缺点。美国辛辛那提大学 LEE 等[75]综述了旋转机械寿命预测与健康管理的方法及应用,并指出了发展趋势。国防科技大学 WANG 等[76]提出基于非平衡退化过程的剩余寿命预测方法,并使用机械疲劳裂纹扩展实验进行验证。电子科技大学 PENG 等[77]提出基于逆高斯过程回归的剩余寿命预测方法。北京航空航天大学何兆民等[78]采用时变状态转移隐半马尔科夫模型预测柱塞泵的剩余使用寿命。军械工程学院张星辉等[79]提出基于混合高斯输出贝叶斯信念网络模型的轴承退化状态识别与剩余使用寿命预测方法。香港城市大学 TSE 等[80]提出基于支持向量回归机的健康状态概率评估方法,用于泥浆泵的剩余寿命预测。西安交通大学雷亚国等[81]提出自适应多核组合的相关向量机预测方法,并应用于机械剩余寿命预测。清华大学周东华等[82]综述了工业过程中装备的剩余寿命预测方法。由以上进展可见,国内外学者在智能故障识别与寿命预测方面的研究层出不穷,其工程实际应用潜力也初露端倪。但现有工作集中研究单个零部件的故障识别与寿命预测问题,充分利用大数据资源对整个机械系统进行诊断与预测的研究工作屈指可数。
2 大数据故障诊断面临的挑战
机械大数据蕴含大信息、大知识,将在更高的层面、更广的视角帮助诊断人员了解装备的运行状况,提高洞察力、提升决策效能。但这些有价值的信息和知识往往潜藏在机械大数据中,需要针对性的理论、方法与技术进行深度挖掘。因此,当机械故障诊断步入大数据时代,现有的智能故障诊断理论与方法遇到新的挑战。 (1) 现有研究大多利用单一物理源信号诊断单台装备,数据量小,因此诊断专家可以人为选择有价值的信号分析诊断。然而在大数据时代,通常采用传感器网络收集多物理源信号以全面反映装备状态。由于多源信号差异大、采样策略形式多、数据价值密度低,导致数据质量参差不齐,呈现“碎片化”的特点,如再依赖诊断专家人为选择信号犹如大海捞针,必将迷失于浩瀚的数据海洋中。 (2) 基于信号处理技术的特征提取往往针对特定问题,需要诊断专家深入了解机械装备故障机理和掌握信号处理技术,在此基础上,设计特征提取算法实现故障信息的表征。但面对多工况交替、多故障信息耦合、模式不明且多变的机械大数据,人为设计涵盖所有信息的故障特征根本无从着手。 (3) 机械大数据中可能蕴含着尚未意识到的全新知识,即机械故障机理与演化规律会以振动、声场、热图像等多源异构大数据为媒介被显性的表达出来。现有智能算法只能对机械健康状态进行决策,无法胜任分析萃取机械大数据中反映机械故障本质、演化机理信息的任务。
3 潜在方向与发展趋势
针对机械大数据诊断的特点与挑战,作者认为应该从以下几个方面深入开展大数据下机械故障诊断的研究工作,为机械装备的诊断与维护提供可靠的理论依据和有效的技术手段,进而全面释放机械大数据所蕴含的信息潜能。 (1) 标准大数据库建立。数据是机械大数据诊断研究开展的重要基础和资源,规划和建立标准大数据库对诊断技术创新、故障演化机理揭示、大规模科研合作等具有战略意义。可以从以下几方面着手:建立获取、存储、传输机械大数据的通用标准;学者共享标准试验台实验方案和数据;企业共享装备长期监测数据和典型案例;注重收集机械装备从正常状态到故障状态的全寿命动态演变数据;注重记录演变过程中零部件状态信息等。 (2) 大数据可靠性评估。由于机械数据规模庞大、信号来源分散、采样形式多变、随机因素干扰等原因,监测大数据呈现“碎片化”特点,因此需要提高机械大数据的可靠性,夯实装备智能诊断理论与方法的数据基础。建议开展如下研究工作:研究多通道传感器网络的数据利用准则,高效合理利用机械大数据;研究多源信号的重采样、尺度与维度转换等数据规整算法,提高信号的一致性;建立数据质量评价标准,考量数据完整性、准确性和时效性;提出子空间聚类等智能数据清洗算法,改善机械大数据的质量等。 (3) 装备故障信息智能表征。机械装备的故障作用规律往往“隐喻”在机械大数据中。以数据驱动方式解析信号组成,提取机械故障特征,实现大数据下机械故障信息的智能表征,才能充分利用机械大数据的价值。为此可以开展以下研究工作:针对机械大数据的稀疏特点,研究稀疏表达方法,如稀疏字典学习、稀疏非负分解等,探索稀疏表达方法的物理意义,如字典可视为特征波形基函数集等;结合机械故障信号形成原理,即响应信号是故障激励、随机噪声等与系统传递函数卷积的结果,提出卷积形式的重构误差反馈学习机制;针对高维机械数据通常呈现低维特征的特点,提出大数据下机械高维特征提取问题向低维转化的方法;结合解析的数据结构与记录的故障信息,发掘故障表征的新模式,促进故障机理研究,并注重早期故障微弱特征与复合故障耦合征兆的研究。
4 结论
(1) 分析了机械故障诊断大数据的特性,阐述了智能故障诊断在大数据背景下的机遇,并通过综述其国内外的研究进展,揭示了现有智能故障诊断理论与方法的问题与挑战。 (2) 给出了机械大数据智能诊断的潜在方向与发展趋势,认为应该从标准大数据库建立、机械大数据可靠性评估、装备故障信息智能表征、基于深度学习的故障识别等方面展开深入研究,将以大数据为驱动的机械智能故障诊断应用于工程实践。
参 考 文 献
[1] LEI Yaguo,JIA Feng,LIN Jing,et al. An intelligent fault diagnosis method using unsupervised feature learning towards mechanical big data[J]. IEEE Transactions on Industrial Electronics,2016,63(5):3137-3147.
[2] 李国杰,程学旗. 大数据研究:未来科技及经济社会发展的重大战略领域—大数据的研究现状与科学思考[J]. 中国科学院院刊,2012,27(6):647-657. LI Guojie,CHEN Xueqi. Research status and scientific thinking of big data[J]. Bulletin of the Chinese Academy of Sciences,2012,27(6):647-657.
[3] QIN S J. Process data analytics in the era of big data[J]. AIChE Journal,2014,60(9):3092-3100.
《大数据下机械智能故障诊断的机遇与挑战》来源:《机械工程学报》,作者:雷亚国 1 贾 峰 1 孔德同 2 林 京 1 邢赛博 1