基于统计特征的不等长间歇过程故障诊断研究本科毕业论文(编辑修改稿)内容摘要:

合我们称之为主元,线性组合的维数称之为主元个数。 沈阳化工大学学士学位论文 第 二 章 MPCA 在间歇反应过程故障诊断中的应用 7 主元分析的基本原理 前面已经提到, PCA 的目的就是“降噪”和“去冗余”。 “降噪”的目的就是使保留下来的维度间的相关性尽可能小,而“去冗余”的目的就是使保留下来的维度含有的“能量”即方差尽可能大。 首先,要知道各维度间的相关性以及个维度上的方差,能同时表现不同维度间的相关性以及各个维度上的方差的数 据结构就是非协方差矩阵。 协方差矩阵度量的是维度与维度之间的关系,而非样本与样本之间。 协方差矩阵的主对角线上的元素是各个维度上的方差 (可以称之为能量 )元素是两两维度间的协方差 (即相关性 )。 通过矩阵对角化进行降噪,消除各变量间相关性,而对角化后得到的矩阵,其对角线上是协方差矩阵的特征值,它有两个身份:首先,它还是各个维度上的新方差;其次,它是各个维度本身应该拥有的能量 (能量的概念伴随特征值而来 )。 通过对角化后,剩余维度间的相关性已经减到最弱,已经不会再受“噪声”的影响。 “降噪”后开始“去冗余”。 对角化后的协方差 矩阵,对角线上较小的新方差对应的就是那些该去掉的维度 [12]。 现在只取那些含有较大能量 (特征值 )的维度,其余的就舍掉即可。 PCA 的本质其实就是对角化协方差矩阵。 主元个数的提取 累计方差贡献率法作为一种可适应于所有的情况方法,成为确定主元个数的通用方法。 主元贡献率法因其简单、直观、方便等特点,在很多文章中得到了采用,在本文中也主要采用这种方法,用来确定主元个数。 累计方差贡献率( Cumulative Percent Variance, CPV)法是根据主元方差的累计和百分比来确定主元个数。 累计 方差贡献率反映了所确定的主元模型反映原数据信息的程度。 由于数据矩阵主元方差等价于协方差矩阵的特征值,所以也把矩阵 X 的协方差矩阵的前 k 个特征值的和除以它的所有特征值的和称为 X 的前k 个主元的累计贡献率,它表示了前 k 个主元所解释的数据变化占全部数据变化的比例。 因此前 k个主元的累计贡献率 CPV 可以表示为 [1]: 沈阳化工大学学士学位论文 第 二 章 MPCA 在间歇反应过程故障诊断中的应用 8 niiiCPV1k1i () 其中 i 为第 i 个特征值。 当 k 个主成分的累积贡献率超过一定的指标后(一般85%足够),我们就可以认为已求的主元个数 k 可以综合原数据足够多的信息。 主元模型 假设 X 是一个 nm 的数据矩阵,其中的每一列对应于一个变量,每一行对应于一个样本。 矩阵 X 可以分解为 n 个向量的外积之和,即 1 1 2 2 nnX t p t p t p     () 在式 ()中, mi Rt 被称为得分 (score)向量, ni Rp 称为负荷 (Loading)向量。 X 的得分向量也叫做 X 的主元。 式 ()也可写为下列矩阵形式: X TP () 其中  12, , , mt t t 称为得分矩阵,  np,p,pP 21 称为负荷矩阵。 各个得分 向量之间是正交的,即对任何 i 和 j ,当 ij 时,满足 0ijtt 。 各个负荷向量之间也是互相正交的,同时每个负荷向量的长度都为 1,即 0jTi pp ji () 1jTi pp ji () 当矩阵 X 中的变量间存在一定程度的线性相关时,数据 X 的变化将主要体现在最前面的几个负荷向量方向上,数据矩阵 X 在最后面的几个负荷向量上的投影将会很小,它们主要是由于测量噪声引起的。 这样就可以将矩阵 X 进行主元分解后写成下式 [3]: 1 1 2 2 kkX t p t p t p E       () 式中 E 为误差矩阵,代表 X 在 1ap 到 np 等负荷向量方向上的变化。 所谓的主元模型,指的是对来自正常稳态工况下的训练集进行主元分析后得到的一系列统计信息,主要包括:变量均值向量、变量方差矩阵 D 、协方差矩阵 、主元方差矩阵 D 、负荷矩阵 P 以及主元数 k 等。 将反映过程正常运行的历史沈阳化工大学学士学位论文 第 二 章 MPCA 在间歇反应过程故障诊断中的应用 9 数据收集起来,对这些数据进行主元分析,建立主元模型。 由于主元分析的结果受数据尺度的影响,因此在进行主元分析时,需要先将数据标准化,即将每个变量的均值减掉然 后除以它的标准差。 即 [6]: ,n ,2,1,))(( )( 2/1* iXV a r XEXX i iii () 这样原数据集就变换为均值为 0, 方差为 1的标准数据集。 对标准化后的数据进行主元分析,如果只取前 k 个主元,那么可以得到下面的主元模型 [14]: 1 1 2 2 k k pX t p t p t p E X E         () 式中 1 1 2 2p k kX t p t p t p      () 1ATTA A i iiX T P t p () 原测量数据集可表示为 X X E () 从式 () 可以看出原正常工况下的历史数据集可分解为两部分 , 即一部分信息投影到主元子空间中 , 另一部分则投影到残差子空间。 这样 , 如果原系统中存在着大量的冗余 , 那么利用 A 个方向向量确定的子空间 , 即 PCA 空间 , 就能对系统进行很好的描述 , 而 PCA 子空间代表 X的特征空间 , X 是 X 很好的估计。 基于 MPCA 的故障检测方法 MPCA 理论 MPCA 是主元分析法( PCA)在三维数据阵的扩展上的应用 [1]。 对于间歇反应过程来说,其数据样本通常可以看作为一个三维的立体数据块 , 节中介绍的主元分析法( PCA)只能用来处理二维数据,而处理一个这样的三维立体数据块,一个有效的想法就是对其进行重新排列。 MPCA 的基本思想是将一个三维的立体数据块X 沿着时间轴方向进行切分,然后将切分得到的数据时间片依次向右水平排 列,如此构成了一个新的二维数据阵,然后使用主元分析方法进行分析 [6]。 不同于连续生沈阳化工大学学士学位论文 第 二 章 MPCA 在间歇反应过程故障诊断中的应用 10 产过程,间歇过程的历史生产数据以批次为单位构成三维数据矩阵,批次 (I) 变量 (J) 时间 (K),如图 [8]。 图 MPCA 数据矩阵沿时间轴分解图 如图 所示 ,每一时间点上都是二维数据 ,如果大量采集正常批次的数据样本 ,那么它们代表了在不同的时间序列中不同的批次的相同变量的统计特性。 通常统计控制指标有以下 3 种 ,它包括预 Q 统计量 ,得分 Score 和 HotellingT2统计量。 基于 MPCA故障检测的统计量及其控制限 故障检测是多元统计过程监控的第一步,通常用 2T 统计量和 Q 统计量以及得分 Score 来进行故障检测 [1]。 (1)Score imi iji xp 1t () (2)Q 统计量(预测误差平方和 SPE) Q 统计量衡量样本向量在残差空间投影的变化, Q 统计量通常也称为 SPE 统计量,其计算式为   xPPIxPPIQ TTT )()(  () Q 统计量的阈值计算式可以近似为 X(1) X(2) X(3) X(K) 变量 (J) 1 J 2J KJ 时间 (K) 批次 (I) 沈阳化工大学学士学位论文 第 二 章 MPCA 在间歇反应过程故障诊断中的应用 11 220 02 1/2 2 0 01 211( 1 )1)ch hhh     ( () 其中, 20 1 11 ( 1 , 2 , 3 ) , 1 2 3 / 3m iijjA ih       ,  为 X 的协方差矩阵  的特征值, A为 PCA 模型的主元个数, m为样本的维数。 统计量 SPE 在第 i 时刻的值 ie 是一个标量 ,它刻画了此时刻测量值 XI 对主元模型的偏离程度 ,由于由多个变量的综合作用而成 ,因而 SPE 图可以同时对多变量工况进行监控 [6]。 (3)Hotelling 的 2T 统计量 [7] Hotelling 的 2T 统计量由下式给出: 2 1 2x TTT P P x T   () 其中  1 , Adiag  ,表示置信度为  的控制限。 假设过程正常运行时的样本服从多元正态分布,那么可以按下式计算控制限 : 。 ,22)( )1n( AnAFAnnAT  () 其中 ,。 An AF  是指自由度带为 A 和 nA 的 F 分布 的置信水平为 1 的分位点。 分值向量 Score、 Q 统计量、 2T 统计量均可以对过程中的故障进行检测。 当 Q统计量 (即 SPE)发生较大变化时,说明 MPCA 统计模型所代表的正常工况下的变量关系被破坏,即该过程有故障发生;当 2T 统计量发生较大变化而 Q 统计量相对变化不明显时,说明变量间的关系基本满足,但过程工况发生了变换,即该过程有故障发生。 基于 MPCA的故障诊断方法 将采样信息的分 值向量 Score、预测误差 SPE、 Hotelling 2T 与正常工况下建立的统计数学模型比较 ,判断其是否在置信区间或控制限内 ,是则为正常 ,否则为有故障存在 [14];在各自的时间序列上建立统计模型 ,将新批次的数据向模型空间投影 ,通过判断与模型的拟和程度即可以诊断出反应过程是否有故障发生 [1]。 由 可以看出, MPCA 将每一批完整的数据看作间歇处理过程的一次采样,多批数据构成沈阳化工大学学士学位论文 第 二 章 MPCA 在间歇反应过程故障诊断中的应用 12 样本集合 ,并在此样本集合上进行 PCA 分析。 以上特点决定了 MPCA 在应用于实际监控 时会出现采样数据不完善的问题;因为在批处理进行过程中,只有当前时刻及以前的数据是已知的,这些数据不足以构成对间歇过程的一次完整采样。 Nomikos 提出了解决该问题的数种方法,基本思想均是设法预测过程变量的未来输出。 常用的方法包括: 1) 补充数据为全 0,即认为以后的数据不偏离平均轨迹,这种方法的缺点是对故障不够敏感,将延迟发现故障的时间。 2) 补充数据为当前归一化采样值,即认为以后的数据偏离平均轨迹的程度和当前时刻相同,这种方法的缺点是对故障会过于敏感,增加误报的概率。 本章小结 本章的内容主 要包括两大部分,第一部分是对 PCA 方法的基本介绍;第二部分 介绍了 MPCA 理论,并对该理论进行了一定的分析,以及 MPCA 方法在 故障诊断的应用。 在第 一部分中,简单介绍了主元分析方法的意义、基本原理以及主元个数的提取方法。 在第二部分内容中,介绍了基于 MPCA 进行故障诊断的基本方法,建立统计模型,计算统计量以及控制限的方法。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。