技术

寄云DAStudio工业数据分析建模平台实战:软测量应用

igoseo.net   2021年06月15日

  本期,我们将进一步深入了解“软测量”,借助寄云科技DAStudio工业数据分析建模平台,详细展示一个具体的软测量建模案例:通过光谱数据估算汽油辛烷值的软测量建模分析的全部过程,了解软测量模型是如何帮助企业挖掘数据价值,持续优化生产。

  【背景】:

  辛烷值是用于表征汽油抗爆性的指标,汽油的辛烷(Octane)值越高,抗爆性就越好,就能用于压缩比高的发动机。汽油的辛烷值每提高一个单位就可以减少油耗0.7%-3.1%。汽油的不同辛烷值决定了其价格高低。由于缺乏在线分析仪表,在生产中采用人工采样分析得到重整产品的辛烷值,通常情况下每次从采样到最终结果出来要经过几个小时,每隔10天左右分析1次,这显然不利于生产控制。因此,有必要应用软测量技术,建立软测量模型,用于汽油辛烷值的估算,从而快速检验产品质量,指导生产操作。

  数据概况:

  60 个汽油样本的近红外光谱及其辛烷值的数据集,其中光谱包括了401维波长的光谱强度。(采用公开数据集,来源的参考文献)

  方法:

  由于汽油辛烷值的影响因素较多,且各参数间(不同波长下的光谱强度)存在相关性,样本个数又较少,因此本例将采用主成分回归 (PCR)进行建模,并讨论这种方法的有效性。

  当存在大量预测变量(自变量)并且它们高度相关甚至多重共线时,PLSR 和 PCR 都可以作为建模和预测响应变量(因变量)的方法。这两种方法都通过原始自变量的线性组合,构建新的自变量(称为成分),但它们构建这些成分的方式不同。PCR构建的成分,能最大程度的解释自变量观测值的波动(即选取自变量方差最大的方向),而根本不考虑响应变量的情况。而 PLSR 在构建成分时,会考虑响应变量的影响,因此,常使模型能够采用更少的成分拟合因变量。 从实际应用上来说,这种考虑能否最终导向产生更简约的模型,要视具体情况(场景,数据)而定。

  查看其中一个样本的各维光谱(不同波长)取值:

  接下来,拟合具有两个主成分的 PCR 模型。第一步是使用 pca 函数对 X 进行主成分分析,并保留两个主成分。然后,PCR 就只是响应变量对这两个主成分的线性回归。 当各个自变量拥有非常不同的变化程度,方差(very different amounts of variablity)时,比较通用的做法是,先对每个自变量进行归一化(normalize each variable first by its standard deviation),但此处省略。

  首先,搭建DA分析工程如图,需要注意的是,DA的PCA组件没有做数据的中心化,因此需要先用“列归一化”组件进行中心化处理(去除各列特征的均值)。基本的步骤是:

  ● 中心化

  ● PCA主成分分解

  ● 前2维主成分,联合目标值y(辛烷值),进行线性回归,训练与预测,查看回归效果

  主成分分析(PCA)后保留2个主成分的前几个元素如下:

  之后,用散点图观察回归的效果,横轴是真实的目标值(辛烷值),纵轴是预测(软测量)的辛烷值:

  观察上图中拟合值的散点图可以看出,两个成分的 PCR 对目标值的预测始终偏水平方向,并不比使用一个常量(例如87左右)去预测的效果更好。回归的 R 方值也证实了这一点,R方的值很低,远离1,因此,该回归模型对目标值方差的解释程度并不高。

  一般来说,增加主成分的个数可以更好的拟合y,因为随着成分个数的增加, X 中的大部分对预测y重要的信息都会陆续出现在新增的成分中。因此如下图右侧红框中的工程分支,尝试采用更多维的主成分进行回归。例如,用10个主成分时,残差远小于使用2个成分时,均方误差RMSE明显下降,R方也接近1。

  再次比较真实值和预测值的散点图,发现基本沿对角线方向。说明拟合效果较好。

  因此,可以采用光谱数据,利用PCR等软测量建模分析技术,预测汽油中的辛烷值,减少样品需要分析化验的频次。

  寄云DAStudio工业数据分析建模平台

  寄云科技所打造的面向工程数据分析人员的全流程数据建模分析平台,聚焦工业领域,对接海量工业数据源,快速构建数据模型和数据对象,支持拖放式,零代码,敏捷式的算法模型开发,提供海量数据预处理,机器学习和人工xpj建模分析以及模型在线部署能力,帮助工程技术人员快速从繁杂的数据中,通过xpj的分析建模,挖掘数据价值。

标签:寄云 DAStudio工业数据分析建模平台 我要反馈 
专题报道
2021世界人工xpj大会专题报道

今年大会已举办到第四届,将围绕“AI赋能城市数字化转型”方向,探讨人工xpj技术创新与产业落地的前沿进展,广泛传递城市数字

智·能融合 迈向“碳中和”——2021WAICxpj趋势论坛直播

从技术革新的视角,电气化,数字化,xpj化并举是达成双碳目标的关键所在。2021xpj趋势论坛以“智·能融合,迈向碳中和”为

2021世界人工xpj大会专题报道

今年大会已举办到第四届,将围绕“AI赋能城市数字化转型”方向,探讨人工xpj技术创新与产业落地的前沿进展,广泛传递城市数字

Baidu