嘉峪检测网 2025-06-17 19:47
导读:本工作采用便携式LIBS系统对12个合金钢标准样品进行光谱采集,在对光谱进行基线校正、归一化等预处理后,对碳、硅、锰、钒、钛、铬、镍、铜和铝等 9 种元素的特征光谱和最优归一化线进行了最优匹配,最终建立了9种元素的Stacking集成算法定量分析模型,并通过评价指标对模型进行评估,可用于预测废钢中9种元素的含量。
废钢作为钢铁行业重要的可持续发展资源,被回收后常用作长流程转炉炼钢的添加料或短流程电炉炼钢的主要原料 , 可以实现钢的循环使用。与矿石炼钢相比,将废钢用作炼钢原料不仅能耗更低,节省钢铁企业成本,还能减轻环境污染。因此,钢铁行业需要重点关注如何在生产中更高效地利用废钢、更合理地配置废钢资源,以加快钢厂炼钢流程,这对我国未来冶金行业的转型和可持续发展具有积极的推动作用,对发展全废钢电炉炼钢也具有重要的战略意义。另外,我国在联合国大会上提出了“碳达峰”与“碳中和”战略布局,这对钢铁行业转型提出了更高的要求,意味着产能优化与改革升级刻不容缓。废钢的准确分类对节约资源和环境保护具有重要作用,而废钢中所含元素及其含量的高低是废钢分类的重要依据。
在钢铁行业中,一般利用化学实验法或传统光谱检测法对元素含量进行测定,化学实验法的专业性较强,需要投入大量学习成本,不易在钢铁企业广泛开展;传统光谱检测法是应用较多的技术,这些方法对试验环境要求较高,样品制备和预处理的过程也较为复杂,需要较长时间才能得到检测结果,难以满足工业现场快速实时分析的要求,导致废钢冶炼过程减缓,因此需要一种快速可靠的检测方法来改变这种局面。激光诱导击穿光谱(LIBS)技术具有快速检测、破坏性小、无需对待测样品进行过多处理、使用学习成本较低等优势,实现了传统分析技术难以达到的分析速率和水准,已被广泛应用于冶金工程、环境资源检测、生物医学分析、地质分析、农业、考古和航空航天等多种行业和领域。近年来,开发适用于工业现场应用的在线、便携仪器装置是LIBS技术的重要发展方向之一。
由于光谱数据维度高,元素间效应、基体效应和自吸收效应易导致光谱产生非线性误差,这些误差关系复杂且难以明确,因此单变量分析方法有时难以满足精度要求。随着机器学习技术的发展,如人工神经网络(ANN)、偏最小二乘回归(PLSR)和集成算法等多变量分析方法开始在LIBS技术中广泛应用。LIBS技术得益于机器学习的发展,应用在多种材料分析领域中,并开辟了广阔的应用前景。由于废钢通常来源于各种工业生产过程,为研究废钢的成分及质量,需要标准化的参考体系。本工作采用便携式LIBS系统对12个合金钢标准样品进行光谱采集,在对光谱进行基线校正、归一化等预处理后,对碳、硅、锰、钒、钛、铬、镍、铜和铝等 9 种元素的特征光谱和最优归一化线进行了最优匹配,最终建立了9种元素的Stacking集成算法定量分析模型,并通过评价指标对模型进行评估,可用于预测废钢中9种元素的含量。
01试验方法
为降低试验波动影响,每个合金钢标准样品表面均匀选取30个不同检测位置,每个位置激发50次脉冲,取第10~50次为有效数据,并对每个位置获取的光谱数据进行k倍标准差的误差剔除预处理,具体流程为:设置k值为2.5以校验剔除误差较大的数据,对剔除后的数据进行平均,自动对连续背景进行基线校正,优化各元素分析线与归一化线的谱线对,进行归一化处理,利用Stacking集成算法模型进行训练和验证。试验以样品7作为测试集,其余合金钢标准样品作为校正集用于训练和验证。
02结果与讨论
2.1 光谱预处理
2.1.1 基线校正
在等离子光谱生成过程中,由于等离子体的特性,其会受到黑体辐射、轫致辐射、复合辐射等内部因素,或激光器能量不可避免的波动、样品表面不均匀以及透镜与样品的距离等外部因素的影响。这些因素导致光谱产生连续背景,基线发生波动,获取到的数据不利于试验的稳定进行。因此,为了使试验结果更加准确,需要对获得的光谱进行基线校正处理以保持基线稳定,使其更接近理论状态,减小测量误差。
基线校正具体过程为:首先获取光谱极小值,对当前极小值前后的其他极小值按照特定公式进行计算,并设定阈值进行筛选,随后对经正向和反向两次筛选后得到的极小值进行拟合,进而得到基线,最后用全光谱数据减去基线数据,即得到最终校正后的光谱。基线校正前后样品7的光谱图见图1。
由图1可知,在不影响光谱信号强度的前提下,光谱基线得到了较好的校正。
2.1.2 光谱筛选与归一化
全光谱数据维度超过7000维,如果将整个维度的光谱数据作为模型输入,大量不相干的谱线将会被引入模型,导致维度过高,增加模型的误差和运行时间。根据元素含量与其所在波长信号强度的相关性,将待测元素的各个特征谱线的信号强度筛选出来作为输入特征。另外,由于废钢中多种元素相互作用和影响,含量与信号强度之间不一定呈线性关系,因此还要选择基体元素(即铁元素)的多条谱线来增加非线性条件。参考美国国家标准与技术研究院(NIST)谱线数据库,结合获得的光谱数据,选择明显的峰值谱线作为最终确定的特征谱线,结果见表1。
表1 元素的特征谱线
在建模前,还需对筛选的特征谱线数据进行归一化处理,一般选用基体元素进行归一化。废钢中的基体元素一般为铁元素,因此选取铁元素谱线作为内标线进行归一化,以降低基体效应的影响,增强数据中对应谱线与元素含量的相关性。试验以距离待测元素谱线较近,且谱峰完整为原则,选取内标线,共选取铁元素特征谱线65条,分别为 185.97,188.76,191.78,192.66,193.71,195.25,195.95,197.97,206.98,263.54,209.87,210.08,211.38,214.05,227.31,239.26,240.61,243.65,248.27,254.62,260.67,271.44,275.30,284.51,285.14,294.78,295.37,295.72,295.98,297.00,300.97,302.08,304.76,305.31,307.81,204.84,210.83,201.59,210.69,210.21,215.04,215.17,215.55,221.45,229.42,230.52,255.42,257.05,258.77,264.52,268.24,273. 91,275.54,206. 64,188.09,189.57,305.53,386.55,346.59,322.76,321.33,382.03,292.66,303.73,208.70nm。
利用上述铁元素的特征谱线对表2 中各元素 的特征谱线进行归一化,以线性相关程度的大小作为匹配原则确定谱线的最优归一化线,最终将各元素共49条特征谱线进行归一化。如锰元素的最优归一化谱线对为:Mn257.62nm与 Fe257.05nm;Mn259.34nm与Fe275.54nm;Mn260.57nm与Fe239.26nm;Mn293.93nm与Fe 292.66nm;Mn 294. 90 nm 与 Fe 297.00nm;Mn293.31nm与Fe292.66nm。 最优归一化谱线对能够增强谱线强度与对应元素含量的相关性,提升分析效果。
2.2 模型的建立
确定每个元素的输入特征后,需针对不同元素建立Stacking集成算法定量分析模型。模型选用的基学习器为Lasso回归模型、岭回归模型和二次线性回归模型,首先利用训练集分别对各元素建立Lasso、岭回归、二次线性回归模型,在建立前两者模型时,利用原始训练集进行建模,在建立二次线性回归模型时,对训练集数据进行二次化处理后利用LR模型进行建模。经训练后得到3种不同的基学习器,将这 3 种基学习器的输出合并,作为次学习器的输入,将元素认定值作为次学习器的输出,次学习器选用LR模型进行训练建模,最终得到各元素的Stacking集成算法模型。
2.3 模型的评估
以相关决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)等3个指标对模型性能进行评估。
R2表示模型预测值与真实值的相近程度,其值越大,说明模型的预测效果越好;RMSE表示真实值与预测值之间的偏差程度,其值越接近0,说明偏差越小;MAE是衡量模型预测误差的指标,可以很好地反映预测值误差的实际情况,其值越小,说明模型的预测误差越小。各元素模型的评估结果见表2。
表2 元素模型的评估结果
由表2可知:各元素的拟合效果较好,使用本模型得到的碳元素的R2大于 0.9800,其他所有元素的R2均大于0.9900,表现出良好的拟合性能;各元素模型的RMSE和MAE均在较小范围内,且在测定未知样品元素含量方面表现出了优秀的预测能力。相比于单变量模型,集成算法模型可以利用非线性拟合能力进一步衰减由元素间效应、基体效应和自吸收效应引起的无法表示的非线性误差。
2.4 模型的预测
利用建立的模型对12个合金钢标准样品进行预测,用碳、硅、锰、钒、钛、铬、镍、铜和铝的预测值对认定值进行拟合,结果见图2。
由图2可见,基于LIBS结合 Stacking集成算法 构建的模型可快速定量分析废钢中9种元素的含量,拟合程度较高,模型预测效果较好,基本符合废钢快检的需求。
2.5 精密度和准确度试验
利用模型对样品7重复测定5次,计算测定值的相对误差和相对标准偏差(RSD),结果见表3。
表3 精密度和准确度试验结果(n=5)
由表3可知,9种元素测定值的相对误差和RSD均小于10%,说明模型准确度和精密度较好。在模型评估中,碳元素的R2小于0.9900,说明碳元素预测的含量仍然存在一定的偏差,这是由于样品中碳元素特征谱线只在192.97nm附近有信号,且深紫外波段信号强度受空气吸收等影响较大,相关性较弱,因此预测效果一般,后续研究工作将在此处重点开展。
03试验结论
研究人员采用LIBS技术,建立了9种元素的Stacking集成算法定量分析模型。结果显示,尽管基体效应和自吸收效应等产生的非线性关系难以表征,但基于优化输入特征建立的集成算法模型能够很好地拟合这种关系,预测具有良好的精密度,同时多变量模型能够更好地利用各元素隐含的相关性,呈现出更优的非线性拟合能力,适用于废钢中元素的检测。
来源:理化检验化学分册
关键词: 废钢 激光诱导击穿光谱技术 Stacking集成算法模型