学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 理工论文 基于 Stacking 的 NiTi 基形状记忆合金绝热温变预测论文

基于 Stacking 的 NiTi 基形状记忆合金绝热温变预测论文

3

2025-08-14 16:16:05    来源:    作者:xuling

摘要:文章提出一种基于堆叠泛化(Stacking)的镍钛(NiTi)基形状记忆合金绝热温变预测方法。首先,建立包含镍钛(NiTi)基合金绝热温变数据集,采用Boruta算法对数据集进行特征选择。

       摘要:文章提出一种基于堆叠泛化(Stacking)的镍钛(NiTi)基形状记忆合金绝热温变预测方法。首先,建立包含镍钛(NiTi)基合金绝热温变数据集,采用Boruta算法对数据集进行特征选择。随后,采用DT、RF、GBRT和XGBoost作为基学习器,GBRT作为元学习器,结合K折交叉验证的Stacking方法建模。最后,采用SHAP算法对模型进行可解释性分析,挖掘各特征值对预测镍钛(NiTi)基形状记忆合金绝热温变的贡献。实验结果表明,所提方法对镍钛(NiTi)基形状记忆合金绝热温变的预测具有较高准确率,相比于单一模型,R2最高提升26.03%。


  关键词:镍钛(NiTi);绝热温变;堆叠泛化(Stacking);SHAP算法


  美国能源部最近报告指出,与其他室温制冷技术相比,弹热制冷技术具有最大的潜力。其主要来源于循环加载和卸载单轴应力时,形状记忆合金(SMAs)在马氏体相变和逆相变过程中潜热的释放和吸收[2]。相比传统蒸汽压缩技术,弹性热制冷具有无污染、能效高、结构紧凑、运行可靠等优势,克服了制冷剂泄漏和环境污染等问题,展现出巨大潜力。镍钛(NiTi)基SMA5以其优异性能成为弹性热制冷工程的理想材料,其中绝热温变(△Tad)是衡量其制冷性能的关键因素。


  尽管NiTi基合金在弹热制冷领域巨大的潜力,但传统的NiTi基合金研发主要依赖于实验试错法,导致研发周期长、成本高,从而极大地制约了新型高性能材料的开发进程。机器学习已被证明是材料研究和工程实践的一种高效工具[3],为加速新型NiTi基合金的开发过程:文章采用Stacking集成学习方法对NiTi基MASMAS的△Tad进行预测,通过数据驱动的方式实现更快速、可靠的性能评估。

       1相关理论和方法


  1.1 Boruta特征选择算法


  Boruta是一种基于随机森林的包裹式特征选择算法,通过给系统增加更多随机性来处理问题[4]。


  该方法首先对原始特征列进行随机打乱,生成“影子征,并与原始特征合并。在迭代过程中,训练随机森林并计算所有特征的重要性影于特征的最高Zscore作为判断标准高于Zscore的特征标记为保留”显著低于的标记为“剔除”,其余保持“待定”。

       1.2 Stacking集成学习


  Stacking集成学习是一种层次化的模型融合方法,通过多个基学习器报取不同层次的特征信息,并将其组合输入到元学习器中进行最终预测。从而提高模型的泛化能力并降低过拟合风险。相比于单一模型,Stacking集成学习可以减少基学习器的预测偏差,更好地适应复杂数据分布,增强对噪声和异常值的鲁棒性。


  1.3 SHAP解释模型


  SHAP解释模型是近年来被提出的一种解释机器学习甚至深度学习特征作用情况的模型之一其功能包括描绘特征整体贡献率程度及其在各样本中的具体作用情况、特征间的交互作用以及特征依赖关系对属性的联合影响等151。该方法的最大优势是反映每一个样本中的特征影响力,并且能呈现特征对模型输出的正负影响。在SHAP分析模型时,它会构建一个加性的解释模型,将所有特征视为“贡献者”,模型会生成预测值。SHAP值即为每个特征变量的贡献度。


  1.4评价指标


  为了评价所据方法对△Tad的预测效果,采用决定系数(R2),平均绝对误差(MAE)和均方根误差(RMSE)作为评价指标衡量模型的预测能力。如公式(1)、(2)、(3)所示。

  式中:yi表示真实值;yi表示预测值;y表示样本均值,n表示样本数量。


  2 Stacking预测模型构建


  2.1数据准备


  文章收集了43组关于NiTi基的SMAs的绝热温变数据集[6-7],其中包含Ni、Ti及多种掺杂元素(Cu、Al、Fe、Co、V)的含量。由于掺杂元素的含量相较Ni和Ti较小,因此将所有掺杂元素之和作为新特征other。为了准确预测ΔTad,考虑到各元素的特性,因此收集了数据集中13种元素的相关性质,并根据Ni和Ti在合金中的成分比例赋予各元素不同的权重,从而得到26个合金性质特征,最终与Ti、Ni及other共形成29个特征变量[5]。


  2.2特征选择


  为了提升预测模型的准确性和稳定性,文章采用Boruta特征选择算法筛选NiTi基SMAs绝热温变的关键影响因素。经过250次迭代,Boruta算法筛选出的特征重要性排名,如图1所示。

  实验结果表明,有12个特征的重要性显著高于影子特征(shadowMax),被确认为关键特征;12个特征被认定为暂定特征;5个特征的重要性低于shadowMax,被拒绝。


  2.3 Stacking模型构建


  Stacking模型采用两层结构:第一层(基学习器层):包括DT、RF、GBRT和XGBoost。基学习器对输入数据进行学习,并分别输出预测结果。第二层(元学习器层):对基学习器的预测结果进行学习,以获得更精准的最终预测结果。对比LR、RF和GBRT三种模型的性能,选择最优模型作为元学习器。


  Stacking集成学习具体流程:①数据划分:将数据集D按8:2划分为训练集[Dtrain,ytrain]和测试集[Dtest,ytest]。②基学习器训练:选取DT、RF、GBRT、XGBoost,使用5折交叉验证训练,并获取对验证集的预测结果。③生成新的训练特征矩阵:组合各基学习器在交叉验证中的预测结果,形成新的训练特征矩阵new_Dtrain。④新的测试特征矩阵:基学习器在整个Dtrain上训练后对Dtest进行预测,形成new_Dtest。⑤元学习器选择:候选元学习器为LR、RF、GBRT,使用new_Dtrain训练,并对比评价指标,选择最优模型。⑥最终预测:用选定元学习器对new_Dtest进行预测,得到NiTi基合金ΔTad的最终结果。


  3实验结果与分析


  在Stacking训练中,数据集按8:2划分为训练集和测试集。元学习器的训练数据由基学习器在5折交叉验证中对验证集的预测结果组合而成,测试数据由基学习器对测试集的预测结果组合而成。本研究选取DT、RF、GBRT和XGBoost作为基学习器,并评估其在测试集上的MAE、RMSE和R2,结果如图2所示。

  由图2可知,不同基学习器在测试集上的表现差异较大。GBRT最优,R2=0.89,MAE=1.90,RMSE=2.28,拟合与泛化能力最佳。DT次之,XGBoost稍弱,RF最差,R2=0.73,MAE=2.73,RMSE=3.52。总体而言,GBRT在本研究数据集上表现最佳。


  在Stacking模型的第二层,即元学习器层,文章选取线性回归(LR)、RF和GBRT作为候选模型,计算各元学习器在测试集上的MAE、RMSE和R2,结果如图3所示。

  由图3可知,GBRT依然展现出了最优性能,R2最高为0.92,同时MAE(1.78)和RMSE(1.93)最低,表明其能够有效整合基学习器的预测结果,从而进一步提高模型的泛化能力。RF作为元学习器的表现略低于GBRT。LR作为元学习器的表现最差,R2值仅为0.78。综合对比三种元学习器的评价指标,GBRT取得了最佳的预测效果,因此最终选取GBRT作为Stacking的元学习器。


  为了评估Stacking集成学习方法在NiTi基合金绝热温变预测中的性能优势,文章对比了四个基学习器和完整Stacking模型在测试集上的三项指标。各模型在测试集上的评价指标,如表1所示。

dfb0aa3749faf2a5392ed05142b3f177.png

  从表1可知,GBRT表现最佳,但Stacking在所有指标上均优于单一基学习器。与GBRT相比,Stacking降低MAE 6.32%、RMSE 15.35%,R2提高3.37%;相比RF,MAE降低34.79%、RMSE降低45.17%,R2提升26.03%。这表明Stacking集成提升了泛化能力与预测精度。为直观展示其预测效果,绘制了预测值与真实值的对比曲线,如图4所示。

  从图4可以看出,Stacking模型在整体趋势上与真实值较为接近,且误差较小,拟合效果显著。


  SHAP值量化了各特征对预测的贡献,平均绝对SHAP值越大,影响越显著,如图5所示,尽管基学习器预测能力不同,它们在Stacking模型中仍具互补性。RF整体性能较弱,但SHAP值最高,表明其在特定数据点和特征上对元学习器贡献显著,即使单个模型表现一般,仍可在Stacking中提供独特信息,提升泛化能力。

  为探究基学习器对NiTi基合金绝热温变预测的影响,绘制SHAP值分布图,如图6所示。点的左右分布表示对预测结果的正向或负向影响,靠右表示正向影响较强,靠左则相反。结果显示,RF对元学习器贡献最大,预测值对温变影响较大,XGBoost和GBRT表现类似。相比之下,DT的SHAP值分布集中于SHAP基准线附近,表明其预测值对温变影响较小。

  4结论


  本研究提出了基于Stacking模型预测NiTi基合金绝热温变。采用Boruta筛选关键特征,RF、XGBoost、DT、GBRT为基学习器,GBRT为元学习器,并使用SHAP进行模型解释。实验结果显示,测试集R2达0.92,MAE为1.78,RMSE为1.93,验证了模型的准确性。由于文章所用数据集较小,模型在未知数据上的泛化能力有限,未来将宽展数据范围,以提升预测能力并加速NiTi合金开发。

 参考文献


  [1]朱雪洁,钟诗江,杨晓霞,等.NiTi基形状记忆合金弹热效应及其应用研究进展[J].材料工程,2021,49(3):1-13.


  [2]肖飞,陈宏,金学军.形状记忆合金弹热制冷效应的研究现状[J].金属学报,2021,57(1):29-41.


  [3]牛程程,李少波,胡建军,等.机器学习在材料信息学中的应用综述[J].材料导报,2020,34(23):23100-23108.


  [4]赵昱,颜承初,郭霖,等.基于Boruta+PSO-MLP模型的中央空调系统能耗预测[J/OL].太原理工大学学报,1-10[2025-04-29].


  [5]曹玉茹,高洋洋.基于SHAP值惩罚特征的集成分类方法研究[J].统计与决策,2023,39(6):21-26.


  [6]TIAN X,ZHAO Q,ZHANG K,et al.Accelerated design forelas-tocaloric performance in NiTi-based alloys through machine learning[J].Journal of Applied Physics,2022,131(1):015104.


  [7]Imran M,Zhang X.Recent developments on the cyclic stability in elastocaloric materials[J].Materials&Design,2020,195(pre-publish):109030.