中文引用格式: 何毅,廖悦安,刘义良,等. 基于XGBoost的打叶复烤过程参数智能化预测方法[J]. 电子技术应用,2026,52(5):132-140.
英文引用格式: He Yi,Liao Yuean,Liu Yiliang,et al. An intelligent prediction method for tobacco threshing and redrying process parameters based on XGBoost[J]. Application of Electronic Technique,2026,52(5):132-140.
引言
打叶复烤是卷烟工业企业进行原料初挑、模块配方、均匀性提升的重要环节[1],是实现烟叶理化性质调节与品质稳定控制的核心工艺过程,复烤不仅是原料烟进入工业加工前的必要环节,更是保障烟叶感官质量与生产一致性的重要技术手段。复烤包括一润、二润和烤片三个关键的环节[2],每个环节对应不同的技术目标与操作特征:一润阶段通过喷雾加湿和热风预处理,使烟叶吸收均匀水分,增强其柔韧性;二润阶段通过二次加湿与热平衡调控,使烟叶结构趋于稳定并恢复弹性;烤片阶段则通过精确的温湿度控制实现最终脱水与定型,从而改善烟叶的色泽、香气及燃烧性能。
在这些环节中,加水方式[3]、热风温度、相对湿度、蒸汽流量、风速及物料输送速度[4]等关键工艺参数对最终烟叶品质具有直接影响。温度过高可能导致香气成分过度挥发、叶片表面碳化,而湿度控制不当则可能导致烟叶返潮或破碎。由此可见,复烤工艺的核心在于参数的精准调控与各环节间的动态协调。
然而,长期以来,复烤生产过程依赖工艺人员的经验判断进行参数设定和调整。由于烟叶原料来源复杂、批次差异大,且受季节、设备老化、环境湿度等因素影响,人工调节常存在滞后性和主观性,容易导致过程波动与产品不均一。传统工艺参数控制方法多为规则设定或经验模型,缺乏数据反馈与动态优化能力。特别是在高强度连续生产条件下,传统控制策略难以应对烟叶含水率、温度及其他物性指标的随机波动,导致产品质量一致性不足,能耗偏高,生产效率受限。值得注意的是,复烤过程中的环境波动与数据采集精度也对模型预测性能产生显著影响。由于复烤设备运行环境中温湿度存在时变性,传感器在高温高湿条件下易出现测量漂移或延迟,从而导致输入数据的噪声累积与特征失真。此外,烟叶原料的非均质性及批次差异会引入额外的不确定性,使模型在训练阶段学习到的特征分布与实际生产场景存在偏移。当环境扰动或数据采样精度不足时,模型预测结果可能出现波动,进而影响工艺参数调节的实时性与稳定性。因此,在模型设计与训练过程中,必须综合考虑传感信号质量、特征稳健性以及模型对噪声的容忍度,以确保模型在复杂工业环境下仍具备可靠的预测性能。因此,如何实现基于数据驱动的参数自适应优化与智能预测,成为烟草工业智能制造转型的重要突破口。
近年来,国内外针对复烤工艺优化的研究主要集中在工艺参数调控[5]、智能预测[6]和自动控制[7]等方面。传统的优化思路主要依托于基于规则的控制模型或基于物理机理的热传导方程模型。然而,由于烟叶在加热加湿过程中表现出显著的非线性、时变性和耦合性,这类模型往往需要大量实验标定参数,实际应用中精度有限。当前学者已经基于热湿耦合方程构建复烤干燥模型,通过实验确定能量传递系数,用以优化烘丝段能耗,但该模型对原料初始状态极为敏感。还提出了基于模糊逻辑的温湿度控制策略,通过模糊规则推理实现非线性调节,但该方法依然依赖人工设定隶属度函数,缺乏自学习能力。然后建立了以水分扩散系数为核心参数的复烤动力学方程,并利用遗传算法优化模型拟合效果,提高了模型对脱水曲线的拟合度。然而,这类机理模型在多工段、多变量耦合条件下计算复杂度高,难以满足工业实时控制的需求。
随着传感技术、边缘计算与大数据分析技术的发展,基于数据驱动的建模方法逐渐成为复烤工艺优化的主流趋势。研究者开始将机器学习算法引入烟叶加工过程,以提升模型的自适应能力和预测精度。在数据驱动建模方向上,部分学者尝试将机器学习方法应用于复烤过程参数预测中,取得了显著进展。周永长[8]等根据润叶特色工艺数据的特征,建立了反向传播(Back Propagation,BP)神经网络预测模型,使用TensorFlow搭架神经网络结构,优化了神经网络结构中关键参数,提升了测试集的预测结果。王浩[9]等采用Tent混沌映射改进的麻雀搜索算法(Sparrow Search Algorithm,SSA)优化神经网络,提升预测模型的各方面性能。卢沛临[10]等建立了随机森林回归模型,筛选出在梗叶分离参数中影响片烟的多个重要特征参数,训练得到的模型精准度得到有效提升。吴宏[11]等提出了基于主成分分析法和BP神经网络的烟叶含水率预测模型,采用主成分分析法提取复烤烟叶含水率特征因子,获得特征矩阵,然后将特征矩阵输入BP神经网络,构建包括特征矩阵与复烤下机烟叶含水率的预测模型,模型的决定系数达0.92。皋元崚[12]等根据实时数据,构建了基于支持向量机神经网络的烟叶复烤回潮过程预测控制模型,该模型通过训练学习,有效预测二次润叶出口含水率,最大绝对误差不超过0.45%。黄小艳[13]等提出了一种融合决策树算法与正交试验设计的参数优化预测方法。首先基于历史生产数据构建决策树模型,通过特征重要性分析量化工艺参数对出口水分指标的关联度,明确关键参数的影响程度优先级,随后依据权重排序结果构建因素水平表,采用正交试验法系统探究多参数耦合作用规律,通过试验数据对决策树模型进行动态修正,最终获得具有显著稳定性的工艺参数组合,结果表明,优化后的模型预测值与实际生产检测值的平均相对误差控制在5%以内,验证了该方法在参数协同优化方面的有效性。
上述研究在不同程度上推动了复烤工艺智能预测的发展,但仍存在一定局限性。一方面,多数模型在结构上依赖单一算法框架,缺乏对多源异构数据的融合能力,难以捕捉不同工艺参数间的深层关联关系。另一方面,传统神经网络在样本较小或特征维度较高时易出现过拟合,且泛化能力不足。此外,支持向量机与随机森林等算法虽具较好稳定性,但在处理大规模连续生产数据时计算开销大,难以实现实时性预测。综合来看,现有方法在非线性特征提取、鲁棒性、实时响应性方面仍有提升空间。
近年来,集成学习(Ensemble Learning)方法的兴起为工业过程预测提供了新的思路。以XGBoost、LightGBM和CatBoost为代表的梯度提升决策树(GBDT)模型,通过加权迭代与残差修正机制,在建模高维非线性数据时表现出优异的泛化能力和稳定性。彭文灿[22]等人利用XGBoost模型结合多传感器数据融合,建立了烟叶烘烤过程中的状态识别和温度上升时间预测模型,烘烤状态的F1-Score达到98.4%,预测温度上升时间的平均绝对误差为0.541。王文才[23]等人提出基于图神经网络(CGTNN)的烟叶干燥过程预测方法,通过相关性分析和时空特征提取,显著提升了模型可解释性和预测精度。Xing[24]等人构建的堆叠集成学习模型可以实现更高的预测准确性和更好的泛化性能(R2train=0.990,R2test=0.989)。王文博[25]等人将NGBoost与特征重要性分析结合,识别出影响卷烟水分异常的关键变量(如工艺参数和环境湿度),模型在异常风险识别中表现出较强的鲁棒性和解释性,预测精度提升至 77.8%。这些研究表明,集成学习和深度学习方法在烟草工业过程优化中具有显著优势,为复烤工艺的智能化控制提供了重要参考。
相比之下,XGBoost算法在复烤工艺参数预测中的潜力更为突出。它在传统梯度提升算法基础上引入二阶导数信息与正则化项,有效控制模型复杂度并防止过拟合。通过并行化计算与缓存优化,XGBoost 在大规模工业数据处理上具有显著的时间优势。此外,其内置的特征重要性评估机制可直观反映各输入变量对目标输出的影响程度,兼顾模型精度与可解释性,非常契合复烤工艺中多参数多指标的耦合关系建模需求。
综上所述,虽然已有研究在复烤工艺智能预测方面取得了丰富成果,但仍存在以下不足:其一,现有研究多数聚焦于单一阶段的优化,缺乏对一润、二润、烤片之间耦合关系的整体建模;其二,缺乏对实时波动环境下模型鲁棒性的系统评估;其三,部分研究忽视特征工程与模型调参的重要性,导致泛化能力受限。针对这些问题,本文基于XGBoost算法构建烟草复烤工艺参数智能预测模型,以实现复烤关键参数的精准预测与稳定控制。
本文首先从工艺机理出发,系统分析复烤过程的主要环节及影响因素,设计适用于工业现场的数据采集体系与特征提取方法。其次,通过参数网格搜索与特征选择策略,对 XGBoost 模型进行超参数优化,以平衡模型复杂度与预测精度。最后,通过实验验证模型性能,并与传统方法和其他机器学习模型进行对比分析。实验结果表明,该模型在测试集上的预测精度超过95%,在独立验证集上可达 99%,预测误差显著低于其他算法。研究结果表明,XGBoost模型能够有效捕捉烟叶复烤过程中多维参数间的非线性关系,实现关键工艺参数的精准预测与动态响应。该方法为烟草工业过程的智能化、数字化与绿色化生产提供了技术支撑,同时也为传统工业过程优化提供了可推广的参考框架。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000007083
作者信息:
何毅,廖悦安,刘义良,普轶
(红云红河烟草(集团)有限责任公司 红河卷烟厂,云南 昆明 650202)

