随着计算机技术的蓬勃发展,AI及大模型在钢铁工业的应用成为推动产业智能化转型的关键力量。主要针对大模型在钢铁工业的应用展开,首先,总结工业大模型的构建方式及典型应用领域;其次,阐述钢铁工业的特点,总结钢铁工业大模型的相关技术;最后,对于大模型的应用场景展开讨论,突出大模型在钢铁生产流程上的典型应用场景,如感知类任务及认知类任务突破。未来钢铁工业有望将大模型深度应用于新产品、新体系开发,以及提供综合决策支持,实现对钢铁企业的能源、原料调度及钢铁全流程监测等应用,推动钢铁工业实现高端化、智能化、绿色化发展,提供数字化发展的新思路。
随着材料科学研究进入第四范式 ,人工智能技术正重塑该领域的研究 。 当前 , 大语言模型(large language models ,LLMs) 凭借其海量数据训练基础和超大规模参数优势 ,通过多任务集成 、智能生成与决策等能力 , 突破了传统机器学习在文本处理和人机交互方面的技术瓶颈 , 为钢铁工业的智能化转型提供了新的突破路径 。本篇综述系统梳理了大语言模型的技术特点 、研究方向及应用领域 ,结合钢铁行业的数据特性 ,详细阐述了面向钢铁行业的大语言模型框架 ,并提出了钢铁行业大语言模型的评估标准 。针对钢铁领域的特定需求 ,深入探讨了其在数据提取与保护 、性能建模与预测 、材料逆向设计及钢铁智能冶炼等方面的应用潜力 。最后 ,对钢铁行业大语言模型的发展现状进行全面分析 , 明确指出其可能面临的挑战 ,并提出相应的应对策略 。
随着DeepSeek等通用大语言模型的快速发展,工业领域的研究重心正逐步从基础模型探索转向其在垂直场景的深度应用。以转炉炼钢过程为典型研究对象,系统梳理了语言模型、视觉模型及时序模型等工业大模型的技术演进脉络,并提出面向转炉炼钢的多模态大模型架构设计的初步设想。该架构通过融合文献资料、火焰视频、烟气成分与铁水成分等多源异构数据,探索复杂炉况发现、终点动态预测及过程实时控制等关键技术路径,旨在突破传统方法在高温复杂反应解析、多变量耦合预测及实时决策优化等方面的瓶颈。在此基础上,本文进一步分析冶金大模型在应用过程中面临的挑战与应对策略,并对其未来发展方向进行探讨,为冶金工业智能化转型提供支撑。
在智能化浪潮席卷全球的当下,钢铁行业正面临着转型升级的迫切需求。数据作为新时代的核心生产要素,其价值挖掘与利用对钢铁行业的生产效率提升、产品质量管控、推动数字化发展等具有重要意义,虽然钢铁行业数据资源丰富,但正面临数据价值释放的深层困境。针对钢铁行业大模型技术应用与发展过程中面临的“数据不够用、数据不好用”等共性问题,设计了一套满足大模型数据需求的数据引擎,基于时序大模型的数据增强技术、工艺机理的数据时空对齐技术、知识图谱跨工序数据关联三项技术,建立以物料为对象的孪生数据资产壳文件,将冶金生产流程语义知识与生产过程时序数据结合,为行业大模型提供产品全生命周期语料信息,满足大模型训练与应用中对语义数据的需求。同时,利用工作流模式将传统数据治理离线模式转为在线模式,以某钢厂连铸生产线数据为试点,批次内数据异常率降低至0.02%~0.5%,取得较好的实验结果,助力钢铁企业数字化转型。
钢铁行业作为国民经济的重要支柱,面临高成本、低效率、工艺复杂等挑战,亟需通过智能化转型突破发展瓶颈。大模型技术凭借其跨模态理解、多场景泛化能力,为钢铁行业提供了数据价值深度挖掘与生产流程优化的新路径。提出了“五位一体”的钢铁行业大模型平台总体建设框架,并详细阐述了构建适应行业需求的大模型平台所需的十项关键技术。通过平台、算力、数据、模型、场景的深度协同,融合通用模型与钢铁行业知识,形成一体化、集成化的人工智能+钢铁解决方案,大幅降低钢铁行业模型研发门槛与成本,让人工智能技术更好融入行业。最后,结合钢铁行业的业务特点与实际探索经验,对应用场景进行了展望。
在新型工业化背景下,数字化与智能化转型已成为钢铁行业突破效率瓶颈、实现高质量发展的核心路径。与此同时,大模型作为近几年蓬勃发展的人工智能技术,在各行各业正在取得显著的成效。因此,如何使用通用大模型加速钢铁行业智能化转型成了一个重要的研究和应用方向。重点探索了三种构建钢铁领域大模型的主流方法:一是领域持续预训练方法,利用钢铁领域专业语料持续预训练以提升模型对专业知识的理解;二是场景任务监督微调方法,利用专业领域内的具体任务数据对模型进行监督训练,提升模型在领域任务上的表现;三是知识蒸馏方法,借助强的教师模型从钢铁领域语料中蒸馏出知识提供给小的学生模型训练,提升模型对专业知识的记忆。最后通过构建的钢铁知识评估集来评测这三种方法的优缺点。基于对三种方法的系统分析与综合比较,本研究为钢铁行业及其他垂直领域构建专用大模型提供了实践指导与方法论参考,助力产业智能化升级。
高炉透气性指数作为反应炉况稳定性和操作顺行的关键指标,其精准预测对及时识别并预防炉况异常具有重要意义。提出一种基于生成式时序大模型的高炉透气性指数预测方法。首先使用箱型图方法对数据中的异常点进行识别与修正,其次,提出一种基于随机森林的Boruta和沙普利可加特征解释(shapley additive explanations,SHAP)融合的算法对透气性指数进行特征选择。最后,设计生成式时序(time series generation-GPT,TSG-GPT)大模型实现对高炉透气性指数预测。通过使用实际生产数据对该模型进行训练、验证和测试,结果表明所提出的模型能够准确地预测透气性指数。
随着钢铁制造业数字化转型深入推进,智能化质量管理已成为提升企业核心竞争力的关键环节之一。针对钢铁企业产品质量缺陷分析流程,提出一种基于检索增强大模型的质量缺陷分析系统架构。系统采用模块化设计,构建案例知识库,实现语义向量召回与置信度重排序相结合的双阶段知识检索增强架构,设计局部因果抽取和全局因果聚合的分层信息抽取聚合机制,实现了相似案例匹配与跨案例知识协同推理,同时嵌入可解释性支持与动态知识更新机制,确保分析结果的可靠性与系统的长期有效性。该系统已在某钢铁企业部署运行,有效提高了产品质量缺陷处理流程的效率,为大模型在工业产品质量管理领域的应用提供了成功案例。
大语言模型 (large language models,LLMs)近年来在自然语言处理领域取得突破性进展,其强大的语义理解和推理能力推动了众多传统行业的智能化与数字化转型。然而,现有的大模型在钢铁冶金等传统制造行业中,仍缺少系统化、专业化的能力评估基准。提出了首个面向钢铁冶金领域的中文评测数据集 (steel-iron benchmark,StiBench),用于系统评估主流开源大模型的领域能力表现。StiBench通过开源文库爬取、光学字符识别等方法整合大量行业技术、工艺说明、职业考试等数据,并通过语义相似度检测进行题目查重,最终形成由2000余道单选、多选、判断题组成的、涵盖炼铁、炼钢、轧制、冶金物理化学、热处理与表面工程等知识点的评测数据。实验选取百川、GLM (general language model)、通义千问等开源大模型进行少样本及零样本测试,并设计分类式与生成式评测方式,全面评估大模型在专业知识理解方面的性能。实验结果表明,大模型在钢铁冶金领域的专业语义理解能力上仍有较大的提升空间。研究结果为钢铁冶金领域的大模型能力评估提供了系统性测试基准,未来可为行业大模型研发应用提供重要参考依据。
针对传统吹氩控制中人工调控主观偏差大和透气性衰减的问题,分析了钢液面暴露区域的动态特征与氩气搅拌强度的关系,研究了一种基于机器视觉的氩气强度间接量化方法。该方法通过实时捕捉钢液面动态特征,采用人工智能大模型技术计算液面暴露率(surface exposure ratio, SER),并根据实时SER与理想SER的关系建立吹氩自动控制策略,实现了氩气流量的精准调节。研究结果表明,该方法克服了传统流量预设和人工调整的局限性,有效提升了搅拌强度的控制精度,并在实际VD精炼生产系统中进行了应用验证,证明了其工业可行性和工程推广价值,为精炼过程的智能化升级提供了可工程化落地的解决方案。
针对钢铁一体化调度中铁包、钢包、炼钢、加热炉、板坯库、热轧匹配及天车协同等环节面临的工序耦合、资源约束、动态扰动与目标冲突等核心难题,现有基于预定义规则与决策算法的智能体在复杂规则理解与动态应变上有一定局限。提出并验证了一种基于大语言模型(large language models,LLM)的分层式混合多智能体架构。该架构的核心优势在于有效结合LLM的高级推理能力与传统智能体的执行效率,弥补传统智能体适应能力、规划能力和学习能力的不足,从而显著增强了系统应对复杂规则和动态环境的能力。通过应用LLM赋予系统自主理解业务需求、自动使用模型上下文协议 (model context protocol, MCP)调用工具集生成调度决策并进行自然语言解释的能力。这种方法不仅优化了人机交互,更提升了系统的场景适应性与可扩展性。本研究为构建具备理解需求、适应变化的下一代钢铁智能调度系统提供了关键技术思路,有望加速智能体在调度系统的落地应用。
钢铁行业领域标准建设作为产业转型的关键支撑,对于推动产业高质量发展和提升竞争力具有重要意义。为提升钢铁行业标准知识的查询效率和使用准确性,促进标准实施与技术创新的深度融合,开展了基于检索增强生成(retrieval-augmented generation,RAG)技术的智能问答平台开发研究。本研究选取60份具有代表性的钢铁行业标准作为基础数据源,运用DeepSeek-R1模型对标准文本进行解析和知识抽取,构建了钢铁行业标准知识图谱,为智能问答提供结构化的知识支撑。在LangChain开发环境下,设计并实现了GraphRAG和LightRAG两种不同架构的问答系统方案,并从查询精度、回答范围全面性、技术解析深度等多个维度进行了系统性能评估。研究结果表明,两种问答系统在不同评估指标上各有优劣。GraphRAG系统在处理复杂知识查询和关联推理时表现出色,能够提供更具深度和全面性的回答;而LightRAG系统则在查询响应速度和简单问题处理上具有一定优势。本研究开发的智能问答平台有效提升了钢铁行业标准知识的查询效率和使用准确性,为行业标准的实施和技术创新提供了有力的工具支持。未来,可进一步优化知识图谱构建和问答系统架构,结合更多领域数据和先进技术,推动钢铁行业智能化发展。
金属材料检测认证是确保材料质量的关键环节,涉及复杂的标准体系和多样化的检测需求。传统人工生成检测工单的方式因标准数量庞大、内容复杂及相互引用关系密集,存在效率低、易出错的问题。提出一种基于多步推理的大语言模型智能体框架,结合思维链(chain-of-thought, CoT)技术与检索增强生成(retrieval-augmented generation, RAG)技术,完成从产品信息输入到结构化工单输出的自动化全流程。实验结果表明,该方法显著提升了工单生成的准确性与效率,为材料检测认证的智能化提供了有效支持。
钢铁工业是世界上大多数工业化国家的支柱产业,与国民经济紧密相关。随着新一代人工智能、工业大模型技术的蓬勃发展,数据驱动软测量建模领域的研究已逐渐成为钢铁工业的重要驱动力。轧钢是钢铁工业的主要工艺之一,探索钢材化学成分及其轧制过程工艺参数与最终产品机械性能间的关系,对于深入理解材料科学乃至开发新型材料极为重要。屈服强度(yield strength, YS)和抗拉强度(tensile strength, TS)是衡量轧钢机械性能的关键指标。为实现这两大关键性能指标的精准软测量,提出了一种基于离线强化学习(reinforcement learning, RL)的连续动作空间建模框架,用于实现轧钢机械性能软测量模型的预训练。首先,将轧钢过程从原料、制造到产出进行了马尔可夫决策过程(markov decision process, MDP)建模。随后,结合演员-评论家与深度神经网络,通过学习一个确定性策略来优化连续动作的选择,增强训练稳定性,提高模型对不同钢种的泛化能力。在某钢厂的两种钢种轧钢数据上进行验证实验,结果表明,使用该方法训练的软测量模型相较于门控循环单元(gate recurrent unit, GRU)、深度信念网络(deep belief network, DBN)等算法相比具有更高的软测量精度。