我國鋼鐵工業(yè)是國民經(jīng)濟的重要基礎(chǔ)產(chǎn)業(yè),是國家經(jīng)濟建設(shè)的中流砥柱,是建設(shè)現(xiàn)代化強國的重要支撐。鋼鐵工業(yè)歷經(jīng)起步時期、加速時期、高速時期和全面發(fā)展時期,目前進入周期性調(diào)整階段,呈現(xiàn)“三高三低”的復(fù)雜局面,表現(xiàn)為高產(chǎn)出、高成本與高排放并存,同時遭遇低需求、低價格和低效率的挑戰(zhàn),面臨著階段性供需矛盾加大、行業(yè)利潤下降等困難。傳統(tǒng)的生產(chǎn)管理和調(diào)度方法已難以滿足當(dāng)前高效、低碳生產(chǎn)的需求,為鋼鐵行業(yè)的智能化轉(zhuǎn)型帶來了新的機遇和挑戰(zhàn)。鋼鐵流程行業(yè)亟需通過提高生產(chǎn)質(zhì)量、降低生產(chǎn)成本、提升生產(chǎn)效率,來應(yīng)對復(fù)雜的生產(chǎn)與管理挑戰(zhàn)。
鋼鐵行業(yè)正處于產(chǎn)業(yè)轉(zhuǎn)型的關(guān)鍵階段,以大模型為代表的新一代人工智能(AI)技術(shù)已成為推動產(chǎn)業(yè)變革和行業(yè)轉(zhuǎn)型的核心動力。面對科技的飛速進步,我國制定了差異化的發(fā)展戰(zhàn)略,著重發(fā)展行業(yè)垂直領(lǐng)域的工業(yè)大模型,以實現(xiàn)精準(zhǔn)賦能,提升行業(yè)競爭力。由于工業(yè)領(lǐng)域場景具有專業(yè)化、多元化、碎片化的明顯特征,依靠單一的基礎(chǔ)大模型并不能很好適應(yīng)各類工業(yè)領(lǐng)域需求,因此需要打造鋼鐵行業(yè)大模型及平臺,深入理解并精準(zhǔn)服務(wù)于行業(yè)獨特需求。
人工智能技術(shù)在鋼鐵領(lǐng)域的應(yīng)用面臨諸多挑戰(zhàn),難以充分滿足行業(yè)的復(fù)雜需求,主要體現(xiàn)以下三個方面:
一是缺乏賦能鋼鐵行業(yè)的體系化方法。目前業(yè)內(nèi)對于人工智能技術(shù)的應(yīng)用都還是零星點狀的,在以人工智能的全局視角策劃鋼鐵行業(yè)轉(zhuǎn)型升級路徑方面缺少體系化的方法和模式,亟需探索如何加強人工智能與鋼鐵行業(yè)的深度融合,以人工智能技術(shù)重構(gòu)業(yè)務(wù)內(nèi)涵,實現(xiàn)全新業(yè)務(wù)形態(tài)與模式,推動鋼鐵行業(yè)的整體轉(zhuǎn)型和升級。
二是高質(zhì)量工業(yè)領(lǐng)域語料庫匱乏。工業(yè)數(shù)據(jù)規(guī)模量大,但普遍質(zhì)量水平較低,大規(guī)模多源異構(gòu)數(shù)據(jù)融合問題以及數(shù)據(jù)孤島問題仍難以克服,無法滿足行業(yè)大模型訓(xùn)練要求。工業(yè)數(shù)據(jù)產(chǎn)業(yè)服務(wù)生態(tài)的建設(shè)不完善,工業(yè)知識、工業(yè)數(shù)據(jù)的語料化缺少專業(yè)的方法論和技術(shù)工具,工業(yè)數(shù)據(jù)確權(quán)、治理、標(biāo)注、合成、質(zhì)量評估、隱私保護等相關(guān)標(biāo)準(zhǔn)不足。數(shù)據(jù)專業(yè)人才緊缺,特別是具備行業(yè)不同業(yè)務(wù)領(lǐng)域?qū)I(yè)知識的語料標(biāo)注人員欠缺。
三是解決方案工程化能力薄弱。人工智能大模型工業(yè)化應(yīng)用需要解決適用性、工程化、規(guī)模化的問題,需解決與現(xiàn)有系統(tǒng)統(tǒng)籌考慮整體架構(gòu)與功能設(shè)計,解決系統(tǒng)、數(shù)據(jù)、功能集成,以及訓(xùn)練、推理一體化問題,解決規(guī)模化應(yīng)用推廣等問題。
綜上所述,為了鋼鐵行業(yè)的應(yīng)用和發(fā)展需求,將大模型真正融入鋼鐵行業(yè)流程中,亟需研究行業(yè)大模型建設(shè)模式,研發(fā)適用于鋼鐵行業(yè)的大模型及平臺。本文基于中國寶武的數(shù)智化轉(zhuǎn)型實踐,從一體化解決方案的角度,提出了鋼鐵行業(yè)大模型平臺構(gòu)建的總體架構(gòu),并研究了鋼鐵行業(yè)大模型平臺建設(shè)所需的十大關(guān)鍵技術(shù)以及在生產(chǎn)制造和經(jīng)營管理的典型應(yīng)用場景,最后對鋼鐵行業(yè)大模型的發(fā)展進行了展望。
1 總體架構(gòu)和建設(shè)思路
鋼鐵行業(yè)大模型,專門針對鋼鐵行業(yè)特點和需求,融合了機器學(xué)習(xí)、深度學(xué)習(xí)等先進人工智能算法,旨在處理鋼鐵行業(yè)中的復(fù)雜任務(wù)和海量數(shù)據(jù),為鋼鐵生產(chǎn)、管理、決策等環(huán)節(jié)提供智能化支持。通過將大模型服務(wù)融入現(xiàn)有的工業(yè)互聯(lián)網(wǎng)平臺,構(gòu)建鋼鐵行業(yè)大模型平臺,實現(xiàn)從單點應(yīng)用、局部優(yōu)化到業(yè)務(wù)貫通和協(xié)同發(fā)展的智能化升級,打造高效率、低成本、綠色化的工業(yè)智能解決方案,可以在更廣泛的工業(yè)場景發(fā)揮作用,提升人工智能應(yīng)用的普及率,極大促進智能化升級進程。
1.1 總體架構(gòu)
鋼鐵行業(yè)大模型平臺,基于通用模型(包括語言、視覺等)及專用模型(包括預(yù)測、決策等),融合鋼鐵知識庫、語料庫、樣本庫,互聯(lián)企業(yè)各類應(yīng)用系統(tǒng),匯聚工業(yè)大數(shù)據(jù),形成算力、數(shù)據(jù)、算法一體化管理以及中心訓(xùn)練、邊緣推理、場景應(yīng)用一站式閉環(huán)的綜合性人工智能平臺。鋼鐵行業(yè)大模型平臺整體架構(gòu)如圖 1 所示。

圖 1 鋼鐵行業(yè)大模型平臺整體架構(gòu)
其中,數(shù)智基座實現(xiàn)了“五個統(tǒng)一”,即統(tǒng)一算力資源、統(tǒng)一數(shù)據(jù)治理、統(tǒng)一模型管理、統(tǒng)一模型評價、統(tǒng)一發(fā)布部署,對算力、數(shù)據(jù)和模型進行高效整合與管理。在算力方面,建立起兼容異構(gòu)算力資源的管理和調(diào)度體系,能夠充分調(diào)動不同類型的計算資源,滿足大模型訓(xùn)練和推理的多樣化需求,為模型的高效運行提供了有力的支撐。
在模型層面,形成“M0 基礎(chǔ)模型 - M1 垂類模型 - M2 領(lǐng)域模型”的分層架構(gòu)體系。
基礎(chǔ)模型層(M0):該層集成社會成熟基模,整合自然語言處理、視覺識別等通用 AI 技術(shù),為整個模型體系提供基礎(chǔ)能力。通過對海量通用數(shù)據(jù)的學(xué)習(xí),M0 層具備了強大的跨領(lǐng)域知識理解和處理能力,為上層模型提供了廣泛的知識儲備和技術(shù)支撐。
垂類模型層(M1):基于鋼鐵行業(yè)的專業(yè)知識、專業(yè)數(shù)據(jù)以及企業(yè)內(nèi)部豐富的業(yè)務(wù)數(shù)據(jù),訓(xùn)練出適用于鋼鐵生產(chǎn)各個環(huán)節(jié)的通用和專用模型。這些模型深度融合了鋼鐵行業(yè)的工藝特點、生產(chǎn)流程和管理需求,能夠精準(zhǔn)地處理鋼鐵行業(yè)中的復(fù)雜任務(wù),為鋼鐵生產(chǎn)提供專業(yè)的智能化支持。
領(lǐng)域模型層(M2):針對冶金、軋制、制造管理、經(jīng)營管理等具體生產(chǎn)和管理環(huán)節(jié)的獨特需求,開發(fā)定制化解決方案。通過將 M1 層的垂類模型與實際應(yīng)用場景緊密結(jié)合,實現(xiàn)對各個業(yè)務(wù)環(huán)節(jié)的精細化管理和優(yōu)化。例如,在軋制環(huán)節(jié),根據(jù) M1 層模型提供的工藝參數(shù)預(yù)測和質(zhì)量控制模型,實現(xiàn)對軋制過程的精準(zhǔn)控制,提高產(chǎn)品質(zhì)量和生產(chǎn)效率;在企業(yè)管理環(huán)節(jié),利用相關(guān)模型進行數(shù)據(jù)分析和決策支持,優(yōu)化企業(yè)資源配置,提升企業(yè)的整體運營效率。另外,鋼鐵行業(yè)大模型平臺提供統(tǒng)一 AI 門戶及智能體開發(fā)平臺的 MaaS 模型服務(wù),為各類 AI 應(yīng)用的開發(fā)與部署提供了便捷的途徑,開發(fā)者可以快速構(gòu)建和部署個性化的 AI 應(yīng)用,進一步拓展了鋼鐵行業(yè)大模型在不同場景下的應(yīng)用范圍。
1.2 建設(shè)思路
依托于現(xiàn)有的技術(shù)積累,建設(shè) “五位一體”的綜合能力體系,通過通專融合(通用模型和專業(yè)模型)、業(yè)技融合(行業(yè)知識和 AI 技術(shù))、數(shù)實融合(數(shù)字技術(shù)和實體制造)“三融合一”,支持鋼鐵行業(yè)人工智能應(yīng)用場景需求,促進人工智能更高水平應(yīng)用,推動鋼鐵產(chǎn)業(yè)智能化創(chuàng)新與發(fā)展。總體建設(shè)思路如圖 2 所示。
1.2.1 “五位一體”
通過對平臺、數(shù)據(jù)、算力、模型、場景五要素的系統(tǒng)性建設(shè),在數(shù)智基座、模型研發(fā)和場景應(yīng)用等方面提供全方位的支撐,形成一體化、集成化人工智能+鋼鐵解決方案,大幅降低鋼鐵行業(yè)模型研發(fā)門檻與成本,讓人工智能技術(shù)更好融入行業(yè)。
1.2.2 “三融合一”
通專融合:鋼鐵行業(yè)大模型將通用模型與專業(yè)模型相結(jié)合,使得模型不僅具備廣泛的適用性,還能夠針對鋼鐵行業(yè)的特定需求進行深度定制,使得大模型能夠更好地適應(yīng)行業(yè)特點,提高解決方案的有效性。
業(yè)技融合:鋼鐵行業(yè)大模型通過整合行業(yè)知識和 AI 技術(shù),實現(xiàn)了業(yè)務(wù)需求與技術(shù)能力的深度結(jié)合,不僅提升大模型的技術(shù)含量,也使得模型能夠更好地服務(wù)于業(yè)務(wù)發(fā)展,推動鋼鐵行業(yè)的智能化轉(zhuǎn)型。
數(shù)實融合:鋼鐵行業(yè)大模型通過數(shù)字技術(shù)與實體制造的結(jié)合,實現(xiàn)了數(shù)據(jù)驅(qū)動的智能制造。鋼鐵企業(yè)能夠利用大模型進行生產(chǎn)流程優(yōu)化、資源配置優(yōu)化和能源消耗降低,從而提高生產(chǎn)效率和降低成本。

圖 2 建設(shè)思路
1.2.3 “分層構(gòu)建”行業(yè)垂類大模型
采用 M0 基礎(chǔ)模型層、M1 垂類模型層和 M2 領(lǐng)域模型層的分層架構(gòu),基礎(chǔ)模型提供通用智能,行業(yè)垂類模型提供專業(yè)洞察,領(lǐng)域場景模型提供定制解決方案,三者協(xié)同、逐層優(yōu)化模型性能,將通用大模型與鋼鐵行業(yè)數(shù)據(jù)充分融合,有效解決通用大模型不懂行業(yè)的問題,推動場景落地。
1.2.4 行業(yè)高質(zhì)量語料庫構(gòu)建
研究行業(yè)高質(zhì)量語料庫構(gòu)建技術(shù),研發(fā)語料工具鏈,制定相關(guān)標(biāo)準(zhǔn)和規(guī)范,示范構(gòu)建涵蓋鋼鐵行業(yè)多個領(lǐng)域的萬億規(guī)模多模態(tài)高質(zhì)量語料庫,為模型訓(xùn)練和應(yīng)用提供示范模式。
1.2.5 “1+X”場景支撐
通過“1 套鋼鐵行業(yè)大模型平臺”,全面支撐“X 個人工智能應(yīng)用場景”,用于企業(yè)智慧制造、智慧治理、智慧服務(wù)等主題場景,以及高爐大模型、轉(zhuǎn)爐大模型、配煤配礦大模型、云表檢大模型、研發(fā)設(shè)計大模型等領(lǐng)域模型,為鋼鐵企業(yè)提供一體化、集成化的人工智能+鋼鐵解決方案。
2 技術(shù)路線
核心技術(shù)以自主可控為原則,圍繞人工智能、機器學(xué)習(xí)、人機交互、云計算、邊緣計算等多個技術(shù)前沿方向,研究訓(xùn)練-推理-場景一體化的智能化架構(gòu)技術(shù)、行業(yè)大模型分層構(gòu)建技術(shù)、行業(yè)高質(zhì)量語料庫構(gòu)建技術(shù)、大規(guī)模異構(gòu)算力集約化調(diào)度技術(shù)、面向通用場景預(yù)測模型構(gòu)建技術(shù)、面向多目標(biāo)復(fù)雜場景的決策模型構(gòu)建及動態(tài)優(yōu)化技術(shù)、端-邊-云協(xié)同的實時智能控制模型構(gòu)建技術(shù)、基于人/物/業(yè)務(wù)相聯(lián)接的混合增強智能技術(shù)、基于智能體的人機交互技術(shù)、模型即服務(wù)(MaaS)模式及實現(xiàn)技術(shù)等十項關(guān)鍵技術(shù),如圖 3 所示。

圖 3 關(guān)鍵技術(shù)
2.1 “訓(xùn)練-推理-場景”一體化的智能化架構(gòu)技術(shù)
消費類大模型用于工業(yè)側(cè),普遍會存在數(shù)據(jù)和場景的復(fù)雜度、能力可用性、技術(shù)成熟度、結(jié)果可靠性等難點,需要提高人工智能系統(tǒng)的整體效率、靈活性和實用性,使模型能夠更快速、準(zhǔn)確地適應(yīng)不同的應(yīng)用場景,解決適用性、工程化、規(guī)模化的問題。通過打通基礎(chǔ)平臺、AI 技術(shù)與業(yè)務(wù)應(yīng)用的分層協(xié)同鏈路,建立通用模型與專業(yè)模型的協(xié)同進化機制,形成覆蓋“訓(xùn)練-推理-場景落地”全鏈條的智能化架構(gòu)(如圖 4 所示),為超大型企業(yè)智能化轉(zhuǎn)型提供可量化的技術(shù)實現(xiàn)路徑。

圖4 智能化架構(gòu)技術(shù)
架構(gòu)體系通過全生命周期管理機制,實現(xiàn)工業(yè) AI 模型從創(chuàng)建、訓(xùn)練到評估、部署、監(jiān)控、優(yōu)化的全流程數(shù)字化管控,使模型研發(fā)效率、運行效果與運營質(zhì)量可量化、可追溯、可優(yōu)化。
云邊一體技術(shù)的深度融合,既滿足云端資源集約化訓(xùn)練的效率需求,又能通過邊緣計算實現(xiàn)生產(chǎn)現(xiàn)場的低延遲響應(yīng)與數(shù)據(jù)閉環(huán),確保工業(yè)現(xiàn)場高效穩(wěn)定。模型分層分類構(gòu)建技術(shù)則通過行業(yè)知識解耦與特征工程標(biāo)準(zhǔn)化,降低工業(yè)領(lǐng)域模型研發(fā)門檻,同時建立以生產(chǎn)效率提升、質(zhì)量成本優(yōu)化為核心的價值導(dǎo)向評價體系,推動模型泛化能力與場景適配性的雙向提升。
該智能化框架通過知識沉淀機制將工藝經(jīng)驗、操作規(guī)范轉(zhuǎn)化為可復(fù)用的模型資產(chǎn),使大模型能力與行業(yè)特性深度融合,形成 “數(shù)據(jù)積累 - 模型優(yōu)化 - 場景迭代” 的良性循環(huán),推動工業(yè) AI 從單點試驗走向系統(tǒng)級生產(chǎn)力變革,為流程型制造業(yè)的智能化轉(zhuǎn)型提供標(biāo)準(zhǔn)化技術(shù)底座。
2.2 行業(yè)垂類大模型分層構(gòu)建技術(shù)
鋼鐵行業(yè)面臨提高生產(chǎn)效率、降低生產(chǎn)成本、提升產(chǎn)品質(zhì)量和保障生產(chǎn)安全的重大需求。在此背景下需要通過數(shù)智技術(shù)創(chuàng)新,幫助鋼鐵企業(yè)突破困境。傳統(tǒng)人工智能技術(shù)面臨算法精度低、模型開發(fā)周期長、人工標(biāo)注工作量大、場景碎片化等問題,導(dǎo)致算法通用性差,模型難以批量生產(chǎn)。通用大模型技術(shù)的誕生,雖然能解決通用場景下,傳統(tǒng)人工智能應(yīng)用的問題,但離工業(yè)場景的落地還存在較大距離。因此需要研究大模型分層構(gòu)建技術(shù)(如圖 5 所示),使工業(yè)人工智能模型開發(fā)從“作坊式”走向“工業(yè)化”范式。

圖 5 模型分層構(gòu)建體系
語言模型方面,構(gòu)建“M1 鋼鐵語言模型”,解決通用模型鋼鐵領(lǐng)域知識學(xué)習(xí)不足問題,提升模型在鋼鐵領(lǐng)域的知識理解以及指令遵從的準(zhǔn)確性,同時具備跨基座模型遷移的通用性。基于海量鋼鐵及通用知識,融合高爐、煉鋼等鋼鐵語料,進行持續(xù)預(yù)訓(xùn)練,增強行業(yè)基礎(chǔ)知識理解能力;基于應(yīng)用場景實際交互數(shù)據(jù)以及問答語料,進行監(jiān)督微調(diào),增強行業(yè)指令追隨能力;構(gòu)建綜合鋼鐵知識、場景能力以及通用能力的垂類模型測評技術(shù)。
視覺模型方面,基于國內(nèi)開源生態(tài),采用 Transformer 模型結(jié)構(gòu),通過“基礎(chǔ)-行業(yè)-場景”三級遞進式架構(gòu),逐層優(yōu)化模型性能,實現(xiàn)鋼鐵生產(chǎn)視覺數(shù)據(jù)的全鏈條高效處理。通過自監(jiān)督學(xué)習(xí)、對比學(xué)習(xí)等無監(jiān)督技術(shù)從海量未標(biāo)注數(shù)據(jù)中萃取通用特征,借助模型蒸餾技術(shù)完成教師模型到學(xué)生模型的知識遷移,在保障模型性能的同時實現(xiàn)輕量化部署。該架構(gòu)不僅構(gòu)建了自動化工作流以降低開發(fā)門檻、減少專業(yè)人員依賴,更通過行業(yè)經(jīng)驗沉淀逐步建立標(biāo)準(zhǔn)化體系,助力生產(chǎn)質(zhì)量監(jiān)控、安全生產(chǎn)管理、物流管理等核心場景的智能化改造。
2.3 行業(yè)高質(zhì)量語料庫構(gòu)建技術(shù)
可以依托企業(yè)大數(shù)據(jù)中心建設(shè)進行擴展,針對鋼鐵行業(yè)垂類大模型訓(xùn)練和相關(guān)智能體應(yīng)用所需要的高質(zhì)量、多樣性語料的需求,構(gòu)建了 IT/OT 等結(jié)構(gòu)化數(shù)據(jù)之外,文本、圖像、語音、視頻等非結(jié)構(gòu)化數(shù)據(jù)的管理、嵌入、審核、標(biāo)注等機制,實現(xiàn)完整的從源數(shù)據(jù)采集、清洗加工到高質(zhì)量語料入庫的全新語料庫構(gòu)建模式。同時,研發(fā)融合了語料庫、知識圖譜、向量數(shù)據(jù)庫的,面向大模型應(yīng)用開發(fā)用戶的語料訪問、加工、訓(xùn)練等應(yīng)用接口,形成涵蓋軟件研發(fā)、財務(wù)經(jīng)營、生產(chǎn)制造等業(yè)務(wù)領(lǐng)域的鋼鐵知識庫、語料庫、樣本庫。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)