【導(dǎo)讀】隨著DeepSeek、通義千問(Qwen)等高性價比大語言模型的普及及本地部署的深化,數(shù)據(jù)隱私、主權(quán)、安全性等核心需求成為中國企業(yè)布局AI的重中之重。Gartner調(diào)研顯示,2025年中國企業(yè)在生成式AI及AI領(lǐng)域的技術(shù)投資將大幅增長,預(yù)計到2028年,多數(shù)大型企業(yè)將建立完善的大語言模型部署治理框架。大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署面臨諸多挑戰(zhàn),尤其中國企業(yè)偏向本地部署的特點對I&O團隊提出更高要求。基于此,本文圍繞企業(yè)如何成功實現(xiàn)大語言模型生產(chǎn)部署,從部署戰(zhàn)略、治理流程、跨團隊協(xié)作三個核心維度,梳理關(guān)鍵舉措與實施方向,為企業(yè)落地相關(guān)技術(shù)提供參考。
Gartner預(yù)測,到2028年,中國70%的大型企業(yè)將為大語言模型在AI基礎(chǔ)設(shè)施上的部署建立完善的治理框架,而2025年這一比例不足10%。
然而,要成功實現(xiàn)大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署并非易事,需要制定復(fù)雜的技術(shù)、運維和治理戰(zhàn)略,以確保模型達到性能指標(例如GPU算力利用率),同時保障數(shù)據(jù)安全與合規(guī)。
中國企業(yè)與全球企業(yè)的一個關(guān)鍵區(qū)別在于,其更傾向于在本地AI基礎(chǔ)設(shè)施環(huán)境中部署大語言模型,這對I&O團隊提出了更高要求,需要他們對重要AI基礎(chǔ)設(shè)施技術(shù)棧有更深入的理解。AI基礎(chǔ)設(shè)施是指AI應(yīng)用構(gòu)建、測試、訓(xùn)練與部署所需的最新、最先進的硬軟件技術(shù)棧。
為了在新的AI基礎(chǔ)設(shè)施上成功實現(xiàn)大語言模型的生產(chǎn)部署,企業(yè)應(yīng)從以下三個方面著手:構(gòu)建全面的生產(chǎn)發(fā)布策略;制定健全的治理框架;并加強與法律、安全、AI、數(shù)據(jù)團隊及生態(tài)伙伴的緊密協(xié)作。這些舉措為大語言模型在生產(chǎn)環(huán)境中的高效運行提供了堅實的保障。
構(gòu)建全面的部署戰(zhàn)略
隨著企業(yè)開始在AI基礎(chǔ)設(shè)施上部署大語言模型,I&O領(lǐng)導(dǎo)者所面臨的壓力日益增大,需要幫助AI開發(fā)人員和工程師在全企業(yè)范圍內(nèi)以更快的速度、更大的規(guī)模來推進AI項目的開發(fā)和部署。與此同時,針對不同用戶和應(yīng)用場景不斷涌現(xiàn)的各種AI工具和服務(wù),顯著增加了評估與選擇的難度和復(fù)雜性。此外,傳統(tǒng)的生產(chǎn)發(fā)布策略與流程已無法有效支持大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署需求。因此,I&O領(lǐng)導(dǎo)者亟需制定完善的生產(chǎn)發(fā)布戰(zhàn)略,以保障部署工作的順利進行。
然而,要為大語言模型在AI基礎(chǔ)設(shè)施上的部署構(gòu)建一套穩(wěn)健的戰(zhàn)略,就需要從整體視角出發(fā),包括適配AI基礎(chǔ)設(shè)施環(huán)境、為特定場景設(shè)計架構(gòu)、實施技術(shù)優(yōu)化以及確保符合監(jiān)管框架要求。中國的I&O領(lǐng)導(dǎo)者應(yīng):
使部署策略與企業(yè)數(shù)字化轉(zhuǎn)型戰(zhàn)略保持一致
按照使用場景構(gòu)建多層次部署架構(gòu)以優(yōu)化性能
優(yōu)化模型與推理以提升效率
使用云原生技術(shù)實現(xiàn)靈活調(diào)度
加強合規(guī)并強化安全管理
建立全鏈路監(jiān)控與成本控制機制
制定穩(wěn)健的部署治理流程
大語言模型已經(jīng)從研究原型轉(zhuǎn)變?yōu)槎喾N任務(wù)的關(guān)鍵核心組件,包括客戶支持AI智能體、法律文檔摘要、代碼生成或測試工具、企業(yè)級代理型AI用例以及多模態(tài)應(yīng)用等領(lǐng)域。然而,大語言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署需要解決如下幾個固有挑戰(zhàn):
資源密集
非確定性行為與提示敏感
延遲與吞吐限制
安全與隱私
因此,為了成功將大語言模型部署到AI基礎(chǔ)設(shè)施的生產(chǎn)環(huán)境中,中國的I&O部門必須建立一套穩(wěn)健的治理流程,采取切實可行的步驟促進資源管理、持續(xù)監(jiān)控以及敏捷更新。比如:
提前規(guī)劃并進行試點
確定產(chǎn)品部署位置
建立高效的資源管理
在大語言模型生產(chǎn)發(fā)布流程中嵌入安全治理與提示治理
管理版本并執(zhí)行A/B測試
采用持續(xù)集成/持續(xù)交付流程
實施生產(chǎn)監(jiān)控
促進關(guān)鍵利益相關(guān)方之間的緊密協(xié)作
部署大語言模型十分復(fù)雜,要求業(yè)務(wù)、法務(wù)、安全以及AI與數(shù)據(jù)團隊以協(xié)同一致的方式共同工作。過去各自獨立的部門如今必須從大語言模型項目的啟動階段就開展合作,以確保技術(shù)開發(fā)能夠反映法律和安全方面的考量。建立跨職能的AI治理委員會至關(guān)重要,成員應(yīng)包括法務(wù)、安全、數(shù)據(jù)工程與數(shù)據(jù)科學(xué)、產(chǎn)品管理、軟件開發(fā)以及高管層的代表。
總結(jié)
從Gartner的預(yù)測來看,完善大語言模型部署的治理框架、提升部署效能,將成為未來幾年中國大型企業(yè)AI基礎(chǔ)設(shè)施建設(shè)的重點。然而,部署工作的復(fù)雜性要求企業(yè)不能孤立推進,需立足整體視角,構(gòu)建與數(shù)字化轉(zhuǎn)型戰(zhàn)略匹配的全面部署戰(zhàn)略,建立覆蓋資源、安全、監(jiān)控的穩(wěn)健治理流程,同時打破部門壁壘,推動關(guān)鍵利益相關(guān)方協(xié)同發(fā)力。






