了解金山云最新資訊
2026-01-27 00:00:00
過(guò)去一年,如果僅從“算力需求增長(zhǎng)”來(lái)理解中國(guó)智算產(chǎn)業(yè)的變化,顯然是不夠的。
在 2026 年 1 月 21 日舉辦的金山云年度 Tech Talk 上,金山云對(duì)其過(guò)去一年智算業(yè)務(wù)的演進(jìn)進(jìn)行了系統(tǒng)性回顧。從公開(kāi)財(cái)報(bào)數(shù)據(jù)到客戶側(cè)真實(shí)使用情況,這些信息拼湊出了一幅更清晰的圖景:智算需求并非簡(jiǎn)單放量,而是在訓(xùn)練、推理、應(yīng)用形態(tài)和工程方式等多個(gè)層面同時(shí)發(fā)生結(jié)構(gòu)性變化。
這場(chǎng)變化的核心,不再只是“誰(shuí)擁有更大規(guī)模算力”,而是圍繞模型如何被使用、Token 如何被消耗、算力如何被組織展開(kāi)。
變化首先體現(xiàn)在財(cái)務(wù)數(shù)據(jù)上。
根據(jù)金山云披露的公開(kāi)財(cái)報(bào),其智算云業(yè)務(wù)在過(guò)去一年實(shí)現(xiàn)了高速增長(zhǎng)。以 2025 年第三季度為例,智算云賬單收入達(dá)到 7.8 億元人民幣,同比增長(zhǎng)接近 120%。這一數(shù)據(jù)并非孤立,而是延續(xù)了此前多個(gè)季度的增長(zhǎng)趨勢(shì),顯示智算已成為金山云收入結(jié)構(gòu)中的重要組成部分。
金山云高級(jí)副總裁劉濤在分享中提到了金山云對(duì)這一趨勢(shì)的判斷:智算需求的增長(zhǎng)重心,正在從訓(xùn)練側(cè)逐步向推理側(cè)轉(zhuǎn)移。
從訓(xùn)練視角看,過(guò)去幾年國(guó)內(nèi)智算需求的主要推動(dòng)力,來(lái)自少數(shù)對(duì)算力高度敏感的行業(yè)。
自動(dòng)駕駛與具身智能,是其中最典型的代表。這些行業(yè)往往需要長(zhǎng)期訓(xùn)練模型,并處理視頻、點(diǎn)云、傳感器等海量多模態(tài)數(shù)據(jù)。在早期階段,它們對(duì)算力的需求更多集中在訓(xùn)練規(guī)模本身。
但與通用大模型不同,這類行業(yè)模型并不一味追求參數(shù)規(guī)模最大化。劉濤在分享中指出,自動(dòng)駕駛和具身智能模型在訓(xùn)練階段,對(duì)算力密度的要求并不極端,但對(duì)顯存容量和數(shù)據(jù)處理能力要求更高。
這意味著,它們對(duì)算力平臺(tái)的訴求,正在從“算力數(shù)量”轉(zhuǎn)向“系統(tǒng)能力”——包括數(shù)據(jù)接入、預(yù)處理、多模態(tài)調(diào)度以及訓(xùn)練全流程的工程化效率。
推理側(cè)的變化更加顯著。
如果說(shuō)訓(xùn)練側(cè)的變化仍然是漸進(jìn)的,那么推理側(cè)的變化則更為直接和激烈。
一個(gè)被反復(fù)引用的數(shù)據(jù),來(lái)自火山引擎在其公開(kāi)發(fā)布會(huì)上的披露:平臺(tái)每日 Token 調(diào)用量已達(dá)到 50 萬(wàn)億級(jí)別。這是當(dāng)前國(guó)內(nèi)少數(shù)被明確對(duì)外公布的 Token 規(guī)模數(shù)據(jù)之一,也成為行業(yè)理解推理負(fù)載的重要參考。
與此同時(shí),多個(gè)面向大眾或企業(yè)的模型產(chǎn)品正在持續(xù)擴(kuò)大推理需求。例如豆包、通義千問(wèn)以及近期加大投入的騰訊元寶,都在不同程度上推動(dòng) Token 消耗快速增長(zhǎng)。
這些產(chǎn)品并不完全運(yùn)行在同一云平臺(tái)上,但它們共同指向一個(gè)事實(shí):推理階段正在成為智算需求增長(zhǎng)的主要來(lái)源,且這種增長(zhǎng)具備明顯的外溢性。
在所有推理場(chǎng)景中,編程類應(yīng)用被反復(fù)強(qiáng)調(diào)。
劉濤指出,2025 年一個(gè)尤為顯著的變化在于:編程相關(guān)請(qǐng)求正在成為 Token 消耗的主力場(chǎng)景之一。這一判斷并非孤立,而是與海外模型使用結(jié)構(gòu)的統(tǒng)計(jì)結(jié)果高度一致。
“Vibe Coding”成為一個(gè)關(guān)鍵詞。一個(gè)廣為流傳的事實(shí)是,Claude Code 的大量代碼本身,正是由 Claude Code 參與生成的。這意味著模型不再只是輔助工具,而是深度介入軟件生產(chǎn)過(guò)程。
從全球 Token 調(diào)用結(jié)構(gòu)來(lái)看,編程類請(qǐng)求在多家模型服務(wù)商中長(zhǎng)期占據(jù)超高比例。金山云也觀察到了同樣的趨勢(shì):代碼生成、重構(gòu)和理解能力的提升,正在顯著改變程序員的工作方式,并直接放大推理側(cè)算力需求。
在具體應(yīng)用層面,互聯(lián)網(wǎng)客戶仍然是智算需求的重要來(lái)源,但其需求形態(tài)已經(jīng)發(fā)生變化。劉濤提到,當(dāng)前互聯(lián)網(wǎng)場(chǎng)景呈現(xiàn)出三個(gè)明顯特征:
其一,多模態(tài)需求顯著增長(zhǎng)。視頻生成、視頻理解以及復(fù)雜推理任務(wù),帶動(dòng)了訓(xùn)練與推理負(fù)載的持續(xù)上升;
其二,模型參數(shù)規(guī)模不再單向膨脹,而是圍繞具體任務(wù)進(jìn)行結(jié)構(gòu)性調(diào)整;
其三,Vibe Coding 在頭部互聯(lián)網(wǎng)公司中已較為普及,使用更強(qiáng)的商用模型進(jìn)行代碼開(kāi)發(fā),正在成為常態(tài)。
這些變化意味著,互聯(lián)網(wǎng)客戶對(duì)智算平臺(tái)的期待,已經(jīng)從“算力服務(wù)”升級(jí)為對(duì)模型生命周期管理和工程體系的整體依賴。
為了滿足更多元化的需求,劉濤表示,2025 年,智算平臺(tái)金山云星流已完成從資源管理平臺(tái)向一站式 AI 訓(xùn)推全流程平臺(tái)的戰(zhàn)略升級(jí)。從訓(xùn)推平臺(tái)、機(jī)器人平臺(tái)到模型 API 服務(wù),升級(jí)后的金山云星流平臺(tái)構(gòu)建了從異構(gòu)資源調(diào)度、訓(xùn)練任務(wù)故障自愈到機(jī)器人行業(yè)應(yīng)用支撐、模型 API 服務(wù)商業(yè)化落地的全鏈路閉環(huán)。
盡管各行各業(yè)大規(guī)模應(yīng)用 AI 還處于早期探索階段,但定位行業(yè)助力者的金山云,多年來(lái)持續(xù)打磨全棧 AI 能力。從 2023 年的智算網(wǎng)基礎(chǔ)設(shè)施,到 2024 年智算云的平臺(tái)化和 Serverless 化,再到 2025 年的一站式 AI 訓(xùn)推全流程平臺(tái),通過(guò)提升平臺(tái)效率、突破行業(yè)邊界、加速推理布局,金山云為迎接 AI 應(yīng)用爆發(fā)做好了充分準(zhǔn)備。
在平臺(tái)效率方面,金山云星流訓(xùn)推平臺(tái)提供從模型開(kāi)發(fā)、訓(xùn)練到推理的完整生命周期管理,具備開(kāi)發(fā)、訓(xùn)練、推理和數(shù)據(jù)處理四大模塊能力,通過(guò)降低多模塊協(xié)同復(fù)雜度,能實(shí)現(xiàn)“開(kāi)箱即用”的 AI 開(kāi)發(fā)體驗(yàn)。自研的 GPU 故障自愈技術(shù)結(jié)合任務(wù)可觀測(cè)性設(shè)計(jì),可實(shí)時(shí)監(jiān)控硬件健康狀態(tài)與任務(wù)進(jìn)程,自動(dòng)觸發(fā)故障遷移與任務(wù)重調(diào)度,降低算力中斷風(fēng)險(xiǎn),保障長(zhǎng)周期訓(xùn)練任務(wù)穩(wěn)定運(yùn)行。
作為面向機(jī)器人開(kāi)發(fā)與落地的全鏈路云原生平臺(tái),金山云星流機(jī)器人平臺(tái)深度融合數(shù)據(jù)采集、存儲(chǔ)、標(biāo)注、模型開(kāi)發(fā)、訓(xùn)練、部署與仿真等核心環(huán)節(jié),打造具身場(chǎng)景專屬的數(shù)據(jù)、模型、仿真一體化引擎。平臺(tái)率先實(shí)現(xiàn)具身智能數(shù)據(jù)工程領(lǐng)域采集、標(biāo)注、管理的全鏈路閉環(huán),可高效服務(wù)具身智能行業(yè)模型訓(xùn)練、仿真應(yīng)用場(chǎng)景分析等核心需求,助力客戶快速完成從算法研發(fā)到真實(shí)場(chǎng)景部署的全流程落地,最終推動(dòng)機(jī)器人產(chǎn)業(yè)的智能化升級(jí)。
面向大模型應(yīng)用開(kāi)發(fā)者和企業(yè)用戶,金山云星流平臺(tái)模型 API 服務(wù)提供高可用、易集成的模型調(diào)用與管理能力,覆蓋模型調(diào)用的全生命周期。該服務(wù)支持高并發(fā)推理與多模型管理,能夠幫助用戶高效接入多種模型資源,助力大模型應(yīng)用落地。目前,金山云星流平臺(tái)模型 API 服務(wù)已積累諸多行業(yè)客戶。
同時(shí),金山云星流平臺(tái)的模型生態(tài)也在持續(xù)豐富。目前,平臺(tái)已支持近 40 種不同模型,包括 DeepSeek、Xiaomi MiMo、Qwen3、Kimi 等??蛻敉ㄟ^(guò)一站式訪問(wèn),即可高效接入多種模型,在暢享穩(wěn)定高效云服務(wù)的同時(shí),更加聚焦 AI 業(yè)務(wù)創(chuàng)新和價(jià)值創(chuàng)造。