每日經濟新聞 2026-02-13 08:22:29
每經記者|朱成祥 每經編輯|金冥羽 陳旭
記者|朱成祥
編輯|金冥羽?陳旭?杜波?校對|許紹航
當下,AI大模型正處于從生成式AI走向代理式AI的關鍵時刻。在此背景下,騰訊、阿里等廠商不惜大發紅包以爭奪用戶。
在大模型廠商紅包大戰尚未分出勝負之際,算力租賃廠商卻成為當下實實在在的贏家。正如服飾品牌李維斯的故事那般,最終贏家不是在加州挖金子的礦工,而是賣牛仔褲的李維斯。在這一輪大模型紅包大戰中,算力租賃賺得盆滿缽滿。
2月11日,云計算服務商優刻得發布漲價公告。在被問及具體哪些產品漲價時,優刻得相關工作人員告訴《每日經濟新聞》記者(以下簡稱每經記者),“全線產品(都會上漲),具體會根據客戶資源使用情況給出方案。”
值得一提的是,宣布漲價后,優刻得昨日股價高開高走,收漲20%。
2015年除夕,微信支付憑借搖一搖搶紅包,迅速爆發。而這一波,騰訊元寶發紅包之后,阿里巴巴、百度、字節跳動也紛紛下場。
紅包大戰,也使得對AI基礎設施的需求大增。
近日,國內云服務廠商優刻得宣布,因全球供應鏈波動持續加劇,核心硬件采購等基礎設施成本出現顯著、結構性的上漲,經過慎重評估,公司決定自2026年3月1日起,對續簽及新簽用戶的全線產品與服務進行價格上浮調整。
漲價緣由是硬件成本提升,還是推理側需求過于旺盛而導致供不應求?優刻得上述工作人員回復稱:“兩方面(原因)都有,主要是硬件成本上升,近期需求也在增加。當前的價格調整,也是行業從‘資源出租’向‘能力服務’轉變的體現。”
不僅僅是國內廠商在漲價。1月23日,全球云計算巨頭亞馬遜云科技宣布對其面向大模型訓練的EC2機器學習容量塊實施約15%的價格上調,這是AWS(亞馬遜云計算服務)約20年來首次打破“只降不漲”的定價傳統。機器學習容量塊是AWS為應對高性能GPU(圖形處理器)等稀缺計算資源供需失衡所推出的定制化服務模式,用戶可提前預訂指定型號的GPU實例,確保關鍵算力資源的穩定供給。
開源證券認為,AWS作為亞馬遜核心的公有云平臺,此次漲價一方面再次確認了全球AI算力需求端的高景氣度,另一方面從供給角度來看,AI云產業鏈資源稀缺性或日益凸顯。
對于公有云漲價,云服務商派歐云(PPIO)工作人員告訴每經記者,主要原因是推理需求的爆發式增長,其中Agent(智能體)的需求是主要增長因素;其次推理成本的上漲動力還來自服務質量的持續提高,高SLA(服務等級協議)、低時延、長上下文、多模態等服務會產生支付溢價。
如果說紅包大戰帶來的是用戶人數增加從而帶來算力需求提升,那么Agent的盛行,對推理算力需求的提升則更為龐大。
優刻得上述工作人員表示:“算力需求已從訓練驅動的單一模式,轉變為訓練+推理雙輪驅動且推理占比不斷上升的新模式。Agent的實時交互、多輪推理、工具調用與自主規劃等能力,使得單次任務所需的推理次數呈指數級上升。”
PPIO工作人員也對每經記者表示:“Agent的廣泛應用放大了Token(詞元)的消耗,進而推高算力需求,一方面Agent推理上下文逐漸增加到200K以上,另一方面由于計算復雜度與上下文長度是平方關系,長上下文對算力的需求呈指數級增長。據我們估算,Agent場景下單用戶的Token消耗量是普通Chat的10倍至50倍,此外Agent對內存的需求也在持續增加,主要體現在Agent工具的數據記憶需求。”
值得注意的是,AI推理不僅有云端,也有邊緣側、端側設備。那么,即時性的要求是否會助推邊緣側、端側AI推理需求增長?
對此,PPIO工作人員表示:“至于邊緣和端側,我認為會增加部署,但會是“云—邊—端協同”的混合架構:實時性強、隱私要求高、網絡不穩定的場景會下沉到端和邊緣,用小模型或本地推理保證響應;而需要最強通用能力、快速迭代的大模型能力,仍會集中在云端。關鍵不在把所有算力搬到端上,而在把任務鏈路切分得更合理。”
優刻得工作人員也表示:“我們會根據客戶的需求來部署我們的產品和資源。根據不同業務場景對延遲、成本、合規性的差異化要求,靈活調度云端、邊緣與端側算力資源。”
封面圖片來源:視覺中國
|每日經濟新聞 ?nbdnews? 原創文章|
未經許可禁止轉載、摘編、復制及鏡像等使用
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP