要聞

強化Agent能力，為何成為國產基礎大模型2026年重要發(fā)展方向？

2026-04-08 21:23:33

當前，AI Agent能力很大程度上依賴于基礎大模型能力的提升，基礎大模型提供核心能力，而Agent通過系統化設計將這些能力轉化為實際應用價值，國產基礎大模型正在強化Agent能力。

每經記者｜葉曉丹每經編輯｜楊軍

近期，國產大模型動作頻頻。

4月2日，阿里發(fā)布千問新一代大語言模型Qwen3.6-Plus。4月8日，DeepSeek（深度求索）上線專家模式，這是DeepSeek走紅以來首次在產品端引入模式分層設計，此前3月份，DeepSeek釋放了和Agent（智能體）相關多個崗位的招聘需求。

《每日經濟新聞》記者注意到，不論是阿里千問還是DeepSeek大模型，都在強化基礎大模型Agent的能力。2026年初，以OpenClaw（一款開源人工智能體框架，俗稱“龍蝦”）為代表的“龍蝦熱”火爆國內外，如果說2025年還是“千模混戰(zhàn)”，2026年AI（人工智能）主戰(zhàn)場已全面轉向智能體，Agent 對Token（詞元）的消耗正以百倍、千倍速度狂飆。

IDC（國際數據公司）中國研究總監(jiān)盧言霞向《每日經濟新聞》記者表示，強化Agent能力是基礎大模型2026年的重要發(fā)展方向，可能包括深度研究、智能辦公、AI代碼助手等通用場景。

中科院計算所客座博士生導師、中國計算機學會數字金融分會常務執(zhí)委白碩在接受《每日經濟新聞》記者采訪時表示，隨著AI應用爆發(fā)，對基礎大模型Agent能力，未來將更重視在Harness Engineering（直譯為駕馭工程）領域的提升。據了解，Harness Engineering是一個不強調模型性能，更強調工程環(huán)境，通過讓“駕馭模型的系統環(huán)境”更專業(yè)而提升使用效果的范式。

下一代OpenClaw將支持視頻生成

有“龍蝦之父”之稱的OpenClaw創(chuàng)始人彼得·斯坦伯格（Peter Steinberger）近日在社交平臺宣稱，下一代OpenClaw智能體產品將迎來兩大核心升級——全新融入AI視頻生成能力，并成為全球首個官方適配阿里千問大模型的智能體框架。

4月2日，阿里發(fā)布千問新一代大語言模型Qwen3.6-Plus，其中最引人注目的是，新模型顯著增強了模型的智能體編程能力。在代碼智能體領域以及通用智能體與工具使用方面，新模型表現突出。

4月4日，OpenRouter官方數據顯示，Qwen3.6-Plus的日調用量突破1.4萬億Token。

Agent對Token的消耗正以前所未有的速度激增。國家數據局局長劉烈宏披露了一組數據，到今年3月，我國日均詞元調用量已超過140萬億，相比2024年初的1000億增長1000多倍，相比2025年底的100萬億，3個月時間又增長40%多。

在英偉達GTC開發(fā)者大會上，黃仁勛給出了一個極具沖擊力的定義：Token是AI時代的新大宗商品，是新貨幣，也是衡量企業(yè)競爭力的核心標尺。

而OpenClaw這類Agent產品徹底改變了AI交互形態(tài)，使其能落地完成復雜任務，也讓Token需求迎來爆發(fā)式增長。

不只是阿里千問基礎大模型強化了Agent能力，DeepSeek通用大模型自2025年以來也強化了Agent能力。

《每日經濟新聞》記者注意到，在DeepSeek官網上，3月24日發(fā)布的一系列招聘崗位中，有不少和Agent相關的崗位。譬如Agent全棧開發(fā)工程師、Agent深度學習算法研究員、Agent數據策略工程師等。

2025年12月，DeepSeek更新V3.2正式版，就強調其新模型強化Agent能力，融入思考推理。在這個版本的模型中，DeepSeek提出了一種大規(guī)模Agent訓練數據合成方法，構造了大量“難解答，易驗證”的強化學習任務（“1800+”環(huán)境，“85000+”復雜指令），大幅提高了模型的泛化能力。

專家模式具備領域深度增強等特點

當前，AI Agent（人工智能體）能力很大程度上依賴于基礎大模型能力的提升，基礎大模型提供核心能力，而Agent通過系統化設計將這些能力轉化為實際應用價值，國產基礎大模型正在強化Agent能力。

橫向對比來看，不論是千問大模型還是DeepSeek，均實現支持高達1M Tokens（100萬個詞元）上下文長度，大模型在長文檔、多輪對話信息提取上更精準。

盧言霞認為，當前基礎大模型競爭的關鍵是編程能力、智能體能力等。強化Agent能力是基礎大模型2026年的重要發(fā)展方向，可能包括深度研究、智能辦公、AI代碼助手等通用場景。

在AI應用端，浙江華通云數據科技有限公司副總裁林建龍在接受《每日經濟新聞》記者采訪時坦言，當前AI Agent仍面臨一些問題。譬如大多數AI系統仍然停留在“工具”“技能”層面，無法真正成為企業(yè)的“數字化員工”。傳統工作流編排和簡單對話系統雖然能夠完成一些預定義的任務，但缺乏深度理解業(yè)務場景、獨立思考和持續(xù)學習的能力，難以滿足企業(yè)復雜多變的業(yè)務需求。

林建龍表示，未來的AI Agent不是簡單的工具，而是一個基于大模型之上的各個行業(yè)領域專家。這種專家Agent具備以下核心特征：第一，具備深厚的行業(yè)專業(yè)知識，能夠理解并處理復雜的業(yè)務問題；第二，能夠深度融入企業(yè)業(yè)務流程，與現有系統無縫對接；第三，具備持續(xù)學習和自我優(yōu)化能力，能夠在實踐中不斷提升；第四，能夠獨立完成特定任務，而不僅僅是提供建議或答案。

4月8日，DeepSeek上線的專家模式就提到，專家模式具備領域深度增強、多步推理可視化、引用溯源強化、自定義專家組合、長上下文壓縮優(yōu)化等特點。專家模式沿用了 R1的長思維鏈推理能力，但針對專業(yè)領域做了定向蒸餾和微調，使“快思考”與“慢思考”在領域內更平衡。

林建龍也強調了未來“專家 Agent”理念的實現，需要系統化和工程化的方法。他表示，當前華通云正圍繞底座模型、數據管理、提示詞工程、長期記憶等核心技術要素，構建了一套完整的AI Agent開發(fā)框架。

其中底座模型提供基礎的認知和推理能力，數據管理完成對企業(yè)數據的鏈接和交互，提示詞工程負責將業(yè)務需求轉化為模型可理解的任務指令，MCP Tools（用于與外部系統進行交互的工具集或協議）提供與外部系統交互的能力，Skills（技能）封裝了特定領域的專業(yè)技能，長期記憶機制則使Agent能夠在多輪交互中積累經驗、實現智能的個性化服務。

封面圖片來源：每經媒資庫

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

上一篇文章

成都重大產業(yè)化項目密集落地為“十五五”開局注入強勁動能

返回每經網首頁

下一篇文章

南非蘭特兌美元上漲3.2%，創(chuàng)2017年以來最大漲幅