2026-04-08 21:23:33
當前,AI Agent能力很大程度上依賴于基礎大模型能力的提升,基礎大模型提供核心能力,而Agent通過系統化設計將這些能力轉化為實際應用價值,國產基礎大模型正在強化Agent能力。
每經記者|葉曉丹 每經編輯|楊軍
近期,國產大模型動作頻頻。
4月2日,阿里發(fā)布千問新一代大語言模型Qwen3.6-Plus。4月8日,DeepSeek(深度求索)上線專家模式,這是DeepSeek走紅以來首次在產品端引入模式分層設計,此前3月份,DeepSeek釋放了和Agent(智能體)相關多個崗位的招聘需求。
《每日經濟新聞》記者注意到,不論是阿里千問還是DeepSeek大模型,都在強化基礎大模型Agent的能力。2026年初,以OpenClaw(一款開源人工智能體框架,俗稱“龍蝦”)為代表的“龍蝦熱”火爆國內外,如果說2025年還是“千模混戰(zhàn)”,2026年AI(人工智能)主戰(zhàn)場已全面轉向智能體,Agent 對Token(詞元)的消耗正以百倍、千倍速度狂飆。
IDC(國際數據公司)中國研究總監(jiān)盧言霞向《每日經濟新聞》記者表示,強化Agent能力是基礎大模型2026年的重要發(fā)展方向,可能包括深度研究、智能辦公、AI代碼助手等通用場景。
中科院計算所客座博士生導師、中國計算機學會數字金融分會常務執(zhí)委白碩在接受《每日經濟新聞》記者采訪時表示,隨著AI應用爆發(fā),對基礎大模型Agent能力,未來將更重視在Harness Engineering(直譯為駕馭工程)領域的提升。據了解,Harness Engineering是一個不強調模型性能,更強調工程環(huán)境,通過讓“駕馭模型的系統環(huán)境”更專業(yè)而提升使用效果的范式。
有“龍蝦之父”之稱的OpenClaw創(chuàng)始人彼得·斯坦伯格(Peter Steinberger)近日在社交平臺宣稱,下一代OpenClaw智能體產品將迎來兩大核心升級——全新融入AI視頻生成能力,并成為全球首個官方適配阿里千問大模型的智能體框架。
4月2日,阿里發(fā)布千問新一代大語言模型Qwen3.6-Plus,其中最引人注目的是,新模型顯著增強了模型的智能體編程能力。在代碼智能體領域以及通用智能體與工具使用方面,新模型表現突出。
4月4日,OpenRouter官方數據顯示,Qwen3.6-Plus的日調用量突破1.4萬億Token。
Agent對Token的消耗正以前所未有的速度激增。國家數據局局長劉烈宏披露了一組數據,到今年3月,我國日均詞元調用量已超過140萬億,相比2024年初的1000億增長1000多倍,相比2025年底的100萬億,3個月時間又增長40%多。
在英偉達GTC開發(fā)者大會上,黃仁勛給出了一個極具沖擊力的定義:Token是AI時代的新大宗商品,是新貨幣,也是衡量企業(yè)競爭力的核心標尺。
而OpenClaw這類Agent產品徹底改變了AI交互形態(tài),使其能落地完成復雜任務,也讓Token需求迎來爆發(fā)式增長。
不只是阿里千問基礎大模型強化了Agent能力,DeepSeek通用大模型自2025年以來也強化了Agent能力。
《每日經濟新聞》記者注意到,在DeepSeek官網上,3月24日發(fā)布的一系列招聘崗位中,有不少和Agent相關的崗位。譬如Agent全棧開發(fā)工程師、Agent深度學習算法研究員、Agent數據策略工程師等。
2025年12月,DeepSeek更新V3.2正式版,就強調其新模型強化Agent能力,融入思考推理。在這個版本的模型中,DeepSeek提出了一種大規(guī)模Agent訓練數據合成方法,構造了大量“難解答,易驗證”的強化學習任務(“1800+”環(huán)境,“85000+”復雜指令),大幅提高了模型的泛化能力。
當前,AI Agent(人工智能體)能力很大程度上依賴于基礎大模型能力的提升,基礎大模型提供核心能力,而Agent通過系統化設計將這些能力轉化為實際應用價值,國產基礎大模型正在強化Agent能力。
橫向對比來看,不論是千問大模型還是DeepSeek,均實現支持高達1M Tokens(100萬個詞元)上下文長度,大模型在長文檔、多輪對話信息提取上更精準。
盧言霞認為,當前基礎大模型競爭的關鍵是編程能力、智能體能力等。強化Agent能力是基礎大模型2026年的重要發(fā)展方向,可能包括深度研究、智能辦公、AI代碼助手等通用場景。
在AI應用端,浙江華通云數據科技有限公司副總裁林建龍在接受《每日經濟新聞》記者采訪時坦言,當前AI Agent仍面臨一些問題。譬如大多數AI系統仍然停留在“工具”“技能”層面,無法真正成為企業(yè)的“數字化員工”。傳統工作流編排和簡單對話系統雖然能夠完成一些預定義的任務,但缺乏深度理解業(yè)務場景、獨立思考和持續(xù)學習的能力,難以滿足企業(yè)復雜多變的業(yè)務需求。
林建龍表示,未來的AI Agent不是簡單的工具,而是一個基于大模型之上的各個行業(yè)領域專家。這種專家Agent具備以下核心特征:第一,具備深厚的行業(yè)專業(yè)知識,能夠理解并處理復雜的業(yè)務問題;第二,能夠深度融入企業(yè)業(yè)務流程,與現有系統無縫對接;第三,具備持續(xù)學習和自我優(yōu)化能力,能夠在實踐中不斷提升;第四,能夠獨立完成特定任務,而不僅僅是提供建議或答案。
4月8日,DeepSeek上線的專家模式就提到,專家模式具備領域深度增強、多步推理可視化、引用溯源強化、自定義專家組合、長上下文壓縮優(yōu)化等特點。專家模式沿用了 R1的長思維鏈推理能力,但針對專業(yè)領域做了定向蒸餾和微調,使“快思考”與“慢思考”在領域內更平衡。
林建龍也強調了未來“專家 Agent”理念的實現,需要系統化和工程化的方法。他表示,當前華通云正圍繞底座模型、數據管理、提示詞工程、長期記憶等核心技術要素,構建了一套完整的AI Agent開發(fā)框架。
其中底座模型提供基礎的認知和推理能力,數據管理完成對企業(yè)數據的鏈接和交互,提示詞工程負責將業(yè)務需求轉化為模型可理解的任務指令,MCP Tools(用于與外部系統進行交互的工具集或協議)提供與外部系統交互的能力,Skills(技能)封裝了特定領域的專業(yè)技能,長期記憶機制則使Agent能夠在多輪交互中積累經驗、實現智能的個性化服務。
封面圖片來源:每經媒資庫
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP