国产精品国产三级农村av,亚洲精品久久久久久久久久,久久精品欧美一区二区三区不卡,精品久久www,精品久久久久久一区二区,国产精品一区在线免费观看,超碰色偷偷

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

AI手機路線大分野:當豆包試圖“接管屏幕”,蘋果和谷歌為何選擇“慢半拍”?

2025-12-20 13:40:33

繼聯合中興努比亞發布“豆包手機”nubia M153后,12月19日,字節跳動推進與多家硬件廠商的AI手機合作。在以“豆包手機”為代表的GUI陣營試圖接管屏幕的時候,反觀海外,蘋果、谷歌主導的陣營堅持API標準化路線,雖穩健卻進展遲緩。兩種技術路線的博弈,是移動互聯網十余年商業邏輯與利益格局的劇烈碰撞,也將深度改寫手機廠商、應用開發者與用戶的關系。

每經記者|高涵    每經編輯|王嘉琦    

AI手機的技術路線已形成鮮明分野。

12月19日,字節跳動在聯合中興努比亞推出“豆包手機”nubia M153后再傳擴圍動作——正與vivo、聯想、傳音等廠商推進AI手機合作。

以“豆包手機”為代表的陣營,憑借讀屏、模擬點擊等GUI(圖形用戶界面)技術,試圖讓AI助手突破應用壁壘完成復雜任務,卻引發主流App集體“自衛”。

反觀海外,蘋果、谷歌主導的陣營,則堅持API(應用程序接口)標準化路線,雖穩健卻進展遲緩。

兩種技術路線的博弈,是移動互聯網十余年商業邏輯與利益格局的劇烈碰撞。流量入口遷移的序幕已然拉開,手機廠商、應用開發者與用戶的關系正被深度改寫。

GUI接管屏幕:豆包撕開系統級權限口子,智譜開源補位

這場路線之爭的導火索,是12月初字節跳動聯合中興努比亞發布的“豆包手機”nubia M153。這款手機憑借跨應用AI操作能力攪動行業:用戶只需發出語音指令,AI便能完成訂外賣、發微信、比價購物等一系列跨App任務,其技術核心是GUI(圖形用戶界面)多模態大模型與系統級權限的深度綁定。

豆包手機 圖片來源:中興商城

前小米OS AI產品專家、現出海AI應用公司ExcelMaster.ai創始人張和告訴《每日經濟新聞》記者(以下稱每經記者),通過與手機廠商(如中興)達成操作系統層面的深度合作,讓AI助手獲得凌駕于所有App之上的系統級操作權限。其技術邏輯是模擬人類的點擊、滑動等操作,貫通全手機應用,實現跨App的任務執行。

但AI助手直接“接管”屏幕,很快引發主流App的“自衛反擊”:微信提示環境異常甚至封號,淘寶頻繁彈出人機驗證,各大銀行App則直接拒絕在錄屏狀態下運行。

12月9日,智譜AI宣布開源自主任務模型AutoGLM,為GUI路線提供了另一種可能性。

AutoGLM同樣基于GUI范式,通過視覺大模型實現手機自動化操作,但此前因未獲廠商系統級權限支持,只能依賴安卓無障礙模式運行。

張和指出,無障礙模式存在明顯短板:“AI操作時會完全占據前臺窗口,比如操作淘寶一分鐘內,用戶無法刷微博、聊天。”但他強調,豆包與智譜AutoGLM本質同源,都是大模型廠商視角的探索,僅開源與否的差異。“只要手機廠商配合,智譜AutoGLM也能實現后臺靜默操作,核心癥結始終是系統權限。”

獲得中興努比亞手機的系統級權限,是豆包率先做出AI手機的核心原因之一。

但張和指出,這類合作的主動權掌握在手機廠商手里——并非廠商不具備同等技術研發能力,而是“要不要做(AI手機)”的戰略考量。

廠商的顧慮主要有兩點:首先是用戶對隱私泄露的普遍擔憂,貿然開放權限可能嚴重影響手機品牌的用戶口碑和形象;其次,手機廠商希望將系統級AI入口牢牢掌握在自己手中,而非淪為AI公司的技術通道。

“這也解釋了為何豆包的首個合作伙伴是中興努比亞,而非頭部廠商。”張和補充道。

蘋果、谷歌“慢半拍”:API路線的保守布局

豆包手機的出現,也引發了全球范圍內關于AI手機兩條技術路線——GUI范式與API(應用程序接口)范式——的對比和討論。

豆包和智譜的GUI,如同一個“AI保姆”,它像人一樣看著手機屏幕,幫用戶操作手機。蘋果和谷歌的API路線,則像給App們發了一套“手冊”,讓它們自己把功能開放出來給系統調用。

兩者的優劣對比十分鮮明:GUI不依賴App開發者配合,通過視覺大模型“讀取”屏幕、模擬人類點擊實現操作,優點是通用性強,理論上人能使用的App它都能駕馭;但缺點同樣突出,一是隱私保護壓力大,二是效率較低,需逐步驟操作且易出錯。

以蘋果Apple Intelligence為代表的API范式,不是通過模擬,而是構建底層框架與標準化接口,讓AI通過規范“調用能力”完成任務。這種模式的優點是穩定、保障隱私且效率高,缺點則是需要App開發者主動配合,生態構建周期更長。

iPhone 17搭載Apple Intelligence 圖片來源:蘋果官網

張和評價蘋果是“最保守的大玩家”。

2022年,蘋果推出Apps Intent框架,鼓勵開發者向系統聲明功能供Siri調用,但堅決不開放讀屏繞開應用的能力;即便未落地的“屏幕感知”功能,也選擇通過API向Siri提供屏幕內容,而非直接操控界面。

當前,蘋果Apple Intelligence集成了OpenAI的ChatGPT。而據媒體報道,蘋果正計劃采用谷歌的Gemini模型,為Siri語音助手升級提供技術支撐。蘋果希望將該技術作為臨時解決方案,直到自家模型足夠強大。

Pixel 10搭載Gemini大模型 圖片來源:谷歌官網

谷歌則走端云協同路線,且優先布局電腦端。旗下Gemini大模型具備強大端云協同能力,但手機端未采用GUI多模態操作;推出的AppFunctions API,旨在解決生態內的碎片化問題,實現系統對應用能力的統一發現與索引。

谷歌和蘋果均傾向于推動應用開發者主動接入標準化接口,實現AI助手跨應用協作。

張和透露,目前兩家公司尚未在手機上推出GUI多模態操作相關功能,仍處于技術儲備階段。“谷歌一方面需要協調安卓生態的手機廠商,另一方面也在觀望市場反饋和技術成熟度。”

AI生態洗牌:手機廠商、超級App與長尾應用的利益重構

市場調查機構Canalys報告顯示,得益于芯片技術的快速發展和消費者對AI功能日益增長的需求,全球AI手機出貨占比將從2024年的16%升至2028年的54%。該機構預計,2023年至2028年的年復合增長率將達到63%,三星和蘋果等主要玩家將推動這一增長。

技術路線的抉擇,最終將指向移動互聯網利益格局的深度重構。

“靠AI助手去購物,相當于直接介入交易,互聯網大廠自然擔心商業模式受影響。”張和點出了超級App集體“自衛”的核心焦慮。

API類似手機廠商向各家互聯網大廠商議,讓后者開發接入手機智能助手的API接口,在限定范圍內向AI開放部分功能。這一模式下,主動權掌握在互聯網大廠手中,是否開放API接口、對誰開放、開放多少功能,都是未來提供議價權的籌碼。

而GUI Agent可以通過“看屏幕、點按鈕”的方式來操作App,相當于繞過了App對AI許可授權的過程。

更關鍵的是,GUI Agent將用戶操作截留在了手機系統層面:用戶無需打開App,就能使用其核心功能。這意味著,App上的廣告投放將失去核心價值——而廣告收入正是互聯網行業的重要營收來源。

張和認為,未來AI手機的生態將呈現“分層治理”格局,不同體量玩家命運迥異。

對于微信、淘寶等超級App而言,短期可以通過技術手段抵制外部AI讀屏,保護商業數據與用戶隱私。長期最優解是自研AI Agent,形成Agent to Agent(A2A)協作模式:系統級AI將用戶意圖傳遞給應用Agent,后者在權限內完成操作。這種模式既保護超級App“領地”,又能融入AI手機生態。

對于數以百萬計的中長尾App來說,處境則將完全不同。

張和認為,長尾App因缺乏自研Agent的技術與商業話語權,大概率將“被系統級AI直接控制”。對它們而言,與其投入資源拉新獲客,不如接受系統級級AI操作,換取新生態的流量分發。手機廠商或會制定標準化利益分配條款,讓長尾應用“搭上生態紅利”。

“這就像自動駕駛,是不可逆轉的歷史趨勢。”張和總結道。以用戶需求為核心的變革,將推動生態從“流量爭奪”走向“價值共創”,最終形成手機廠商主導,超級App、長尾應用和大模型廠商各司其職的全新格局。

封面圖片來源:視覺中國

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0