每日經濟新聞 2026-02-12 11:53:33
每經AI快訊,面壁智能公眾號2月12日宣布,正式發布稀疏-線性注意力混合架構SALA,以及基于該架構的文本模型MiniCPM-SALA,模型僅有9B參數。據介紹,MiniCPM-SALA不使用投機采樣等加速算法,在云端推理芯片上,當序列長度為256K詞元時推理速度高達Qwen3-8B的3.5倍,并支持在云端芯片和消費級端側GPU上進行高達一百萬詞元上下文長度的推理。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP