2025年03月27日 09:02 市場資訊
華爾街見聞
巴克萊指出,2025年AI行業有足夠的算力來支持15億到220億個AI Agent。AI行業需從“無意義基準測試”轉向實用的Agent産品部署,低推理成本是盈利關鍵,開源模型將降低成本。儘管算力看似充足,但高效、低成本Agent産品的專用算力仍有缺口。
繼TD Cowen後,巴克萊似乎也開始唱空AI算力。
3月26日,巴克萊發布最新研究稱,2025年全球AI算力可支援15-220億個AI Agent,似乎足以滿足美國和歐盟的絕大部分需求。而同日TD Cowen分析師稱支撐人工智慧運算的計算機集群供過於求。

巴克萊研報指出,AI行業需要從“無意義基準測試”轉向真正有用的Agent産品部署。同時巴克萊分析師表示:
AI Agent市場的增長潛力巨大: 行業算力能夠支持大規模Agent部署,預示著巨大的市場機會。
推理成本是關鍵: 低推理成本對於Agent産品的盈利至關重要,這將驅動對更高效的AI模型和算力的需求。
開源模型的重要性: 開源模型將在降低成本方面發揮關鍵作用,投資者應關注相關領域的動態。
算力供需:過剩還是不足?
關於AI算力的供需平衡,巴克萊展示了幾個核心發現:
行業推理容量基礎:2025年全球約有1,570萬個AI加速器(GPU/TPU/ASIC等)在綫,其中40%(約630萬個)將用於推理,而這些推理算力中約一半(310萬個)將專門用於Agent/聊天機器人(18.620, -0.34, -1.79%)服務;
算力分配正在演變:企業客戶已開始轉向成本更低的開源模型,如Salesforce的Agentforce採用Mistral開源模型(7B-141B參數),而非最昂貴的專有前沿模型;
開源模型下載激增:Hugging Face數據顯示DeepSeek、Llama和Mistral等開源模型的下載量正在迅速增長,這一趨勢將隨著從聊天機器人向Agent的轉變而加速。
算力供應雖然表面上充足,但面臨結構性挑戰。巴克萊明確表示:
如果Agent産品真正起飛並對消費者和企業用戶非常有用,我們可能需要
1)更便宜、更小但性能同樣高的基礎模型(DeepSeek風格);
2)更多推理晶片安裝;以及
3)可能需要將已安裝的訓練GPU重新用於推理。
這表明,雖然目前總體算力看似充足,但針對高效、低成本Agent産品的專用算力仍有較大缺口。巴克萊指出這意味著,在AI Agent賽道上,具有高效推理成本結構和專注開發小型高效模型的公司可能擁有更大競爭優勢,而僅依賴大模型而不考慮單位經濟學的公司可能面臨更大挑戰。
推理成本:AI Agent的經濟學挑戰
巴克萊指出AI Agent的推理成本正成為行業發展的核心考量因素:
AI Agent生成的Token數量巨大:相比傳統聊天機器人,Agent産品每次查詢生成約10,000個Token,是聊天機器人(約400個)的25倍,這極大增加了推理成本;
不同模型的經濟效益差異巨大:以年度訂閱成本計算,基於OpenAI o1模型的Agent産品成本高達2,400/年,而基於DeepSeekR1模型僅需88/年,後者提供了15倍於前者的用戶容量;

超級Agent需求正在興起:OpenAI計劃推出的”超級Agent”産品,這類高端産品將消耗更多Token,每月高達3,560萬個,每日查詢次數可達44次,遠超普通Agent的2.6次。
從單位經濟學角度看,以Token計價的模式將決定不同模型的市場競爭力。正如巴克萊研究指出:
這證明瞭低推理成本的重要性。由於其自主性質,Agent AI産品的Token消耗趨勢遠高於聊天機器人。
此外,巴克萊分析師表示,雖然“超級Agent”有潛力,但其高昂的推理成本可能限制其大規模應用。投資者在評估此類産品時,應謹慎考慮其經濟可行性。
行性。

責任編輯:於健 SF069