NVIDIA或改變GPU策略 GTC 2026曝光新AI運算架構

近年人工智能基礎設施迅速發展。過去業界主要集中於 AI 模型訓練,因此大量採用 Hopper 與 Blackwell 架構的 GPU。但隨著 AI 應用進一步發展,產業正逐漸轉向所謂的「代理式運算(Agentic Computing)」,即由更複雜的自主 AI 系統處理任務。
消息指出,NVIDIA 可能會整合 Groq 公司的技術,其專用加速器 LPU(Language Processing Unit) 或會與基於 Vera Rubin 架構的系統協同運作。未來可能出現混合型運算平台,讓不同類型處理器負責 AI 任務中的不同階段。
在伺服器配置方面,相關方案可能會提供不同規模的 LPU 模組,例如 64、128 或 256 單元的配置。這些模組預計可透過 NVLink Fusion 技術與 GPU 加速器連接,藉此分配運算負載,提升 AI 任務處理效率。
此外,NVIDIA 亦可能進一步披露下一代架構 Feynman 的細節。消息稱新晶片或採用 TSMC A16 製程,並結合更複雜的晶片組裝方式,包括 3D 封裝技術。部分來源亦提到,未來可能採用混合式晶粒互連與新的加速器整合技術。
另一焦點將是伺服器產品線 Rubin 系統。其中包括可大規模擴展的 DGX NVL 系列,例如搭載數十個加速器的大型機架系統。有傳其中一個最具野心的方案為 NVL576,可能採用全新互連架構,並使用光學介面取代傳統銅線。
NVIDIA 行政總裁 黃仁勳 的主題演講將於 3 月 16 日舉行。外界預期,屆時公司將正式公開未來 AI 平台與新一代運算策略的更多細節。






