為了提升服務質素,我們會使用 Cookie 或其他類似技術來改善使用者的閱讀體驗。 如想了解更多請到 這裡 >。
然而,DeepSeek 向 IT Home 表示,公司並未計劃在 8 月推出 R2。雖然產品已進入活躍測試階段,但尚未達到市場化水平。CEO 梁文峰在經歷數月開發後,對性能仍不滿意,加上受制於 Nvidia H20 晶片供應限制,令項目進度受阻。
公司擔心若在需求高峰過早推出,可能因系統負載過重而帶來風險,尤其是在面對 ChatGPT、Perplexity 與 Google Gemini 等競爭對手時。
DeepSeek 將 R2 全面部署於華為 Ascend-910B 晶片叢集,該系統在半精度下可提供 512 PetaFlops 運算力,效能達 Nvidia A100 叢集的 91%,同時將訓練成本降低 97%,有望以更低價與 OpenAI、Perplexity 及 Google 競爭。
同時,華為開發的 Unified Cache Manager(UCM)可在 HBM、DRAM 與 SSD 間加速 KV-Cache 數據處理,實測於中國銀聯場景中延遲減少九成、吞吐量提升 22 倍。華為計劃於 9 月將 UCM 開源,與 DeepSeek-R2 的進展一同展示中國在高性能、去依賴西方技術的 AI 系統研發上的決心。