AI模型 DeepSeek V4 完成適配 Blackwell平台 英偉達火速官宣
1小時 807
DeepSeek V4 正式發布當日,多個平台同步公布適配進展。華為昇騰 CANN 官方透過直播宣布,DeepSeek V4 已在昇騰平台完成首發部署,標誌著國產模型與國產算力首次進入實戰應用階段。

同日,英偉達亦在官方技術部落格發文,宣布 DeepSeek V4 已完成在 Blackwell 平台的適配,並公開測試數據顯示,在 GB200 NVL72 系統上,每用戶推理速度超過 150 tokens/秒。
從發布節奏來看,雙方在同一天官宣相關進展。英偉達早前曾提及,若頂尖 AI 模型優先針對其他平台進行優化,將對其造成影響。
在技術層面,DeepSeek V4-Flash 採用 FP4 與 FP8 混合精度,其中 FP4 僅在 Blackwell 及更新架構晶片上提供原生支援。不過,相關限制在發布當日已有不同方案應對。

智源 FlagOS 宣布已實現 FP4 至 BF16 的精度轉換路徑,令 DeepSeek V4-Flash 可在多款國產晶片上完成適配,包括海光、沐曦、華為昇騰、摩爾線程、崑崙芯、平頭哥真武及天數等,並將適配時間由數週縮短至數天。
硬件方面,華為昇騰 Atlas 350 加速卡目前支援 FP4 低精度推理,其單卡算力數據達到英偉達 H20 的 2.87 倍。
此外,DeepSeek 官方在定價說明中提到,預計下半年昇騰 950 超節點量產後,Pro 版本價格將進一步下調。
目前英偉達的 NVIDIA NIM 微服務已支援 DeepSeek V4,同時 SGLang 與 vLLM 亦提供部署方案。從首日情況來看,多平台已同步支援該模型。
