開發者破解 Apple M4 Neural Engine 成功解鎖 15.8 TFLOPS AI 訓練能力

不過,近日一名代號為 0x0SojalSec 的研究員於 GitHub 公開相關程式碼,聲稱已成功逆向工程 Apple M4 Neural Engine,並解鎖高達 15.8 TFLOPS 的 AI 訓練運算能力,突破 Apple 原有的軟件限制。
根據消息指出,由於 Apple 並未向開發者開放足夠權限直接控制 Neural Engine 執行進階訓練工作,因此該研究員並未使用 Apple 官方提供的 CoreML、Metal 等開發工具,也沒有依賴 GPU 進行運算。
為了達成目標,他自行開發了一套全新的 Model Intermediate Language(模型中介語言),作為 Neural Engine 與 AI 訓練流程之間的橋樑。透過這套系統,成功在 Apple Neural Engine 上實現完整的反向傳播(Backpropagation)與 Transformer 模型訓練功能。
Apple hid 15.8 TFLOPS of raw AI power in every M4 Mac & iPhone.
They only let you use the Neural Engine for inference.
Reverse-engineered their private APIs and ran full backpropagation & transformer training directly on the
ANE, No CoreML, No Metal, No GPU,
- Training… pic.twitter.com/j5WSWX5dfH— Md Ismail Šojal (@0x0SojalSec) June 15, 2026
由於 Neural Engine 本身並非設計用於此類工作,研究員亦加入多項穩定性機制。例如當訓練程序卡死時,系統可透過特定執行指令重新啟動相關程序,讓機器學習工作得以繼續進行,而不需要整個應用程式重新啟動。
此外,為提升訓練效率,研究員將所有運算資料直接寫入系統記憶體(RAM),避免使用速度較慢的 NAND 儲存裝置,從而維持高速運作表現。
這項成果顯示,Apple M4 所搭載的 Neural Engine 在硬件層面具備相當可觀的 AI 訓練潛力,只是相關功能一直受到 Apple 軟件限制。透過逆向工程後,研究員成功證明 M4 不僅能執行 AI 推論,也有能力處理高負載的 AI 模型訓練工作。
