文:Tony
在北京 ICC 全球 CEO 峰會上,中國半導體行業協會副理事長魏少軍拋出震撼彈:一枚採用成熟 14nm 製程與 18nm DRAM 的國產 AI 晶片,竟宣稱能匹敵 NVIDIA 4nm GPU!這聽來雖然十分科幻,但卻是中國 AI 戰略的最新進展,利用 3D 混合鍵合與近記憶體計算架構,試圖打破對 NVIDIA 提出的 CUDA (Compute Unified Devices Architectured)統一計算架構的依賴。
魏少軍詳細解釋,這款晶片將 14nm AI 晶片直接與 18nm DRAM 堆疊鍵合,透過 3D 混合鍵合技術實現銅對銅超高密度連接,大幅提升記憶體頻寬並壓低運算延遲。傳統封裝方式常遇「記憶體牆」瓶頸——AI 訓練頻繁存取資料,能量與時間成本高企;新架構則讓邏輯運算緊貼記憶體執行,軟體定義邏輯更能動態改善 AI 工作負載。
魏少軍更提供了這國產 14nm AI 晶片的效能數據,每瓦達 2 TFLOPS (每秒萬億次浮點運算) 能效,總吞吐量高達 120 TFLOPS,遠超 NVIDIA A100 GPU。不過上網翻查資料 NVIDIA A100 GPU 達到 312 TFLOPS,遠超國產 AI 晶片性能水平,相信國產晶片要真正可以挑戰外國大廠,還要花更多努力才能做到。
資料來源:tomshardware




