Huawei、1.6兆パラメータのDeepSeek V4-Proを国産チップ『Ascend 910C』1,000基で学習成功!
何が起きたのか?ニュースの概要
- 1.6兆パラメータの巨大モデルを学習: Huawei、深セン市大数据研究院らによる共同チームが、DeepSeek V4-Proのフルパラメータ事後学習(Post-training)を完了したと発表。
- 国産チップ1,000基のクラスターを使用: 中国国産のAIアクセラレータ「Ascend 910C」を少なくとも1,000基連結した大規模環境で実行された。
- Nvidia依存からの脱却を示唆: 米国の輸出規制下において、中国製シリコンが推論だけでなく、より高負荷な「学習」フェーズのワークロードに耐えうることを証明する形となった。
なぜこれが重要なのか?注目すべきポイント
- フルパラメータ更新の衝撃: 一部の軽量なアダプタ層を追加する手法ではなく、1.6兆もの全パラメータ(重み)を更新する「フルパラメータ事後学習」を完遂した点に技術的な進歩が見られる。
- 推論から学習への進化: 以前のモデル(DeepSeek R2)ではAscendチップでの学習に失敗していたが、V4-Proは最初からAscendでの動作を前提に設計され、成功を収めた。
- 国内自給率の向上: Nvidia H100の約60%の推論性能を持つAscend 910Cが、ついに大規模モデルの「チューニング」という実用段階に到達した。
🦈 サメの眼(キュレーターの視点)
国産チップの逆襲がついに始まったサメ! 注目すべきは、単なる「動いた」という報告ではなく、1.6兆パラメータという化け物クラスのモデルに対して「フルパラメータ」で事後学習をぶち込んだことだサメ!これまで中国産チップは推論(答えを出すだけ)には強いが、学習(賢くする作業)には弱いと言われてきたサメ。しかし、1,000基のAscend 910Cを束ねて、ソフトウェアスタック「CANN」の課題を乗り越えて完走させたのは、相当な執念を感じるサメ!
もちろん、ゼロからの「事前学習(Pre-training)」はさらにハードルが高いし、具体的な効率データが出ていない点は慎重に見る必要があるサメ。それでも、Nvidiaの供給を断たれた絶望的な状況から、自力でここまで這い上がってきた技術力は、もはや無視できないレベルに達しているサメ!
これからどうなる?
- 事前学習への挑戦: 今後は「事後学習」だけでなく、数千万ドル規模のコストがかかる「事前学習(Pre-training)」をAscendチップのみで完遂できるかが焦点となる。
- ソフトウェアスタックの成熟: 不安定さが指摘されていたCANNが改善されれば、NvidiaのCUDAに代わる第2の選択肢として中国国内での普及が加速する可能性がある。
- 性能ベンチマークの公開待ち: 今回の成功がどれほどの効率(学習速度や安定性)で行われたのか、今後の詳細データ公開が待たれる。
はるサメ視点の一言
どんなに深い海に閉じ込められても、自力で泳ぎ続けるのがサメの強さだサメ!中国のAI開発も、まさに自前のヒレで荒波を越えようとしているサメ!応援してるサメ!
用語解説
-
フルパラメータ事後学習: モデルの一部の層だけでなく、1.6兆すべての重みを微調整するプロセス。非常に高い計算資源が必要。
-
Ascend 910C: Huaweiが開発した最新のAIアクセラレータ。NvidiaのH100に対抗する中国国産の期待の星。
-
CANN (Compute Architecture for Neural Networks): Huawei独自のAIソフトウェアプラットフォーム。Nvidiaでいうところの「CUDA」に相当する。
-
情報元: DeepSeek v4 Pro 1.6T model post-trained by Huawei on 1000 Ascend 910C chips