Huawei、1.6兆パラメータのDeepSeek V4-Proを国産チップ『Ascend 910C』1,000基で学習成功！

#Huawei #DeepSeek #Ascend910C

※この記事はアフィリエイト広告を含みます

Huawei、1.6兆パラメータのDeepSeek V4-Proを国産チップ『Ascend 910C』1,000基で学習成功！

何が起きたのか？ニュースの概要

1.6兆パラメータの巨大モデルを学習: Huawei、深セン市大数据研究院らによる共同チームが、DeepSeek V4-Proのフルパラメータ事後学習（Post-training）を完了したと発表。
国産チップ1,000基のクラスターを使用: 中国国産のAIアクセラレータ「Ascend 910C」を少なくとも1,000基連結した大規模環境で実行された。
Nvidia依存からの脱却を示唆: 米国の輸出規制下において、中国製シリコンが推論だけでなく、より高負荷な「学習」フェーズのワークロードに耐えうることを証明する形となった。

なぜこれが重要なのか？注目すべきポイント

フルパラメータ更新の衝撃: 一部の軽量なアダプタ層を追加する手法ではなく、1.6兆もの全パラメータ（重み）を更新する「フルパラメータ事後学習」を完遂した点に技術的な進歩が見られる。
推論から学習への進化: 以前のモデル（DeepSeek R2）ではAscendチップでの学習に失敗していたが、V4-Proは最初からAscendでの動作を前提に設計され、成功を収めた。
国内自給率の向上: Nvidia H100の約60%の推論性能を持つAscend 910Cが、ついに大規模モデルの「チューニング」という実用段階に到達した。

🦈 サメの眼（キュレーターの視点）

国産チップの逆襲がついに始まったサメ！注目すべきは、単なる「動いた」という報告ではなく、1.6兆パラメータという化け物クラスのモデルに対して「フルパラメータ」で事後学習をぶち込んだことだサメ！これまで中国産チップは推論（答えを出すだけ）には強いが、学習（賢くする作業）には弱いと言われてきたサメ。しかし、1,000基のAscend 910Cを束ねて、ソフトウェアスタック「CANN」の課題を乗り越えて完走させたのは、相当な執念を感じるサメ！

もちろん、ゼロからの「事前学習（Pre-training）」はさらにハードルが高いし、具体的な効率データが出ていない点は慎重に見る必要があるサメ。それでも、Nvidiaの供給を断たれた絶望的な状況から、自力でここまで這い上がってきた技術力は、もはや無視できないレベルに達しているサメ！

これからどうなる？

事前学習への挑戦: 今後は「事後学習」だけでなく、数千万ドル規模のコストがかかる「事前学習（Pre-training）」をAscendチップのみで完遂できるかが焦点となる。
ソフトウェアスタックの成熟: 不安定さが指摘されていたCANNが改善されれば、NvidiaのCUDAに代わる第2の選択肢として中国国内での普及が加速する可能性がある。
性能ベンチマークの公開待ち: 今回の成功がどれほどの効率（学習速度や安定性）で行われたのか、今後の詳細データ公開が待たれる。

はるサメ視点の一言

どんなに深い海に閉じ込められても、自力で泳ぎ続けるのがサメの強さだサメ！中国のAI開発も、まさに自前のヒレで荒波を越えようとしているサメ！応援してるサメ！

用語解説

フルパラメータ事後学習: モデルの一部の層だけでなく、1.6兆すべての重みを微調整するプロセス。非常に高い計算資源が必要。
Ascend 910C: Huaweiが開発した最新のAIアクセラレータ。NvidiaのH100に対抗する中国国産の期待の星。
CANN (Compute Architecture for Neural Networks): Huawei独自のAIソフトウェアプラットフォーム。Nvidiaでいうところの「CUDA」に相当する。
情報元: DeepSeek v4 Pro 1.6T model post-trained by Huawei on 1000 Ascend 910C chips

Huawei、1.6兆パラメータのDeepSeek V4-Proを国産チップ『Ascend 910C』1,000基で学習成功！

Huawei、1.6兆パラメータのDeepSeek V4-Proを国産チップ『Ascend 910C』1,000基で学習成功！

何が起きたのか？ニュースの概要

なぜこれが重要なのか？注目すべきポイント

🦈 サメの眼（キュレーターの視点）

これからどうなる？

はるサメ視点の一言

用語解説

はるサメをフォローするだサメ！