Author: Qin Jin; Source: Carbon Chain Value
シリコンバレーのお偉方やウォール街のエリートが予想だにしなかったのは、東洋からの謎の勢力ディープシークが、一夜にして米国の株式市場とその莫大な富を実際に下落させ、縮小させることだった。1月28日、関連データによると、米国のチップ株は一夜にして1兆米ドルを蒸発させた。エヌビディアの市場価値は1日で6000億ドル蒸発し、米国株の最高記録となった。ドナルド・トランプ米大統領でさえ、出てきて何かコメントせずにはいられなかった。彼は、中国のAIアプリ「ディープシーク」の突然の台頭について、「米国のハイテク企業にとって警鐘を鳴らすべきだ」と述べ、中国企業がより安価で効率的なAIモデルを開発していることは良いことだと語った。
トランプ氏は、米国のハイテク企業がAI分野を支配することを依然として期待しているとしながらも、この週末にアップルのアプリショップで1位に急浮上した低価格のAIアシスタント「DeepSeek」が突きつけた挑戦を認めた。

次の問題は、これは始まりに過ぎないのか、ということだ。
1月28日、FTは、あまり知られていない中国のヘッジファンドが人工知能に爆弾を投じたと報じた。OpenAIがそのモデルの仕組みを独占的なものとして扱っているのに対し、ディープシークのR1はその技術の中核をオープンソース化しており、それを利用し構築する開発者を惹きつけている。
月曜日の米国株式市場が開く前に、人工知能の5大テック株(Nvidia、Alphabet、Amazon、Microsoft、Meta Platforms)の時価総額の合計が上昇しました。-を合わせた時価総額が7,500億ドル近くも目減りしている。もしディープシークが同社の最先端チップを使わずに勝利した場合、エヌビディアにとっては特に厳しい状況になるかもしれない。
また、米国株式市場が開いた後、チップ株のエヌビディアは17.5%も下落しました。ブロードコムは16.TSMCは14.3%下落。マイクロンは10.5%、アームは10.0%、amdは5.6%下落した。上記のチップ銘柄は、1日で1兆ドル近い時価総額を失った。エヌビディアは10月2日以降の上昇分をすべて失い、2取引日で21%下落した。エヌビディアの時価総額は6300億ドル減少した。先週は世界最大の上場企業であったが、2日間でその価値の5分の1を失った。Jen-Hsun Huang氏の個人資産も1,000億ドル減少しました。
チップメーカーのASMLを含むハイテク企業やエネルギー企業の投資家は、データセンターの発展が自社の収益を押し上げると期待していたが、今では投資が無駄になるのではないかと心配している。ビジブル・アルファ社の予測によると、メガ企業は今年の設備投資に3000億ドル近くを費やすという。アナリストらは、メタとマイクロソフトが水曜日に決算を発表する2024年の投資額は合計940億ドルになると予想している。
一部の海外メディアは、AI競争が始まったと分析している。エヌビディアの株価を暴落させた理由には、エヌビディアが「優れたAIの進歩」と呼ぶAIイノベーションのリーダーとして、ディープシークが台頭してきたことが含まれているようだ。
第二に、AIの進歩はチップの需要が増えることを意味するため、理論的にはNVIDIAにとって良いことだ。問題は、ディープシークが中国にあり、米国が中国からのチップ技術をブロックしていることだ。つまり、エヌビディアがディープシークに販売できるのは、1個30,000ドル以上で売れるH100チップではなく、H800チップの弱いものだけだ。仮にディープシークが低性能のチップのみを保有していたとしても、中国は事実上、コストが96%安く、効率的で、90%以上安価なAIモデルを生成できることになる。
同時に、彼らのAIモデルは無料だが、ChatGPTのようなAIモデルは比較的高価(月額200ドル以上)で効率も悪い。中国はこれまで不可能と思われていたペースで技術革新を始めているようだ。米国のハイテク業界は、その優位性は代替できないと考えている。米国の大型ハイテク株は今、より優れたAIモデルを無料で手に入れることができ、しかもそれはより良くなる一方だという現実に直面している。なぜ、より悪い製品にプレミアムを払うのか?
次の反応は、米国がディープシークを制限したり、中国にチップを輸出したりすることかもしれない(ここ数カ月見てきたように)が、それは明らかにうまくいかないだろう。エヌビディアがディープシークの成長によって生まれた新たな需要を活用する方法を見つけることができれば、この下落は贈り物とみなされるだろう。結局のところ、ハードウェアとソフトウェアの両方におけるAIの競争は激化し、どの企業も「安泰」ではなく、技術革新のペースは加速するばかりだろう。
では、ディープシークが勝利した理由は何だったのか?そして、AIの未来はどのように展開していくのだろうか?
米投資会社アトレイデスのマネージング・パートナー、ギャビン・ベイカー氏は、ディープシークとAIの今後の進化について、さまざまな角度から分析した。マスクは、これまで見た中で最高の分析だと称賛した。
最も重要なこととして、ギャビン・ベイカー氏は、ディープシークR1はオープンAI o1よりもはるかに安価で、より効率的な推論が可能であると述べた。93%で、ローカルのハイエンド・ワークステーションで実行でき、クレイジーなレート制限にぶつかることもないようだ。単純に計算すると、FP8では、1bのアクティブパラメータごとに1gbのRAMが必要なので、R1では37gbのRAMが必要になる。バッチ処理によってコストを大幅に削減することができ、より多くの計算によって1秒あたりのトークン数を増やすことができるので、クラウドで推論を行うことにはまだ利点がある。また、地政学的な力学がここで作用していることにも注意してください。
DeepSeekはApp Storeの関連カテゴリでダウンロード数1位を獲得している。3)トレーニングや推論をより効率的にするアルゴリズムのブレークスルーがあった。FP8、MLA、マルチマーカー予測トレーニングは非常に重要である。600万ドルである。5)彼らのハードウェア・アーキテクチャは斬新であるが、スケーリングのためにPCI-Expressを使用していることに注目したい。
誤解:1)テクニカルペーパーによると、600万ドルには「アーキテクチャ、アルゴリズム、データに関する以前の研究やアブレーション実験に関連するコスト」は含まれていない。Deepseekは2,048台以上のH800を所有しているようで、以前の論文では10,000台のA100のクラスタが挙げられていた。Nvidiaの収益の約20%はシンガポールからもたらされている。Nvidiaの最善の努力にもかかわらず、同社のGPUの20%はシンガポールにはないかもしれない。2) 彼らは多くの改良を行った。つまり、GPT-4oとo1への無制限のアクセスがなければ、このモデルを訓練することはできなかっただろう。昨日@altcapから指摘されたように、中国が米国の有力モデルを改良する能力に何も対処せずに、有力GPUへのアクセスを制限するのはちょっとおかしい。なぜタダで牛乳が手に入るのに牛を買うのか?
結論:1)トレーニングコストの削減は、AIのROIを改善する。のライトバージョンは、ハイエンドワークステーション(Mac Studio Proが挙げられていた)のエッジでローカルに実行できることだ。これは、同様のモデルが約2年後にはスーパーフォン上で実行されることを意味する。理性が「十分だから」という理由でエッジに移動するのであれば、私たちはまったく異なる世界に生きており、勝者もまったく異なっている。4)ASIは本当に、本当に近い。そして、超知能の経済的見返りが何なのか、誰も本当のところは知らない。もし10万人以上のブラックウェル(o5、ジェミニ3、グロック4)で訓練された1,000億ドルの推論モデルがガンを治し、ワープエンジンを発明すれば、ASIの見返りは非常に高くなり、訓練費用と電力消費は着実に増加するだろう。として復権するだろう。5)これは、ソフトウェアやインターネットなど、AIを利用する企業にとって本当に良いことだ。6)経済的な観点から見ると、これは分散されたユニークなデータの価値を劇的に高める。-YouTube、Facebook、Instagram、Xなど。7) 米国の研究所は、r1での本質的な洗練プロセスを防ぐために、主要モデルの公開を止めるかもしれない。すなわち、r1はr2などを訓練するのに十分かもしれない。
Grok-3は目前に迫っており、上記の結論に大きな影響を与える可能性がある。これは間違いなく、GPT-4以来の訓練前スケール法の主要なテストです。強化学習によってv3をr1に変えるのに数週間かかったように、Grok-3の推論を改善するのに必要な強化学習にも数週間かかるかもしれません。事前学習、事後学習中の強化学習、推論中のテスト時間計算(強化学習の関数)という3つのスケーリング法則は乗法的であるため、ベースモデルが優れていればいるほど、推論モデルも優れているはずである。-テッセラクトのデモを参照。二つの塔』に登場する名もなきオークの言葉を借りれば、肉を再び食べる時が近いかもしれない。時間が解決してくれるだろう。"事実が物語っている。
しかし、米株式投資アナリストのオールド・キャット・ヒュー氏は、ディープシークによる月曜日の売りは過剰反応だと考えている。経済学にはジェボンズのパラドックスというものがあり、資源の利用効率を高めると、その資源の全体的な消費量が(むしろ)減る傾向にあることを示唆しています。
これは、蒸気機関における石炭の使用で起こった。蒸気機関の効率向上により、単位生産量あたりの石炭消費量は減少した。しかし、石炭火力技術は経済的に魅力的なものとなり、より広く採用されるようになり、最終的には石炭消費量全体を増加させることになった。コンピュータが小型化・低価格化し、インターネットへのアクセスが実質的に無料になり、誰もがコンピュータを持ち、24時間いつでもインターネットにアクセスできるようになった。
そして今、AIが同じことをしている。AIモデルのトレーニングや推論にかかるコストが劇的に下がるにつれ、ますます多くの企業や個人が独自のAIモデルを構築するようになり、AIは社会のあらゆる側面に浸透するよう世界的に広まりつつある。