DeepSeekその②

これがAIバブルのピーク？

このショックが業界を駆け巡ったちょうどその日、トランプがStarGateのジョイントベンチャーでOpen AI、Soft Bank、Oracle、Microsoftなどの企業が参加し、2025年に＄100billion、トランプ政権の4年間で合計＄500billionのAIインフラ投資を行うと発表。

さらに同じ日、METAのCEO、ZuckerbergがMETAは2025年に＄65billionのAI設備投資を行うと発表。

アメリカの企業達が大金を湯水のように使うと宣言したその日に、中国のスタートアップがそれを嘲笑うかのように100分の1以下の費用で同じレベルのAIを作ったと発表したのだ。

5年後、私たちはこの日を振り返り「あのトランプとザックの発表の日がAIバブルのピークだったね」と言っている可能性は充分にある。

ここから先は私の見立て

ここから先は私の意見、偏見、憶測、なのであまり真剣に聞かないで欲しい。私はエンジニアでもテクに明るいわけでもないので、あくまで眉唾で無責任な見解とエンタメとして聞いてほしい。

中国の数字は信用できない

まず、このモデルを作るのに必要だった費用は本当に正しいのか怪しいと思う。上のトレーニングに必要だった費用のくだりには、この費用はV3をトレーニングするために必要だった費用だけでそれ以前に研究に使った費用は含まれない、とある。

巨額な設備投資をしているアメリカの企業達も一つ一つのモデルにかける費用はそれほどではないかもしれない。何せバージョンが次から次へと出てくるのだから。

さらにDeep SeekはLlamaやその他のオープンソースのモデルをコピーしてそれを進化させているだけだと思う。以前、Googleの内部書類が出回ったときに、Llamaを使って個人や中小企業がとても少ない費用でLLMをトレーニングできると話題になったことを覚えている人も多いだろう。

大体、中国企業が実際にNVDAの最新のGPUを実は密輸で何台も何台も持っていても全くおかしくない。もし持っていたとしたらそれを持っていると言うはずが無い。だって違法なんだから。

中国側としては「俺たちはお前らのチップなんてなくたって同じくらい凄いものを自力でしかもお前らより速く作れるんだぜ」と言いたいインセンティブ満載だ。

Deep Seekのモデルが驚くほど凄い、という事実は変わらないけど、その驚きの程度がかなり誇張されている可能性はおおいにある。

Deep Seekは言語だけ

Deep Seekはプロンプトも出力も言語のみ。アメリカの最新モデルはみんなマルチモーダル、つまり、動画や音声、画像にも対応する。マルチモーダルにするためにはやはり多数のGPUが必要かもしれないし、コストも増大するだろう。

コストが下がるのはAI業界にとっていいこと

LLMのトレーニングコストが下がるのはおそらくいいこと。Deep Seekはオープンソースなんだから、そのコスト対価の秀悦さはすぐに盗めるはず。

例えばMETAは「あれ？＄65billion使う予定だったけど、＄20billionで済んじゃった！」となる可能性もある。となるとMETAの株は上がるだろう。

PLTRやTWLOなどのLLMを使う側のSAAS会社にも追い風になるだろう。LLMのコストが下がればマージンが上がる、あるいは値段を下げることによって需要が増える。

AIのコストが下がることによって、AIへの需要がさらに高まり、最終的に結果としてNVDAのチップへの需要がさらに上がる、という可能性もある。

秀blog(pcだと見やすいです🧑‍💻)

Search This Blog

DeepSeekその②

Comments