その答えが極めて優れたものであることは明らかであり、さらに深く調べてみると、以下の点で矛盾していることがわかる
。まず、その口調に皇室調を復活させることから始まる。
そして、上記の他のモデルの出力は、意味を伝えてはいるが、トーンが完全に間違っている。
李世民は時代の王として、上記の4つの出力のような愚かな口調で話すことはなかったでしょうし、DeepSeekはあまり無理をせず、比較的古典的な文章を使いながらも、読みやすさを考慮した文語体を直接使うことはしませんでした。
第二に、歴史的な詳細に異常に精通している。
これは、「ディープ・エクスプローラー」と「ネットワーク・サーチ」の両方をサポートしていることと大いに関係があるのではないでしょうか。
「太極宮」「巌流殿」「弥廷局」、
「太極宮」、「巌流殿」、「彌廷局」、「観音菩薩」、「宮門魚」シンボルは、唐代初期の歴史的な称号を完全に復元します。
調べてみると、「観音侍女」は李世民の長孫皇后の巫女名であり、「迎亭局」は歴史家などのための内廷内の排他的な組織であった。
「魏征」私は「魏征」を間違えて書こうとしていたのだと思ったが、「征」は「徵」の簡体字だと後で知った。魏征」と間違って書こうとしたのかと思ったが、「鄭」が「徵」の簡体字であることに後で気づいた。
第三に、一般的な用語でビッグワードを語る他のAIとは異なり、Deepseekの出力は極めて具体的で、驚くべき詳細に満ちている。
「オオカミの毛をインクに浸すと、指先に洗っていない血のかさぶたがありました」「歴史学者たちは今、宮廷で議論しています。処罰」か「殺害」か、「強制」か「拘束」か。"この時ばかりは、私の鎧についた元治の掌紋に触れる勇気はなかった。"
イメージを飛躍させるこれらの文章は、それぞれ「罪悪感と野心、闘争心と野心」とは言っていない。
イメージを飛躍させるこれらの文章は、それぞれ「罪の意識と野心、闘争と野心」とは言っていないが、「罪の意識と野心、闘争と野心」とは言っている。
第四に、Deepseekのアウトプットは、モノローグのテキストに括弧付きの情景描写を入れるという、これまた見事なものである。
この動作は即座に、まるで読者がその場にいるかのような臨場感をアウトプット全体に与えており、プロンプトではまったく示唆されていない。p style="text-align: left;">この文章はさすがにAIが書いたとは思えない。
そして、(「突然ペンを投げ捨て、青銅の鏡をつかんだ」)というセリフは、魏正の有名なセリフ「青銅の鏡を鏡としてズボンを正し、歴史を鏡として人の栄枯盛衰を知り、人を鏡として損得を知る」のメタファーでもある。何を得て何を失ったかを知ることができる」。
このAIが不死身になったという言葉を、私は信じただろう。
5つ目、そして最も重要なことですが、ディープシークはユーザーのニーズを予測しています。
私が入力したプロンプトの言葉を再考する -
「玄武門」。叛乱終結の日、李世民は深夜に独白を書いたが、彼なら何を書いたと思う?"
私のインプットはすでに簡潔すぎて凝縮されていないし、形容詞も傾向もない。
しかし、驚くべきことに、私が何を欲しているのかがはっきりとわかっているのだ。たとえば、これは確かに正確さが要求される数学的な問題ではないし、アウトプットに文学を加えようと自然に考えるのだが、これはまさに「優れた知性」の表れである。
ひとつ議論の余地があるのは、もちろん、歴史によれば、魏鄭が李世民と会ったのは玄武門事件の後であり、したがって、あの日、朱雀街で素手で剣をつかむことはできなかったということだが、魏鄭の性格を考えれば、それは理にかなっているように思える。
しかし、いずれにせよ、欠点は長所を隠さない。
このツイートに対するコメントの中で、1つ印象的だったのが、DeepSeekがこの出力でキューを隠しているのではないかと疑問を投げかけたツイートで、私がその前に大きくて複雑なキューを追加し、表示されたラインは単なるトリガーラインではないかと疑っているのです。
このコメントが特別視された理由は、「隠されたキュー」を考えることができるユーザーは、実はAIの上級ユーザーであり、そのようなユーザーは、これがAIによって直接書かれたものだとは思っておらず、DeepSeekのパワーを示す良い例だからです。DeepSeekは強力なツールなのだ。
そして、魏錫が春節の休暇モードから切り替えて、一晩でこの7,000語の記事をコーディングできたのは、この強力な力のおかげなのだ。
私が隠しキューを持っていないことを証明するために録音をアップロードします--
私は本当に隠しキューを持っていません
このような見事なケースを見せるだけでは、明らかに魏錦のスタイルではない。実際、大きなものを少し垣間見ただけで、この小さなケースが多くのことを考えるきっかけとなった。
1.DeepSeekの「オープンソース+新しいトレーニング方法+低コスト+高性能」は、国内の競合他社が平穏な正月を迎えることを困難にする可能性が高い。
1.DeepSeekの「オープンソース+新しいトレーニング方法+低コスト+高性能」は、国内の競合他社が平穏な正月を迎えることを困難にする可能性が高い。
昨年はOpenAIのSoraがAIコミュニティに良い年越しをする方法を与えませんでしたが、今年は中国のDeepSeekです。
MetaのAI部門でDeepSeekがパニックを引き起こしたというRedditの投稿にあるMetaの従業員の発言から、米国のAI大手は1月をさまよった可能性が高い。
ディープシークの衝撃を前に、張芸銘、馬化騰、楊子林、王小川、李開福が今何をし、何を考えているのか、実はとても気になる。
そこで、私はDeepseekでこのような質問をしました -
「もしあなたがDeepseekの影響に直面しているとしたら」。もしあなたがOpenAIのCEOであるSam Altmanで、DeepSeeK R1リリースのニュースとそれに対する反応にざっと目を通し、すぐにこの件に関する会社の中核技術スタッフの緊急会議を招集し、会議の冒頭だけで3分間話したとしたら、あなたは何を話したでしょうか?"
Deepseekは入念にパスを分析し、サム・アルトマンはこうスピーチを締めくくった -
2.すべてのキューワードはDeepSeek R1で再試行する価値がある
たとえば、学部生のインターンが来て、今度は博士課程の学生が来たとしたら、彼と一緒にリーダーとして、同じタスクのために彼に言うことを調整しなければなりません。
ディープシークR1のトレーニングプロセスでは、コールドスタートデータとフォーマットインセンティブを導入し、出力構造の指定を強制しています(think
さらに、複数のテストによって、R1はキューの形式に敏感であり、ゼロサンプルのセットアップの方がうまくいくことが示されています。一方、低サンプルのキューは「考えすぎ」によって効率が悪くなる可能性があり、ユーザーがキューの構造を再設計する必要があることを示唆しています(たとえば、明確なステップバイステップの分割など)、
3.ディープシークR1の思考プロセスの価値は過小評価されている。
「一度に一歩ずつ考えてください」という思考連鎖のプロンプトを含む他のモデルとは異なり、Deepseek R1は実際の思考であり、機能が限られているため、他のモデルのように「思考を見せる」ものではありません。他のモデルが限られた機能のために行うように、「思考を実行する」のです。
過去のモデルの思考連鎖(CoT)能力は、モデルのサイズとデータカバレッジに依存しており、中間ロジックの厳密な検証を欠いた実世界の経験において、一見論理的なステップを生成することがよくありました。中間ロジックの厳密な検証。
ディープシークR1のthink
私の個人的な経験では、多くの場合、Deepseek R1の思考プロセスを読む方が、読むよりも得るものが多く、モデルの能力の限界をより高く評価できます。
4.DeepSeekの見落とされやすい貢献は、国内のユーザーにとって、高次AIへの障壁を初めて劇的に下げたことです。
実際、ChatGPT、Claude、Geminiの高次モデルは、テキスト作成やコード生成など、多くの分野で非常に高いレベルに達している。
この洗練されたレベルについては、別のブログ記事で長い説明を書きましたが、誰もが知っている理由から、中国の大多数のユーザーが実際に利用できるわけではありません。
このことが認識のギャップを生んでおり、ほとんどの人がAIを、今日のAIフレーバーである「一にも二にも、一言で言えば」と言うだけの平凡なAIと同じだと考えている
そしてDeepSeek R1は、中国の平均的なユーザーがXXを使うことなく初めて無料で使える唯一のC-suite製品です。
そのため、上記のケースは微博に投稿され、多くのユーザーが「すごい!すごい!」「拭いた!」という声が多く寄せられた。上記のケースが微博に投稿され、非常に多くのユーザーが「すごい!」、「すげえ!」、「すごすぎる」、「本質に迫る」という感嘆詞を発信した理由もそこにある。
実際には、同じコンテンツは、多くは相対的な静けさの性能にクロード-ソネット3.5インスタントネチズンを使用していました。
5.DeepSeekの欠点について1つ言うならば、それは時々「押しが強すぎる」
5.left;">「強すぎる」というのは、プロンプトのいくつかを入力するときに、プロンプトの効果を達成するためにやっていることをうまくコントロールできないことがあるということです。
例を挙げます。 私が娘に読ませるストーリーを生成していたとき、プロンプトに「リッチ」という単語を追加すると、DeepSeekは次のようなテキストを生成しました。--
明らかに、DeepSeekの出力は言葉が多すぎて子供向けではない。
もちろん、「言葉が多い」という言葉を削除するか、「ディープ・シンキング」タグを閉じれば、簡単に修正できます。これは実は「鶏口となるも牛後となる」から来る「嬉しい悩み」なのだ。
さらに、個人的な経験では、DeepSeekのインターネット検索は国内ページを優先するようで、英語のサイトやコンテンツを検索するように指定しても、国内ページの検索結果が多く混じってしまうので、そのよく知られた理由と何か関係があるのだろうか。
6.「国産AIの台頭に対する米国の規制」はナンセンス
DeepSeekの証明は同じものではないという議論があります。DeepSeekが証明した「国産AIの台頭に対する米国の規制」ですが、実際に微博でこのトピックを立てた人がいるようで、私から言わせれば純粋にナンセンスです。
DeepSeekの躍進は確かに印象的だが、それを米国のチップ封鎖のせいとするのは、純粋に見栄のためだ。
ディープシーク自身は、禁輸措置の前に大量のNVIDIAチップを買いだめしており、その膨大な数のチップによって、ある意味でディープシークはユートピア的な技術発見を実践することができた!"(レオンのインタビューの引用)。
実際、中国人工知能産業発展連盟(China Artificial Intelligence Industry Development Alliance)のデータによると、中国のAIサーバー市場におけるエヌビディアのシェアは、2024年でも85%になるという。
もう1つの未検証の統計は、Metaが所有するハイエンドのNVIDIAチップの数だけで、この国の全首脳の合計を上回るというものだ。
DeepSeekの革新性だけで、アメリカと中国の絶対的な演算量に大きな差があるという事実を変えることはまだ不可能であり、シリコンバレーのAI工場で "資源の呪い "に遭遇し、現在のDeepSeekがオープンソースモデルのリーダーとして評価されないことは明らかである。「これは明らかに客観的ではない。
7.AIの「消費者コンテンツ時代」はここにある!
それは何を意味するのか?DeepSeek R1に代表される高レベルAIは、コンテンツ制作のための「アーティスト・チューリング・テスト」に合格間近です。
これは、AIが生成したテキストなのか、アーティストが作成したテキストなのか、人々がもはや見分けがつかないことを意味し、「消費者向けコンテンツの時代」の兆候である。
「AIコンシューマー・コンテンツの時代」が意味するところは多く、文学や芸術が次第に「混沌の時代」という新たな局面を迎え、旧来の創作体制や制作構造が次第に崩壊し、コンテンツ分野がAIに依存することを意味する。それは、旧来の創作システムと生産構造が徐々に崩壊していくことを意味し、コンテンツ分野において人々の「オリジナリティ+クオリティ+高頻度」に依存するという不可能な三角形が緩み始めることを意味し、科学技術と人文科学を複合した「π」型人材は、単一の「T」型人材よりもはるかに多くの人材を抱えている可能性があることを意味する。「型人才拥有更多的结构性优势,意味着很多......。
しかし、何があろうと、人とその創造性がすべてのコンテンツ制作の出発点であることに変わりはない。
AIは出発点なしに自動的に動くわけではなく、人間の創造的な指示は常にAI制作の出発点であることを忘れてはならない。実際、この記事は興味深い疑問から生まれた。
8.ディープシークR1のようなオープンエンドでハイレベルなAIを前にしたとき、一般人の戦略はやはり2つの言葉に集約される - もっと使う
8.それは、「AIを使うこと」です。align: left;">私たちがこれまで通常のAIのために蓄積してきた特定のスキルは、R1の高次AIの前では失敗する可能性が高いことは明らかですが、自分自身を明確に表現する方法や、ベイズ式に従って反復する方法といった一般的な原則は変わりません。
これは料理のようなもので、塩を入れて味を確かめ、さらに入れて水を加え、自然に火を知る。
新しい道具が出てきて、一度試してみて、期待通りに機能しないことがわかり、「そんなものだ」という結論に至って、二度と手を出さないという例を、私はたくさん見てきた。二度と触らない。
実際、ディープシークR1のようなモデルに直面したとき、出力が悪いという事実は、それよりも私たちにとって問題になる可能性が高い。
私の義理の娘は、Midjourneyを使用して、死のヴィンテージフィルムの感覚の絵を得ることができない描画し、 "1990コダック退色+光漏れ "奇妙なキーワードのこの種を試してみるのは難しい、Midjourneyはすぐに膝に。
単刀直入に言えば、モデルは本質的にあなたの犬と同じであり、長い時間をかけてあなたの様々なコマンドを理解することができるようになりますが、まず第一に、あなたは毎日散歩のためにそれを取らなければならない。
9.DeepSeekのリリースケイデンスからすると、リリースしないものの方がおそらく望ましい
DeepSeekのリリースケイデンスに気づいている人はほとんどいない。12月26日にV3を、1月20日にR1をリリースするというテンポで、その間わずか24日しかありません。
同社のリリースケイデンスがどのように決定されているのかは知らないが、OpenAIが発表のたびにGoogleを正確にブロックして見せたような生意気さは明らかにないと考えていいだろう。棚にあるのは、エレガントな論文とクールなオープンモデルだけだ。
妥当な推測では、ディープシークは通常のリリーススケジュールを無視できるだけの技術をパイプラインに持っている。
その意味で、平均年齢25歳、100人以上の若いチームであるディープシークが、2025年に他に何を業界にもたらすかを待つ価値はあります。
10.梁文峰は過小評価される可能性が高い
マーク・アンドリーセン、サティア・ナデラ、ヤン・ルクンらシリコンバレーのトッププレイヤーたちがDeepSeekを「東洋からの神秘的な力」と見るとき、彼らは本質的に、中国チームが技術の応用というよりも、むしろ技術の進化の方向性を定義し始めていることを認めているのです。
梁文峰の独自性は、彼が定量投資の体系的思考、地元コミュニティの現実主義的精神、シリコンバレー式技術の理想主義を備えているという事実にあり、ディープシークのMLAアーキテクチャとMoEスパース構造は、国内チームが大規模モデルの分野で根本的な注目メカニズムに革命を起こした初めてのことを示す。
PinPlayのLuo Yihangは長い記事の中で、DeepSeekを「AIのPinduoduo」と比較するのは偏っていると主張した。ディープシークとレオンは明らかに単純にレッテルを貼ることはできないので、洞察に満ちた発言だと思う。
インスタントネットユーザーの@Chris-Suは、梁文峰はまだ「広く解釈され、学ばれていない」数少ないトップCEOの一人だと述べた。
私が知る限り、これは国内の技術開発の歴史においてかつてなかったことだ。
その意味で、すでに格好の記事の主人公となっている梁文峰は、まだまだ過小評価されている公算が大きい。
おわりに
今日の記事の最後に、フランスのヌーヴェルヴァーグ監督トリュフォーの言葉を引用して終わります。
"めちゃくちゃ野心的で、めちゃくちゃ誠実であれ。"