المؤلف: teafox; المصدر: Tea Fox يرى العالم
هذا عصر انفجار المعلومات إنه أيضًا عصر التلوث المعلوماتي الخطير. ولذلك، لن أثق بأي معلومة بسذاجة، خاصة في مواجهة الفوائد الكبرى، وسأكون أكثر "شككاً". بالنسبة لي، أفضل طريقة للقضاء على تلوث المعلومات هي المقارنة والنظر في كل من الإيجابيات والسلبيات.
في الـ 48 ساعة الماضية، قضيت كل وقتي تقريبًا على X، أتصفح الأخبار المختلفة حول Deep Seek في العالم الناطق باللغة الإنجليزية، هناك بشكل أساسي مراجعات إيجابية للغاية، في هذا الوقت، كنت أرغب حقًا في رؤية التعليقات السلبية، وبعد البحث حولها، كانت هناك بالفعل.
مقسمة بشكل أساسي إلى فئتين:
فئة واحدة للعكس، وخاصة أن بعض الأشخاص المناهضين للصين في الخارج سوف يقدمون تعليقات سلبية على أي أخبار عن الصين. وهذا النوع من المعلومات هو مجرد هراء. لكن من الجيد إلقاء نظرة، على الأقل يمكنك معرفة شكل القمامة.

النوع الآخر هو التعليقات السلبية من المطلعين على الصناعة. الصوت الأول والأكثر تشددًا يأتي في الواقع من أحد المطلعين على الصناعة الصينية - ألكسندر وانغ.
بادئ ذي بدء، اسم هذا الشخص غريب بعض الشيء عندما رأيته لأول مرة، اعتقدت أنه خطأ إملائي من CNBC بشكل عام، ألكسندر هو الاسم الأكثر شيوعًا باللغة الإنجليزية. كما أن نموذج التهجئة هو الإصدار المقبول عالميًا. Alexandr هو الشكل الإملائي لبعض لغات أوروبا الشرقية (مثل الروسية والتشيكية وغيرها). من الغريب بعض الشيء أن يحمل أمريكي صيني اسمًا من أوروبا الشرقية. لكن عندما ألقيت نظرة فاحصة، كان ألكسندر بالفعل.
ثانيًا، هذا السيد وانغ ليس له اسم غريب فحسب، بل يتمتع أيضًا بخلفية فريدة. ولد عام 1997، وهو المؤسس والرئيس التنفيذي لشركة Scale AI. في سن الرابعة والعشرين، أصبح ألكسندر وانغ أصغر ملياردير "عصامي" في العالم. وفقًا لمجلة فوربس، تبلغ ثروته 2 مليار دولار اعتبارًا من يوليو 2024.
وهو ابن لمهاجرين صينيين، وكان والديه يعملان كفيزيائيين في مختبر لوس ألاموس الوطني، حيث وُلد مختبر الأسلحة النووية. ومن النادر جدًا أن يعمل الصينيون في هذا النوع من الوحدات.
كان ألكسندر شغوفًا بالرياضيات وبرمجة الكمبيوتر منذ أن كان طفلاً. تأهل لأولمبياد الرياضيات ضمن فريق الولايات المتحدة الأمريكية عام 2013. عندما كان مراهقًا، عمل كمبرمج برمجيات في Quora، النسخة الأمريكية من Zhihu. وفي وقت لاحق، درس علوم الكمبيوتر في معهد ماساتشوستس للتكنولوجيا، لكنه ترك الدراسة وأسس Scale AI، ليصبح معجزة الذكاء الاصطناعي في وادي السيليكون.
قال ألكسندر: لدى Deep Seek ما لا يقل عن 50000 بطاقة رسومات NVIDIA H100، ولكن ليس من المناسب قول ذلك بسبب العقوبات. بعد ذلك، شاهدت مقابلة قناة سي إن بي سي عدة مرات، وكانت كلماته الأصلية كما فهمت، دون أي دليل قوي.
وفقًا لـ Deep Seek، استخدم نموذج التدريب فقط 2048 بطاقة رسومية H800، وهي النسخة المخصّصة من H100، والسعر هو 100 H100 (30 ألف دولار) فقط للواحدة. ثلث . وبسبب استخدام الأجهزة المنخفضة الجودة على وجه التحديد، تنعكس القيمة المبتكرة لـ Deep Seek.

إذن، لماذا يشعر ألكسندر وانغ بالذعر؟
أنا لست خبيرًا في الذكاء الاصطناعي، ولكن بناءً على الكم الكبير من المعلومات التي قرأتها في الأيام القليلة الماضية، قد يكون Deep Seek بجعة سوداء عملاقة، وهي في وادي السليكون تتجول في السماء.
1/ حاليًا، تكلفة تدريب النماذج الكبيرة ذات المستوى الأعلى للذكاء الاصطناعي مرتفعة للغاية. تتطلب الشركات العملاقة مثل OpenAI مراكز بيانات كبيرة تحتوي على عشرات الآلاف من بطاقات الرسومات H100. تبلغ تكلفة كل قطعة ما لا يقل عن 30 ألف دولار أمريكي، ويبلغ السعر الإجمالي أكثر من مليار دولار أمريكي، كما أنها تستهلك الكثير من الكهرباء بحيث تتطلب محطة طاقة كاملة لتوفير الكهرباء. إنهم ينفقون مئات الملايين من الدولارات فقط لتدريب النماذج.
2/ يظهر برنامج Deep Seek ويقول: "هاها، ماذا لو أنفقنا 5 ملايين دولار لفعل هذا؟" إنهم لا يتحدثون فقط هذا كل شيء، ولكن لقد حدث بالفعل. حتى أن نموذج Deep Seek يتفوق على GPT-4 وClaude في العديد من المهام. أصبح عالم الذكاء الاصطناعي في وادي السيليكون مرتبكًا على الفور، وكان عبقري الذكاء الاصطناعي ألكسندر وانغ غير متماسك.
3/ كيف يقوم DeepSeek بذلك؟ إنهم يعيدون التفكير في كل شيء من الصفر. يشبه الذكاء الاصطناعي التقليدي كتابة كل رقم على شكل 32 منزلة عشرية. وقال DeepSeek: "ماذا لو استخدمنا 8 منازل عشرية فقط؟" ونتيجة لذلك، لا تزال الدقة كافية! وعلى الفور، يتم تقليل الذاكرة المطلوبة بنسبة 75%.
4/ ثم هناك نظامهم "متعدد العلامات". يقرأ الذكاء الاصطناعي العادي مثل طالب الصف الأول: "Goose... Goose... Goose... Qu... Xiang... Xiang... ...day...song"، اقرأ كلمة بكلمة. لكن DeepSeek يقرأ الفقرة بأكملها مرة واحدة. أسرع مرتين وأكثر دقة بنسبة 90%، وهو أمر مهم عندما تتعامل مع مليارات الكلمات.
5/ لكن الأمر الذكي حقًا هو أنهم قاموا ببناء "نظام خبير" بدلاً من استخدام ذكاء اصطناعي كبير يحاول فهم كل شيء (مثل وجود إنسان كن (طبيبًا، محاميًا، مهندسًا، نجارًا) في نفس الوقت، مع تفعيل خبراء محددين فقط عند الحاجة، مما يوفر الكثير من المعلمات.
6/ وماذا عن النموذج التقليدي؟ جميع المعلمات البالغ عددها 1.8 تريليون نشطة دائمًا. وفي الوقت نفسه، يحتوي DeepSeek على إجمالي 671 مليار معلمة، ويتم تنشيط 37 مليارًا فقط في المرة الواحدة. يشبه الأمر وجود فريق كبير ولكنك تستعين فقط بالخبراء الذين تحتاجهم حقًا لكل مهمة.
7/ النتائج صادمة، تكلفة التدريب: مئات الملايين من الدولارات → 5 ملايين دولار أمريكي. وحدة معالجة الرسومات المطلوبة: 100000 → 2000; تكلفة واجهة برمجة التطبيقات: أرخص بنسبة 95%؛ يمكن تشغيله على بطاقات رسومات الألعاب العادية، وليس على أجهزة مركز البيانات.
8/ الجزء الأكثر جنونًا - DeepSeek مفتوح المصدر (مجاني تمامًا). يمكن لأي شخص استخدامه، الكود عام. تشرح الورقة التقنية كل شيء، إنه ليس سحرًا، بل مجرد هندسة ذكية بشكل لا يصدق. إحدى الميمات الأكثر شيوعًا الآن هي Open AI → Closed AI (مغلق المصدر AI)، وتم استبدالها بـ DeepSeek، وهو Open AI الحقيقي (مفتوح المصدر AI).
9/ ما أهمية DeepSeek؟ لأنه يكسر الأسطورة القائلة بأن شركات التكنولوجيا الكبرى فقط هي التي يمكنها المشاركة في الذكاء الاصطناعي. لم تعد بحاجة إلى مركز بيانات بقيمة مليار دولار وعدد قليل من بطاقات رسومات الألعاب الجيدة للقيام بذلك.
10/ بالنسبة لـ Nvidia، هذا أمر مخيف. يعتمد نموذج أعمالهم بالكامل على بطاقات رسومية باهظة الثمن بهامش ربح يصل إلى 90%، على سبيل المثال، تعتبر H100، التي تباع بمبلغ يتراوح بين 30 ألف دولار إلى 40 ألف دولار، سلعة نادرة لا يمكن شراؤها حتى لو كان لديك المال. إذا تمكن الجميع فجأة من استخدام الذكاء الاصطناعي باستخدام بطاقة رسومات عادية للألعاب... حسنًا، أنت تعرف المشكلة.
11/ المفتاح هو: يضم فريق DeepSeek أقل من 200 شخص، لكن راتب فريق Meta وحده يتجاوز ميزانية تدريب DeepSeek بأكملها... ونموذج Meta لكنه ليس بجودة ديب سيك.
12/ هذه قصة كلاسيكية عن التعطيل: تعمل الشركات القائمة على تحسين العمليات الحالية، في حين يعيد القائمون على التعطيل التفكير في الأساليب الأساسية.
13/ DeepSeek يشبه الزلزال، والتوابع أكبر من اللازم: تطوير الذكاء الاصطناعي يصبح أسهل، وتشتد المنافسة، و"خنادق" شركات التكنولوجيا الكبرى تبدو أكثر مثل الخنادق، فقد انخفضت متطلبات الأجهزة (والتكاليف) بشكل ملحوظ.
14/ بالطبع، الشركات العملاقة مثل OpenAI لن تقف مكتوفة الأيدي. ولكن كل شيء يحتاج إلى تخريب، ولن يظل نموذجاً للعمل الجاد لتحقيق المعجزات.
DeepSeek، البجعة السوداء، سوف ترفرف بجناحيها وسيتأثر وادي السيليكون بأكمله ويمكن تلخيص التأثيرات على النحو التالي.
أزمة بدء تشغيل الذكاء الاصطناعي: قد يؤدي الأداء العالي لـ Deep Seek إلى إفلاس شركات الذكاء الاصطناعي الناشئة التي تشتري عددًا كبيرًا من بطاقات الرسومات NVIDIA ، إطلاق عدد كبير من وحدات معالجة الرسومات المستعملة. بالنسبة لألكسندر وانغ، الرئيس التنفيذي ومؤسس شركة Scale AI، هذه مسألة حياة أو موت، ومن المفهوم قول كلمات سيئة.
نكسة أعمال مركز البيانات: بالنسبة لمشغلي مراكز البيانات الكبيرة، سيتأثر نموذج أعمالهم الخاص بتأجير بطاقات الرسومات Nvidia.
عمالقة التكنولوجيا يبطئون عمليات الشراء: قد يقلل عمالقة التكنولوجيا من مشترياتهم من بطاقات الرسومات Nvidia بسبب تراكم المخزون.
النظرة المستقبلية لـ Nvidia مثيرة للقلق: قد يؤدي الجمع بين العوامل المذكورة أعلاه إلى تراجع عام في أعمال Nvidia.
في X، قال V المالي الكبير: من الأفضل ألا يكون البحث العميق هو الصفقة الحقيقية... ..) ثم أضاف صورة تقشعر لها الأبدان.

أعلى مستوى منذ 75 عامًا: يظهر الرسم البياني أن سوق الأسهم الأمريكية عند أعلى نقطة له منذ 75 عامًا.
الرائعة 7: يشير هذا المصطلح إلى عمالقة التكنولوجيا السبعة الأفضل أداءً في سوق الأسهم الأمريكية إلى حد ما ساهم في صعود سوق الأسهم الأمريكية.
فقاقعتان: فقاعة Nifty 50 في الستينيات وفقاعة الإنترنت في التسعينيات. أدت الفقاعتان إلى انهيار سوق الأسهم هذه المرة، لقد وصل برنامج Deepseek... فهل ستنهار سوق الأسهم الأمريكية؟

أخيرًا، نحن نلقي نظرة على الورقة التي نشرها فريق Deep Seek للتو في جامعة كورنيل. كل مؤلف يستحق أن نتذكره. معظمهم من الشباب الذين تقل أعمارهم عن 30 عامًا ويأتيون من أفضل الجامعات في البلاد .لا يزال بعضهم يدرسون للحصول على درجة الدكتوراه، ولا يتمتع أي منهم بخلفية أكاديمية في الخارج. ويظهر هذا مرة أخرى أن الصين قد لحقت بالولايات المتحدة في جودة التعليم الجامعي، وأن الصين ستتمتع بميزة عددية مطلقة في خريجي العلوم والتكنولوجيا والهندسة والرياضيات في العقود القليلة المقبلة.
كما قال مؤسس DeepSeek Liang Wenfeng: تكمن قيمتنا في الفريق، ونحن نواصل النمو وتجميع المعرفة المهنية من خلال هذه العملية. إن بناء فريق قادر على الاستمرار في الابتكار هو خندقنا الحقيقي. ص>