المصدر: Shenzhen Tencent News
لا يتشارك الناس أفراحهم وأحزانهم. منذ عام 2016، وهو العام الأول للذكاء الاصطناعي، مرت صناعة الذكاء الاصطناعي بعدة جولات من التعديلات. وبفضل موجة ChatGPT، حركت DeepSeek سوق النماذج الكبيرة بالكامل مثل سمك السلور. وبالمقارنة بها، فإن الشركات الناشئة الأخرى للنماذج الكبيرة، والتي تعتبر "ستة تنانين صغيرة" في الصناعة، في وضع حيث تشرق الشمس في الشرق ويسقط المطر في الغرب. بعد أن صدمت شركة DeepSeek الصناعة بجهازها منخفض التكلفة DeepSeek-V3، والذي يتميز بأداء مماثل لـ GPT-4o، أصدرت طراز R1 في 20 يناير. بعد ستة أيام من إطلاقه، تصدر قائمة التنزيلات العالمية لمتجر تطبيقات Apple، وتجاوز إجمالي عدد مرات تنزيله 110 مليون مرة في غضون شهر واحد من إطلاقه. خلال هذه الفترة، أطلقت شركات الخدمات السحابية الكبرى بسرعة الإصدارات مفتوحة المصدر V3 وR1، كما تبنت منتجات مثل Baidu Search وWeChat تقنية DeepSeek بشكل نشط.
إن نموذج التعزيزالعالمي الخاص بشركة Kimi k1.5 ونموذج الاستدلال المتدرج Step R-mini، اللذين تم إصدارهما في نفس الوقت مع DeepSeek، قريبان من o1 في العديد من جوانب قدرات النموذج، لكنهما لا يزالان غارقين في الرأي العام الساخن حول DeepSeek.
بالمقارنة مع ضجيج DeepSeek، فإن "التنانين الستة الصغار" كسروا الأخبار واحدة تلو الأخرى: تم تقسيم Zero One Everything بشكل أكبر، ولم يتم تسوية قضية الميزانية والتحكيم في Dark Side of the Moon، واستقال مسؤول تنفيذي كبير آخر في MIniMax...
وخلف هذا، يقف المستثمرون المغامرون المحبطون: لم يصل أي من المشاريع المدعومة بأموال حقيقية إلى شعبية DeepSeek. في الوقت الحاضر، لم تصدر أربعة من "التنانين الستة الصغيرة" أي أخبار تمويلية منذ أكثر من نصف عام. في عام 2024، أعلنت الصناعة أن اثنين من "التنانين الستة الصغار" قد تخلفا عن الركب. في عام 2025، من سيكون التالي في التخلف عن الركب؟
ثلاث شركات فقط تواصل التركيز على النماذج الكبيرة
لم تكن شعبية DeepSeek خالية من العلامات. فمنذ إطلاق أول طراز لها، DeepSeek Coder، في 2 نوفمبر 2023، تم إطلاق أكثر من 10 إصدارات مختلفة من الطراز في أكثر من عام. من بينها، يتميز طراز V2 الذي تم إصداره في مايو من العام الماضي بأداء مماثل لـ GPT-4 Turbo، لكن سعره لا يزيد عن 1% من GPT-4. لذلك، يُطلق على DeepSeek لقب "جزار الأسعار" و"Pinduoduo في عالم الذكاء الاصطناعي"، كما أشعل الجولة الأولى من حرب الأسعار في صناعة النماذج الكبيرة.
في 27 يناير 2025، تجاوز DeepSeek تطبيق ChatGPT وتصدر قائمة التطبيقات المجانية في متجر تطبيقات Apple في الصين والولايات المتحدة، مما جذب انتباهًا عالميًا. ما يجعل DeepSeek ناجحًا جدًا هو نموذج الاستدلال الكبير DeepSeek-R1. وبحسب المعلومات التي نشرتها شركة DeepSeek، فإن نتائج R1 في العديد من الاختبارات المعتمدة قريبة من نتائج الإصدار الرسمي o1، وفي بعض الاختبارات، تتجاوز النتائج نتائج الإصدار الرسمي o1.
بالإضافة إلى التصنيفات، فإن المصدر المفتوح + الفعالية من حيث التكلفة هما المزيج المهم الذي يجعل DeepSeek شائعًا للغاية. كما أعلن مؤسس شركة Baidu، روبن لي، الذي كان يؤمن في السابق بالبرمجيات المغلقة المصدر، أنه سينضم إلى فريق البرمجيات المفتوحة المصدر، متأثرًا بمشروع DeepSeek. كما أشار مؤسس شركة OpenAI، سام ألتمان، إلى أن الشركة كانت دائمًا على "الجانب الخطأ" في استراتيجيتها للبرمجيات المفتوحة المصدر.
أصدرت MiniMax، إحدى "التنانين الستة الصغيرة" للنماذج الكبيرة، أول نموذج مفتوح المصدر لها في 15 يناير. كما قال مؤسسها يان جونجي في مقابلة مع "Late Post" "لم يكن لدي الكثير من الخبرة عندما بدأت عملًا تجاريًا لأول مرة. إذا كان بإمكاني الاختيار مرة أخرى، فيجب أن أجعله مفتوح المصدر في اليوم الأول". من بين التنانين الخمسة الصغيرة الأخرى، كان Zhipu هو أول من سار على قدمين: مفتوح المصدر ومغلق المصدر. بعد ما يقرب من عامين من العمل الجاد، ذهب اتجاه تطوير "التنينات الستة الصغيرة" في اتجاهات متعاكسة.
كانت شركة Lingyi Wanwu أول شركة نموذجية كبيرة أساسية تجري تعديلات كبيرة علنًا. فقد قامت أولاً بتسريح فريق خوارزمية ما قبل التدريب وفريق البنية التحتية، وانضم بعض الموظفين إلى Alibaba من خلال القفز من السفينة. وفي وقت لاحق، أعلنت عن إنشاء مختبر مشترك للنماذج الصناعية الكبيرة وقاعدة للنماذج الصناعية الكبيرة مع Alibaba Cloud وSuzhou High-tech Zone على التوالي.
من حيث الموظفين، استقال كل من هوانغ وينهاو، رئيس تدريب النماذج، ولان يوتشوان، الذي كان مسؤولاً عن منصة API المفتوحة للنماذج الكبيرة، وكاو دابنغ، الذي كان مسؤولاً عن منتجات الإنتاجية. حاولت شركة Zero One Everything البقاء على الطاولة، لكنها لم تتمكن من تغطية أدائها المتراجع في هذه الجولة من المنافسة على النماذج واسعة النطاق. أوضحت شركة Baichuan Intelligence أنها ستدخل المجال الطبي في عام 2024، وأطلقت مؤخرًا أول "طبيب أطفال بالذكاء الاصطناعي". لا يبدو أن شركة Baichuan تسير على ما يرام في تسويق To B. فقد ترك مؤسسها المشارك ورئيس التسويق Hong Tao الشركة منذ سنوات. قال أحد موظفي Baichuan إن الأداء كان بالفعل أقل من التوقعات. "الآن بعد أن أصبح لدينا DeepSeek، زاد الضغط هذا العام فقط." p>
كان الشخص الآخر المسؤول عن تسويق To B الذي استقال هو Wei Wei من MiniMax. في السابق، قال Wei Wei في مقابلة أن العديد من عملاء B-side لن يدفعوا بسهولة لدعم إيرادات شركات النماذج الكبيرة. يمكنهم فقط الاعتماد على قدرات البحث والتطوير والخوارزمية لمساعدة العملاء على محاذاة تأثيرات الناتج في السيناريوهات الفعلية، مما أثبت أيضًا أن تسويق النماذج الكبيرة ليس بالأمر السهل.
يبدو أن الشركات الوحيدة التي لا تزال تركز على ابتكار تكنولوجيا النماذج واسعة النطاق والسعي إلى تحقيق الذكاء الاصطناعي العام هي Dark Side of the Moon، وWisdom Spectrum، وStep Star. متأثرًا بـ DeepSeek، انضم Step-Xingchen أيضًا إلى معسكر المصدر المفتوح. والفرق الوحيد بين Step-Xingchen وDeepSeek، الذي يركز على نماذج النصوص، هو أن أحدث نماذج المصدر المفتوح لـ Step-Xingchen عبارة عن نموذجين متعددي الوسائط - Step-Video-T2V وStep-Audio. في الصباح الباكر من يوم 23 فبراير، أصدر الجانب المظلم من القمر ورقته البحثية الأخيرة "الميون قابل للتطوير للتدريب على مستوى الماجستير في القانون" وجعل نموذج MoE Moonlight مفتوح المصدر، والذي يتطلب فقط معلمات تنشيط النموذج 3B. يعتقد العديد من المطلعين على الصناعة أن هذا "اعتراض لأسبوع المصدر المفتوح" لأن DeepSeek أعلنت سابقًا أنها ستصدر مشاريع مفتوحة المصدر لمدة خمسة أيام متتالية. وبالنسبة لشركة Dark Side of the Moon، ربما تكون المشكلة الأكثر إلحاحًا هي منتجات Kimi، التي استثمرت فيها الشركة بكثافة.
من الصعب أن تصبح اللاعب الأول من خلال إنفاق الأموال والاستثمار في حركة المرور
مثل "ستة تنانين صغيرة" من النماذج الكبيرة، تمتلك DeepSeek أيضًا منتجًا من الفئة C يحمل نفس الاسم، والذي لم يجذب الكثير من الاهتمام في السوق في الأسبوع الأول بعد إطلاقه. وبحسب البيانات التي كشفتها شركة QuestMobile لوسائل الإعلام، فإنه في الفترة من 13 يناير إلى 19 يناير 2025، بلغت عمليات التنزيل الأسبوعية لتطبيق DeepSeek 285 ألف عملية تنزيل فقط، وهو أقل بكثير من Doubao (4.52 مليون) وKimi (1.557 مليون).
بعد إصدار R1 في 20 يناير 2025، بدأت عمليات تنزيل DeepSeek في النمو بشكل حاد. فقد أظهرت أبحاث Sensor Tower أن DeepSeek تم تنزيله أكثر من 16 مليون مرة في غضون 18 يومًا من الإطلاق، أي ما يقرب من ضعف عدد مرات تنزيل ChatGPT من OpenAI البالغ 9 ملايين مرة عندما تم إصداره لأول مرة.
لقد تسبب الارتفاع الكبير في عدد الزيارات في تعطل DeepSeek في مرحلة ما، ولكن على الرغم من ذلك، لا يزال زخم النمو قوياً، حيث تجاوز عدد التنزيلات الشهرية 110 مليون. لا يمكن لأي شركة تجاهل براعة DeepSeek. في اجتماع الموظفين الداخلي لشركة ByteDance في 13 فبراير، تحدث الرئيس التنفيذي Liang Rubo عن DeepSeek وأشار إلى أن سرعة المتابعة لم تكن سريعة بما يكفي، وأنه سيسعى هذا العام إلى الإطلاق الذكي.
أجرى اختبار تدرج الرمادي على تطبيق WeChat التابع لشركة Tencent اتصالاً مع بحث الذكاء الاصطناعي الخاص بـ DeepSeek، وبعد أن تجاوز الاستخدام التوقعات، تم استدعاء تطبيق الذكاء الاصطناعي Yuanbao لدعم بحث WeChat. في 22 فبراير، تجاوز تطبيق Tencent Yuanbao تطبيق Doubao التابع لشركة ByteDance وارتفع إلى المركز الثاني في تصنيفات تنزيل تطبيقات Apple المجانية في الصين، بينما استمر تطبيق DeepSeek في تصدر القائمة.
تغيرت ملكية "الأخوين الكبيرين رقم 1 ورقم 2" في شهر واحد فقط، مما أجبر دوباو وكيمي، اللذين كانا يحرقان الأموال من أجل النمو، على خسارة ميزتهما. الفرق بينهما هو أن الأول هو أرستقراطي ولد بـ "مفتاح ذهبي"، بينما الثاني هو "رائد أعمال جديد". وكانت تقديرات إعلامية سابقة قد أظهرت أن إنفاق كيمي اليومي على قناة الآيفون وحدها كان يقترب من 200 ألف يوان، في حين بلغ إنفاق دوباو 2.48 مليون يوان.
تحت تأثير DeepSeek، وردت تقارير مؤخرًا تفيد بأن Dark Side of the Moon قد خفضت ميزانية إطلاق منتجاتها بشكل كبير، بما في ذلك تعليق عمليات الإطلاق على قنوات Android المتعددة والتعاون مع منصات إعلانية تابعة لجهات خارجية. وفقًا لأحد المطلعين الذي كشف لـ AI Light Years، فقد تم تعديل الترويج بالفعل وفقًا لذلك، "هناك إضافات طبيعية، لكن لا يمكن مقارنتها بنمو DeepSeek."
لا تقتصر مشاكل كيمي الحالية على هذه: علمت "Undercurrent Waves" حصريًا أن قضية التحكيم الخاصة بكيمي، والتي تم تعليقها لفترة طويلة، لم يتم تسويتها كما هو متوقع، ولكنها دخلت العملية التالية لقضية التحكيم. وبحسب مصادر مطلعة، فإن الطرفين في قضية التحكيم في كيمي، المساهمين القدامى في شركة سيركولار إنتليجنس ويانغ تشيلين، وغيرهما، قد أكملوا الدفع في مركز التحكيم الدولي في هونج كونج في نهاية يناير وأواخر فبراير على التوالي، وتم تشكيل المحكمة. قد يتم مقاضاة تشانغ يوتونغ، الشخصية الأكثر أهمية وراء الحادث بأكمله، بشكل منفصل.
تضع شركة MiniMax أيضًا آمالًا كبيرة على منتجات To C لأن منتجها النجمي Talkie أصبح رابع أكثر تطبيقات الذكاء الاصطناعي تنزيلًا في الولايات المتحدة في النصف الأول من عام 2024، مما يجعلها تجني الحلاوة. ولكن الأوقات الطيبة لم تدم طويلاً. ففي منتصف ديسمبر/كانون الأول، اختفى تطبيق Talkie بهدوء من متجر تطبيقات Apple في السوق الأمريكية، في حين لم يتأثر نظام التشغيل Android.
تمتلك كل من Step Star وZero One Everything وZhipu AI وBaichuan Intelligence أيضًا منتجات تطبيقات الذكاء الاصطناعي الخاصة بها، ولكن وفقًا لقائمة منتجات الذكاء الاصطناعي، في يناير 2025، لم يكن أي من أفضل 20 تطبيقًا للذكاء الاصطناعي مع المستخدمين النشطين شهريًا مرتبطًا بهذه الشركات المصنعة الأربعة. في السابق، قال أحد موظفي Baichuan Intelligence لـ AI Light Years، "ليس من المستغرب أن يكون معدل الاحتفاظ بالمستخدمين ونمو Baixiaoying ضعيفًا للغاية. نحن في الأساس لا نقوم بأي إعلانات، ونسمح للشركات الأخرى بإنفاق الأموال لإكمال تعليم المستخدم أولاً." حاليًا، تحتل DeepSeek وTencent Yuanbao وByte Doubao المراكز الثلاثة الأولى في تصنيفات تنزيل تطبيقات Apple المجانية. إذا أرادت "ستة تنانين صغيرة" من النماذج الكبيرة أن تدخل القائمة، فإن المنافسة سوف تزداد حدة. بالنسبة لشركة Nano Search، التي تحتل المرتبة السابعة حاليًا، تقوم Zhou Hongyi بالترويج للمنتجات شخصيًا.
وهناك منافس آخر لا يمكن تجاهله وهو علي بابا. فبعد دمج شركة تونغي لتطبيقات الذكاء الاصطناعي في مجموعة علي بابا لتكنولوجيا المعلومات الذكية، أطلقت شركة علي بابا للذكاء الاصطناعي مؤخرًا عملية توظيف واسعة النطاق، مع مئات الوظائف، تركزت في وظائف البحث والتطوير للمنتجات والتكنولوجيا المتعلقة بنماذج الذكاء الاصطناعي الكبيرة. هناك ذئاب في المقدمة ونمور في الخلف، وهو تصوير حقيقي للوضع الحالي لـ "التنانين الستة الصغيرة" في النموذج الكبير.
عندما لم تعد قصة التكنولوجيا رومانسية، والتسويق ليس كما هو متوقع، ونمو المستخدمين النشطين شهريًا للمنتج لا يتناسب مع الاستثمار، فإن النموذج الكبير "ستة تنانين صغيرة" هو مثالي ولكن الواقع ضئيل.
سيتم رفع عتبة الجولة التالية من التمويل
من المعروف أن التدريب المسبق للنماذج الكبيرة يحرق المال. كشف كاي فو لي ذات مرة أن تكلفة التدريب المسبق تبلغ حوالي ثلاثة إلى أربعة ملايين دولار أمريكي. حتى أن Yi-Lightning الأقل تكلفة استخدمت 2000 وحدة معالجة رسومية للتدريب، والتي استغرقت شهرًا ونصفًا وتكلف أكثر من ثلاثة ملايين دولار أمريكي.
على الرغم من أن DeepSeek تدعي أنها منخفضة التكلفة، إلا أنه من الصعب تقدير استثمارها الأولي. تقدر منظمة SemiAnalysis التابعة لجهة خارجية أن DeepSeek لديها في الواقع احتياطي ضخم من قوة الحوسبة: ما مجموعه 60000 بطاقة معالجة رسومية من NVIDIA، بما في ذلك 10000 بطاقة A100، و10000 بطاقة H100، و10000 بطاقة H800 "الإصدار الخاص"، و30000 بطاقة H20 "الإصدار الخاص". "نقدر تكلفة تدريب نموذج كبير عام بحوالي مليار دولار أمريكي. هذا هو جزء قوة الحوسبة فقط، ولا يشمل الجزأين الآخرين الباهظين الثمن، أحدهما هو البيانات، والآخر هو تكلفة العمالة. المواهب في مجال النماذج الكبيرة نادرة جدًا في العالم الآن." قال الدكتور دو فنغ، الشريك المؤسس لشركة Jiangmen Venture Capital والرئيس السابق لشركة Microsoft Ventures Greater China، للمؤلف ذات مرة.
نظرًا للاستثمار المرتفع المطلوب، هناك مقولة شائعة في الصناعة منذ فترة طويلة: تذكرة الدخول للاستثمار في شركات النماذج واسعة النطاق هي 100 مليون دولار أمريكي. هناك إشارة أخرى وراء هذه الجملة وهي أن أي شركة ناشئة واسعة النطاق سوف تجد صعوبة في البقاء إذا لم تتمكن من الحصول على التمويل.
بعد أن بدأت حرب المائة نموذج في عام 2023، تم إصدار أخبار التمويل كل شهر تقريبًا. ومع ذلك، مع تزايد شعبية نظرية فقاعة الذكاء الاصطناعي، بدءًا من سبتمبر 2024، لم تكن هناك أموال ساخنة بمئات الملايين تتدفق إلى "ستة تنانين صغيرة" من النماذج الكبيرة لفترة طويلة. ولم تعلن شركة تشيبو وشركة جييويكسينجشين عن تلقيهما "أموال الشتاء" إلا قبل عيد الربيع في عام 2025. وأعلنت شركة تشيبو عن استكمال جولة جديدة من التمويل بقيمة 3 مليارات يوان، وأكملت شركة جييويكسينجشين جولة تمويل ثانية بقيمة مئات الملايين من الدولارات. لقد مر أكثر من نصف عام منذ آخر تحديث للتمويل للشركات الأربع الأخرى من "التنانين الستة الصغيرة": أعلنت شركة MiniMax رسميًا عن استكمال 600 مليون دولار أمريكي في تمويل السلسلة B في مارس من العام الماضي، وحصلت شركة Baichuan Intelligence على 5 مليارات يوان صيني في تمويل السلسلة A في يوليو من العام الماضي، وأكملت شركة Zero One Everything جولة جديدة من التمويل بمئات الملايين من الدولارات في أغسطس من العام الماضي، وأكملت شركة Dark Side of the Moon تمويلًا بقيمة 300 مليون دولار أمريكي في أغسطس من العام الماضي.
خلال مهرجان الربيع، أصبح DeepSeek مشهورًا في جميع أنحاء العالم، وكان الرأي العام سخيًا في الثناء على DeepSeek ومؤسسها Liang Wenfeng. في دائرة رأس المال الاستثماري، كان هناك الكثير من الأخبار المتداولة مؤخرًا حول ما إذا كانت DeepSeek ستبدأ التمويل وما سيكون تقييمها.
وقد أشارت تقارير سابقة إلى أن علي بابا ستستثمر مليار دولار أمريكي للحصول على حصة تبلغ 10% عند تقييم يبلغ 10 مليار دولار أمريكي. وردًا على ذلك، دحض نائب رئيس علي بابا يان تشياو هذه الشائعة بسرعة عبر تطبيق WeChat Moments، قائلًا: "المعلومات المتداولة في الخارج والتي تفيد بأن علي بابا استثمرت في DeepSeek هي أخبار كاذبة". وفي وقت لاحق، أفادت وسائل إعلام أجنبية أن "شركة DeepSeek تفكر في جمع أموال خارجية لأول مرة". ونفى أشخاص مرتبطون بشركة DeepSeek هذه الشائعة، قائلين إن أخبار التمويل كانت مجرد شائعات.
"لقد تواصل العديد من المستثمرين مع ليانج ونفينج بشكل مباشر أو من خلال علاقاتهم. أتوقع أن يكون التقييم أعلى بكثير من "Big Six Little Dragons" الحالية." قال أحد المستثمرين من CICC Capital، "أصبحت DeepSeek معيارًا. من الواضح أن عتبة "Big Six Little Dragons" للحصول على تمويل جديد في السوق الأولية أعلى."
في الواقع، منذ بدء طفرة ريادة الأعمال النموذجية الكبيرة، لا تعتقد الصناعة عمومًا أن "Big Six Little Dragons" يمكن أن تنجو في النهاية كـ "شركات نموذجية كبيرة" مستقلة. أعرب العديد من مؤسسي "ستة تنانين صغيرة" أيضًا عن آراء مماثلة في العلن. على سبيل المثال، يعتقد يان جونجي، مؤسس شركة ميني ماكس، أنه لن يتبقى في العالم في المستقبل سوى خمس شركات نموذجية كبيرة. "قال تشنغ هاو، مؤسس شركتي Xunlei وYuanwang Capital، للمؤلف ذات مرة: "ستمتلك الصين بالتأكيد برنامج ChatGPT الخاص بها. تمامًا مثل محركات البحث، لدينا متطلبات الامتثال الخاصة بنا. لكن النسخة الصينية من برنامج ChatGPT لن يتم إنتاجها إلا بواسطة خمس شركات: BAT + ByteDance + Huawei".
مع استمرار الشعبية، فإن "التنانين الستة الصغيرة" التي كانت تتجه بالفعل نحو التمايز سوف تعمل على تسريع عملية إعادة التشكيل.