المصدر: سباق أرنب السيليكون
يمكن تقسيم المباني في العالم إلى نوعين. الأول هو السوق، الذي يكون مفتوحًا هناك كل يوم ويتم بناؤه من الصفر، من الصغير إلى الكبير؛ والأخرى هي الكنيسة، والتي تستغرق أجيالاً من العمل الشاق وعقوداً من الزمن لإكمالها. وهذا ما كتبه إريك رايموند في كتابه "الكاتدرائية والبازار".
قصة لينكس تشبه إلى حد كبير بناء كاتدرائية بطريقة السوق. اليوم، في مجال الذكاء الاصطناعي التوليدي، تساهم المزيد والمزيد من النماذج مفتوحة المصدر في ظهور حالات جديدة لمثل هذه "نماذج البناء".
تعتبر Alibaba Cloud من الشركات التي تسعى بقوة إلى تطبيق نموذج المصدر المفتوح. حاليًا، تجاوز عدد نماذج مشتقات Qwen من Tongyi 100000، متجاوزًا نموذج Llama الأمريكي، مما يجعل Tongyi أول نموذج مفتوح المصدر للذكاء الاصطناعي في العالم. في الصباح الباكر من يوم 29 أبريل، أصدرت شركة علي بابا الجيل الجديد من طراز Tongyi Qianwen Qwen3 (Qianwen 3 باختصار)، حيث يبلغ عدد المعلمات ثلث DeepSeek-R1 فقط، وهو 235B، كما تم تقليل التكلفة بشكل كبير.
يُقال إن Qianwen 3 هو أول "نموذج تفكير هجين" في الصين. يتم دمج "التفكير السريع" و "التفكير البطيء" في نفس النموذج. بالنسبة للاحتياجات البسيطة، يمكنه تقديم إجابات في ثوانٍ مع قوة حوسبة منخفضة، وبالنسبة للمشاكل المعقدة، يمكنه إجراء "تفكير عميق" في خطوات متعددة، مما يوفر استهلاك قوة الحوسبة بشكل كبير.
منذ عام 2023 وحتى الآن، قام فريق Alibaba Tongyi بتوفير أكثر من 200 نموذج مفتوح المصدر، بما في ذلك سلسلتين أساسيتين من النماذج، نموذج اللغة الكبير Qwen ونموذج التوليد المرئي Wan. يغطي المصدر المفتوح جميع الوسائط مثل نماذج توليد النصوص، ونماذج الفهم/التوليد المرئية، ونماذج فهم/توليد الكلام، والصور النصية المولدة ونماذج الفيديو، وتغطي جميع أحجام المعلمات من الصغيرة إلى الكبيرة لتلبية احتياجات المحطات المختلفة.
يبلغ الحجم الإجمالي للمعلمات الخاصة بـ Qianwen 3 235B، ويلزم 22B فقط للتنشيط. تصل كمية بيانات ما قبل التدريب لـ Qianwen 3 إلى 36T، ويتم استخدام جولات متعددة من التعلم التعزيزي في مرحلة ما بعد التدريب لدمج الأوضاع غير التفكيرية بسلاسة في نموذج التفكير.
كما انخفضت تكلفة نشر Qianwen 3 بشكل كبير. لا يتطلب نشر الإصدار الكامل من Qianwen 3 سوى 4 وحدات H2O، كما أن استخدام ذاكرة الفيديو يمثل ثلث استخدام النماذج ذات الأداء المماثل.
ماذا يعني إصدار نموذج علي بابا مفتوح المصدر بالنسبة للصناعة؟ ما هي إمكانيات نموذج المصدر المفتوح؟ إلى أين ستذهب مسابقة النماذج الكبيرة المستقبلية؟
01 تتسارع وتيرة تطور قدرات النماذج الكبيرة مفتوحة المصدر
تتسارع وتيرة تطور قدرات النماذج الكبيرة مفتوحة المصدر مع تطور النماذج المغلقة المصدر.
هذا هو الإجماع الذي توصل إليه المؤلف بعد إجراء مقابلات مع العديد من رواد الأعمال في مجال الذكاء الاصطناعي ومطوري النماذج الكبيرة من الشركات الكبيرة والمستثمرين.
ورغم أنهم يتفقون أيضًا على أن نموذج المصدر المغلق لا يزال في الصدارة اليوم، إلا أن الفجوة بين نموذج المصدر المفتوح ونموذج المصدر المغلق تضيق تدريجيًا، وهذه السرعة تتجاوز توقعات الصناعة.
"حقق النموذج المغلق المصدر في البداية درجة 90، ولكن الآن، يمكن للنموذج مفتوح المصدر أيضًا تحقيق مستوى 90،" كما قال أحد مطوري النماذج الكبار. قانون التوسع لديه دائما عنق زجاجة. المشكلة تكمن في أنه كلما كان النموذج أكبر، فإن تكلفة تحسين القدرات سوف تزيد بشكل كبير، مما يمنح نماذج المصدر المفتوح الوقت لمواكبة التطور.
ما الذي يفتحه نموذج المصدر المفتوح بالضبط؟ ما هو الفرق بينه وبين البرمجيات مفتوحة المصدر؟ وما الفرق عن النموذج المغلق المصدر؟ عادةً ما تكشف البرامج مفتوحة المصدر عن الكود المصدر الكامل، مما يسمح للمطورين بعرضه وتعديله. يمكن للمطورين اللاحقين إعادة إنتاج الوظائف المقابلة بسهولة استنادًا إلى الكود. ومع ذلك، فإن نماذج المصدر المفتوح لا تقدم عمومًا سوى معلمات المصدر المفتوح. من الصعب معرفة البيانات المستخدمة، وكيفية ضبطها، وكيفية محاذاتها. يوفر نموذج المصدر المغلق مجموعة كاملة من الحلول بشكل مباشر. يمكن فهم أن نموذج المصدر المفتوح يعتمد على المواد الموجودة، ويتطلب من الطهاة إعداد أدواتهم وقوائمهم وطرق البحث الخاصة بهم، ولكن إمكانية إعداد طبق جيد تعتمد كليًا على مهارات الطاهي. النموذج المغلق المصدر هو عبارة عن أطباق معدة مسبقًا ويمكن تسخينها واستخدامها.
ولكن ميزة النماذج مفتوحة المصدر هي أنهاتسمح لمزيد من المطورين بالمشاركة في تطوير النموذج، مما يساعد النموذج على تحسين الأداء وتحسين النظام البيئي، ويتمتع بمرونة قوية. يمكن أن يساعد هذا الشركات النموذجية على توفير قدر كبير من تكاليف القوى العاملة والوقت. وهي أيضًا طريقة لتوفير التكاليف للحزب باستخدام نموذج المصدر المفتوح.

ومع ذلك، فإن ميزة التكلفة لنموذج المصدر المفتوح لا تزال في مراحلها المبكرة. على سبيل المثال، تم حساب أن نموذج GPT-4 مغلق المصدر يكلف حوالي 10 دولارات لكل مليون رمز مدخل وحوالي 30 دولارًا لكل مليون رمز مخرج، بينما يكلف نموذج Llama-3-70-B مفتوح المصدر حوالي 60 سنتًا لكل مليون رمز مدخل وحوالي 70 سنتًا لكل مليون رمز مخرج، مما يجعله أرخص بحوالي 10 مرات، في حين أن فرق الأداء صغير جدًا. ولكن إذا كان الأمر يتطلب نشرًا لاحقًا، فإنه يتطلب قدرات تقنية واستثمارًا قويين للغاية.
ومع ذلك،يحل إصدار علي الجديد من Qianwen 3 أيضًا مشكلة الاستثمار في التكلفة تدريجيًا.إذا أخذنا إصدار علي الجديد من Qianwen 3 كمثال، من وجهة نظر تكلفة النشر، فإن Qianwen 3 يمثل 25% إلى 35% من الإصدار الكامل من R1، كما تم تخفيض تكلفة نشر النموذج بنسبة 60% إلى 70%. المعلمات الإجمالية للنموذج الرائد Qianwen 3 هي 235B و 22B يتم تنشيطها، الأمر الذي يتطلب ما يقرب من 4 H20 أو وحدات معالجة رسومية ذات أداء مكافئ. بالمقارنة، فإن الإصدار الكامل من DeepSeek-R1 لديه معلمة إجمالية تبلغ 671B ومعلمة تنشيط تبلغ 37B. على الرغم من أنه يمكن تشغيله على 8 بطاقات H20، إلا أنه ضيق للغاية (حوالي مليون يوان). من المستحسن عمومًا استخدام بطاقة H20 المكونة من 16 بطاقة، بسعر إجمالي يبلغ حوالي 2 مليون يوان. من منظور التفكير النموذجي، يسمح نموذج التفكير الهجين الفريد في Qianwen 3 للمطورين بتحديد "ميزانية التفكير" الخاصة بهم، مما يحقق تحكمًا تفكيريًا أكثر دقة مع تلبية متطلبات الأداء، مما سيوفر بشكل طبيعي تكاليف التفكير الإجمالية. للتوضيح، فإن فرق السعر بين وضعي الاستدلال وعدم الاستدلال لنفس نوع Gemini-2.5-Flash هو حوالي 6 مرات. عندما يستخدم المستخدمون وضع عدم الاستدلال، يمكنهم توفير 600% من تكلفة طاقة الحوسبة.
أخبر أحد مطوري النماذج الكبيرة في شركة كبيرة موقع Silicon Rabbit أن النماذج مفتوحة المصدر أكثر ملاءمة للفرق ذات القدرات التقنية القوية ولكن الميزانيات غير الكافية، مثل المؤسسات الأكاديمية. نموذج المصدر المغلق مناسب للشركات التي لديها عدد قليل من الموظفين وأموال كثيرة. ومع ذلك، ومع تحسن قدرات نماذج المصدر المفتوح، تخطط 41% من الشركات التي شملها الاستطلاع لزيادة استخدامها لنماذج المصدر المفتوح، وتعتقد 41% أنه إذا كان أداء نماذج المصدر المفتوح يعادل أداء نماذج المصدر المغلق، فإنها سوف تتحول إلى نماذج المصدر المفتوح. وفي الاستطلاع، لا تخطط 18% فقط من الشركات لزيادة استخدامها لبرامج LLM مفتوحة المصدر. قال مارك أندريسن، مؤسس A16z، إن المصدر المفتوح سيسمح للجامعات بالعودة إلى المنافسة. لأن الباحثين قلقون من أن الجامعات، أولاً، لا تملك ما يكفي من الأموال للتنافس في مجال الذكاء الاصطناعي والبقاء ذات صلة؛ ثانياً، لا تملك جميع الجامعات مجتمعة ما يكفي من الأموال للتنافس، لأن لا أحد يستطيع مواكبة قدرات جمع التبرعات لهذه الشركات الكبرى. ومع ظهور المزيد والمزيد من نماذج المصدر المفتوح وتحسين قدراتها، فإن هذا يعني أن الجامعات يمكنها استخدام نماذج المصدر المفتوح لأغراض البحث. وينطبق المنطق نفسه على الشركات الصغيرة التي لا تملك أموالاً كافية.

رسومات بواسطة Silicon Rabbit
02 الإلهام الشرقي للنماذج الكبيرة
لقد أدى ظهور DeepSeek إلى اكتشاف العديد من الأشخاص لقدرة الشركات الصينية على فتح نماذج المصدر.
"يمثل Deep Seek منتجات الذكاء الاصطناعي خفيفة الوزن ومنخفضة التكلفة." وقال مستثمر في مجال الذكاء الاصطناعي من الصين والولايات المتحدة، إن تعديل نموذج الخبراء المختلط (MoE)، على سبيل المثال، يتطلب مهارة عالية للغاية. في الماضي، لم يكن العديد من النماذج السائدة تستخدم MoE لأنه كان صعبًا، ولكن "الطفل لم يكن يؤمن بالشر" وفعله.
ولكن الشيء الأكثر أهمية في نموذج المصدر المفتوح هو النظام البيئي، أي عدد الأشخاص الذين يستخدمونه فعليًا. بعد كل شيء، يعد التبديل بين النماذج المختلفة مكلفًا للغاية بالنسبة للمستخدمين. ومع ذلك، عندما ظهر DeepSeek، تحول أيضًا بعض مستخدمي نماذج Meta الكبيرة في وادي السيليكون إلى DeepSeek. "يجب أن يتمتع المتأخرون بمزايا كافية مقارنة بالمتقدمين الأوائل." وقال أحد مطوري النماذج الكبار إن هذا من شأنه أن يجذب المستخدمين للتخلي عن تكاليف الاستثمار الأولية والتحول إلى نموذج مفتوح المصدر الجديد. قام Silicon Rabbit بفرز مواقف المصدر المفتوح والمغلق للنماذج المعروفة في العالم ووجد أنه بالإضافة إلى Amazon وMicrosoft وGoogle وMeta وOpenAI، فإن جميعها لديها تخطيطات نماذج مفتوحة المصدر. تختار بعض الشركات مسار المصدر المفتوح البحت، ويختار البعض الآخر الذهاب إلى المصدر المفتوح والمصدر المغلق بالتوازي. وفي الصين، تعد شركة علي بابا أكبر شركة مصممة على اتباع مسار المصدر المفتوح. قبل وقت طويل من إطلاق DeepSeek لـ R1، كانت شركة Alibaba قد راهنت بالفعل على نماذج مفتوحة المصدر ووضعت خططها لها.
مصدر مفتوح لنماذج عالمية مشهورة
المصدر: معلومات عامة جمعتها شركة Silicon Rabbit
اعتبارًا من2025عام4شهر29يوم
|

المصدر: تقرير الذكاء الاصطناعي لجامعة ستانفورد لعام 2025
إن "الاستدلال الهجين" المذكور هنا يعادل دمج نموذج الاستدلال الأعلى والنموذج غير الاستدلالي في نفس النموذج، الأمر الذي يتطلب تصميمًا وتدريبًا متطورين ومبتكرين للغاية. حاليًا، من بين النماذج الشائعة، فقط Qianwen 3 وClaude3.7 وGemini 2.5 Flash يمكنها القيام بذلك.
على وجه التحديد، في "وضع الاستدلال"، سيقوم النموذج بأداء خطوات أكثر وسيطة، مثل تحليل المشكلة، والاستنتاج خطوة بخطوة، والتحقق من الإجابة، وما إلى ذلك، لإعطاء إجابة أكثر تفكيرًا؛ بينما في "الوضع غير المنطقي"، فإن النموذج سوف يولد الإجابة مباشرة. يمكن للنموذج نفسه أن يحقق كل من "التفكير السريع" و"التفكير البطيء"، وهو ما يشبه الطريقة التي يجيب بها البشر على الأسئلة البسيطة بسرعة بناءً على الخبرة أو الحدس، ثم يفكرون بعناية ويقدمون الإجابات عندما يواجهون أسئلة معقدة وصعبة. يسمح Qianwen 3 أيضًا لواجهات برمجة التطبيقات بتعيين "ميزانية تفكير" (أي العدد الأقصى المتوقع لرموز التفكير) لأداء مستويات مختلفة من التفكير، مما يسمح للنموذج بتحقيق توازن أفضل بين الأداء والتكلفة لتلبية الاحتياجات المتنوعة للمطورين والمؤسسات.
أداء Qwen3

بالنسبة للصين، يمكن لنموذج المصدر المفتوح أيضًا جذب المزيد من العملاء مقارنة بنموذج المصدر المغلق، لأنه إذا كان نموذجًا مغلق المصدر، فيمكن أن يكون أكثر تركيزًا في السوق المحلية فقط، ولكن المصدر المفتوح يمكن أن يسمح لمزيد من الشركات الأجنبية باستخدامه. على سبيل المثال: Perplexityهي شركة أمريكية، ولكن يمكن للمستخدمين استخدام DeepSeek R1 على Perplexity ويتم استضافته بالكامل في الولايات المتحدة، باستخدام مراكز البيانات الأمريكية.


03 Bigالنصف الثاني من في مارس 2023، في حدث الذكاء الاصطناعي مفتوح المصدر في Exploratorium في سان فرانسيسكو، تجولت حيوانات الألبكة حول المكان وأشادت بنموذج اللغة الكبير مفتوح المصدر "LLaMA" من Meta. في أكثر من عام منذ عام 2023، كان الذكاء الاصطناعي التوليدي يتغير باستمرار. لقد تحول تركيز الجمهور من النماذج الأساسية إلى التطبيقات الأصلية للذكاء الاصطناعي. في يوم العرض التوضيحي لـ YC W25، كانت 80% من المشاريع عبارة عن تطبيقات الذكاء الاصطناعي.
"سيعمل نموذج المصدر المفتوح على تعزيز تنفيذ المزيد من الوكلاء."أعرب العديد من المطلعين على الصناعة عن هذا الرأي لـ Silicon Rabbit. من ناحية أخرى، سوف يعمل المصدر المفتوح على خفض التكلفة وعتبة الاستخدام.
على سبيل المثال، يتمتع Qianwen 3 بقدرة قوية على استدعاء الأدوات. في قائمة تقييم استدعاء وظيفة Berkeley BFCL، حدد Qianwen 3 ارتفاعًا جديدًا قدره 70.76، مما سيؤدي إلى خفض عتبة استدعاء العميل للأدوات بشكل كبير. في الوقت نفسه، يمكن دمج إطار عمل Qwen-Agent مفتوح المصدر لتحقيق قدرات الوكيل الذكي لـ Qwen3 بشكل كامل. Qwen-Agent هو إطار عمل لتطوير تطبيقات LLM استنادًا إلى تتبع تعليمات Qwen واستخدام الأدوات والتخطيط ووظائف الذاكرة. يشتمل الإطار على قوالب استدعاء الأدوات ومحللات استدعاء الأدوات، ويأتي أيضًا مع تطبيقات عينة مثل مساعدي المتصفح ومفسري التعليمات البرمجية والمساعدين المخصصين، مما يقلل بشكل كبير من تعقيد الترميز. يدعم Qianwen 3 بروتوكول MCP بشكل أصلي. يحتاج المطورون إلى تحديد الأدوات المتاحة. بناءً على ملف تكوين MCP، يمكنهم استخدام أدوات Qwen-Agent المتكاملة أو دمج أدوات أخرى بأنفسهم لتطوير وكيل ذكي بسرعة مع الإعدادات وقاعدة المعرفة RAG وقدرات استخدام الأدوات.
ليس هذا فحسب،يمكن لـ Qianwen 3 من علي دعم نماذج بأحجام مختلفة.يعتبر Qianwen 3 أكثر ملاءمة لنشر الأجهزة الذكية والسيناريوهات مثل الهواتف المحمولة والنظارات الذكية والقيادة الذكية والروبوتات الشبيهة بالبشر. يمكن لجميع الشركات تنزيل نماذج سلسلة Qianwen 3 واستخدامها تجاريًا مجانًا، مما سيعمل على تسريع تطبيق نماذج الذكاء الاصطناعي الكبيرة على المحطات بشكل كبير.
بالإضافة إلى ذلك، أشار بعض الممارسين إلى أن نماذج المصدر المغلق لا تحل مشكلة الثقة بشكل جيد على جانب B. في الواقع، العديد من الشركات الكبيرة غير راغبة في ربط أعمالها بواجهة برمجة التطبيقات الخاصة بالنماذج الكبيرة التابعة لجهات خارجية، لأن السؤال وراء هذا هو ما إذا كانت البيانات الأساسية ستصبح جزءًا من تدريب النموذج الكبير التابع لجهات خارجية. وهذه أيضًا فرصة للنماذج مفتوحة المصدر.
يوجد مقولة مفادها أن المصدر المفتوح هو استراتيجية تسويقية للمنتجات المبكرة قبل خضوعها للاختبار التجريبي. عندما لا نعرف ما سيكون عليه الغد، نقوم بفتح المصدر أولاً لجذب المطورين. عندما يبدأ شخص ما في استخدامه، ستظهر أفضل الممارسات، ومن ثم سيتم إنشاء النظام البيئي الخاص به.
ومع ذلك، نظرًا لأن سلسلة أعمال نموذج المصدر المفتوح أطول وليست سريعة وواضحة مثل نموذج المصدر المغلق، يقول المطلعون على الصناعة إن نموذج المصدر المفتوح أكثر ملاءمة لألعاب "الجيل الثاني الغني" الذي تمتلك عائلاته المال والموارد.إذا أخذنا Meta كمثال، فإن نموذج المصدر المفتوح الخاص بـ Meta يدور بشكل أكبر حول بناء نظام بيئي وتوفير الدعم لقطاعات الأعمال الأخرى في Meta. إن منطق علي بابا وراء المصدر المفتوح يتعلق أكثر بخدماتها السحابية. تتمتع شركة علي بابا بخدمات البنية التحتية السحابية القوية، والتي يمكن من خلالها تدريب النماذج الكبيرة. يمكن أيضًا نشر النماذج الكبيرة على موفري خدمات السحابة الخاصة بها، ويمكن أيضًا نشر النماذج الكبيرة المخصصة وفقًا لاحتياجات المستخدم، وبالتالي تنفيذ منطق الأعمال.
"نموذجي هو السماح للشركات الكبيرة والصغيرة وشركات المصدر المفتوح بالتنافس مع بعضها البعض. هذا ما حدث في صناعة الكمبيوتر." كما قال مارك أندريسن ذات مرة: وبما أن النماذج الكبيرة تصبح تدريجيا منتجات موحدة مثل المياه والكهرباء والفحم، فقد يكون المصدر المفتوح هو الاتجاه الأكثر ملاءمة للمستقبل.