المؤلف: شلوك خيماني، أوليفر جاروس المصدر: Decentralised.co الترجمة: شان أو با، جولدن فاينانس
مقال اليوم هو شرح لأطر الوكالة وتقييمنا للمدى الذي وصلت إليه. وهذا أيضًا طلب تقديم مقترحات، يستهدف المؤسسين الذين يعملون في تقاطع مسارات الأموال عبر الإنترنت (العملات المشفرة) والوكالات. على مدار العام الماضي، كان Decentralised.co يتعمق في تقاطع العملات المشفرة والذكاء الاصطناعي. لقد قمنا أيضًا ببناء منتج يستخدمه أكثر من 70 ألف شخص لتتبع وكلاء الذكاء الاصطناعي والبنية الأساسية للوكلاء. ورغم أن الجنون المحيط بهذا المجال قد هدأ في الأسابيع الأخيرة، فإن تأثير الذكاء الاصطناعي على التكنولوجيا والمجتمع لا يشبه أي شيء رأيناه منذ الإنترنت. إذا كان من المقرر أن تصبح العملات المشفرة السكة المالية في المستقبل، كما نتوقع، فإن تداخلها مع الذكاء الاصطناعي سيكون موضوعًا متكررًا وليس حدثًا منفردًا.
واحدة من الفئات الأكثر إثارة للاهتمام من المشاريع الناشئة عن هذه الموجة هي أطر عمل وكلاء الذكاء الاصطناعي الأصلية المشفرة. إنها تجربة رائعة في جلب المبادئ الأساسية لسلسلة الكتل - نقل القيمة دون إذن، والشفافية، والحوافز المتوافقة - إلى تطوير الذكاء الاصطناعي. إن طبيعتها مفتوحة المصدر توفر لنا فرصة نادرة لإلقاء نظرة على عملها الداخلي وتحليل ليس فقط وعودها ولكن أيضًا كيفية عملها بالفعل.
في هذه المقالة، نقوم أولاً بتحليل ما هي أطر الوكيل في الواقع ولماذا هي مهمة. بعد ذلك نتناول السؤال الواضح: لماذا نحتاج إلى إطار عمل أصلي للعملات المشفرة عندما توجد خيارات ناضجة مثل LangChain؟ ولتحقيق هذه الغاية، قمنا بتحليل أطر التشفير الأصلية الرائدة ونقاط قوتها وحدودها في حالات الاستخدام المختلفة. أخيرًا، إذا كنت تقوم ببناء وكيل الذكاء الاصطناعي، فسنقوم بمساعدتك في تحديد الإطار الذي قد يناسب احتياجاتك. أم يجب عليك البناء باستخدام إطار عمل؟ دعونا نبحث بشكل أعمق.
الملخص
"يتلخص تقدم الحضارة في زيادة عدد العمليات المهمة التي يمكننا القيام بها دون تفكير." - ألفريد نورث وايتهيد
فكر في الطريقة التي عاش بها أسلافنا. كان على كل عائلة أن تزرع طعامها بنفسها، وتصنع ملابسها بنفسها، وتبني مأواها بنفسها. إنهم يقضون ساعات لا حصر لها في أداء مهام البقاء الأساسية، ولا يتركون سوى القليل من الوقت لأي شيء آخر. حتى قبل قرنين من الزمان، كان ما يقرب من 90 في المائة من السكان يعملون في الزراعة. اليوم، نشتري طعامنا من محلات السوبر ماركت، ونعيش في منازل بناها خبراء، ونرتدي ملابس مصنوعة في مصانع بعيدة. ما كان يستهلك في السابق أجيالاً من الجهد أصبح الآن مجرد معاملة بسيطة. اليوم، يعمل في الزراعة 27% فقط من سكان العالم (وتنخفض هذه النسبة إلى أقل من 5% في البلدان المتقدمة). عندما نبدأ في إتقان تقنية جديدة، تظهر أنماط مألوفة. نبدأ بفهم الأساسيات - ما ينجح، وما لا ينجح، وما هي الأنماط التي تستمر في الظهور. وبمجرد أن أصبحت هذه الأنماط واضحة، قمنا بتجميعها في تجريدات أسهل وأسرع وأكثر موثوقية. وتساعد هذه التجريدات على توفير الوقت والموارد اللازمة لمعالجة تحديات أكثر تنوعًا وأهمية. والشيء نفسه ينطبق على بناء البرمجيات.

خذ تطوير الويب كمثال. في الأيام الأولى، كان المطورون بحاجة إلى كتابة كل شيء من الصفر - التعامل مع طلبات HTTP، وإدارة الحالة، وإنشاء واجهات المستخدم - وهي مهام معقدة وتستغرق وقتًا طويلاً. ثم ظهرت أطر عمل مثل React والتي عملت على تبسيط هذه التحديات بشكل كبير من خلال توفير تجريدات مفيدة. وقد اتبع تطوير الهاتف المحمول مسارًا مشابهًا. في البداية، احتاج المطورون إلى معرفة عميقة ومحددة للمنصة حتى ظهرت أدوات مثل React Native وFlutter، مما سمح لهم بكتابة التعليمات البرمجية مرة واحدة ونشرها في أي مكان. يحدث نمط مماثل من التجريد في التعلم الآلي. في أوائل العقد الأول من القرن الحادي والعشرين، اكتشف الباحثون إمكانات وحدات معالجة الرسوميات (GPU) في أحمال عمل التعلم الآلي. في البداية، كان على المطورين التعامل مع أساسيات الرسوميات واللغات مثل GLSL الخاصة بـ OpenGL - وهي أدوات لم يتم إنشاؤها للحوسبة للأغراض العامة. لقد تغير كل شيء في عام 2006 عندما قدمت NVIDIA برنامج CUDA، والذي جعل برمجة وحدة معالجة الرسوميات أكثر سهولة في الوصول إليها وجلب تدريب التعلم الآلي لمجموعة أوسع من المطورين.
مع اكتساب تطوير التعلم الآلي زخمًا، ظهرت أطر عمل متخصصة لتلخيص تعقيد برمجة وحدة معالجة الرسوميات. يتيح TensorFlow وPyTorch للمطورين التركيز على بنية النموذج بدلاً من الانغماس في تفاصيل كود وحدة معالجة الرسوميات (GPU) منخفضة المستوى أو تفاصيل التنفيذ. ويساهم هذا في تسريع تكرار هياكل النماذج والتقدم السريع في مجال الذكاء الاصطناعي/التعلم الآلي الذي شهدناه على مدار السنوات القليلة الماضية. ونحن نشهد الآن تطورًا مماثلاً في وكلاء الذكاء الاصطناعي - وهو برنامج برمجي يمكنه اتخاذ القرارات واتخاذ الإجراءات لتحقيق الأهداف، تمامًا مثل المساعد البشري أو الموظف. إنه يستخدم نموذجًا لغويًا كبيرًا باعتباره "دماغه" ويمكنه الاستفادة من أدوات مختلفة مثل البحث في الويب أو إجراء مكالمات API أو الوصول إلى قواعد البيانات لإكمال المهام. لبناء وكيل من الصفر، يجب على المطورين كتابة كود معقد للتعامل مع كل جانب: كيف يفكر الوكيل في المشاكل، وكيف يقرر الأدوات التي يجب استخدامها ومتى، وكيف يتفاعل مع هذه الأدوات، وكيف يتذكر سياق التفاعلات السابقة، وكيفية تقسيم المهام الكبيرة إلى خطوات قابلة للإدارة. وكان لا بد من التعامل مع كل وضع على حدة، مما أدى إلى تكرار الجهود والحصول على نتائج غير متسقة.
هذا هو المكان الذي يأتي فيه إطار عمل وكيل الذكاء الاصطناعي. تمامًا كما قام React بتبسيط تطوير الويب من خلال التعامل مع الأجزاء الصعبة من تحديثات واجهة المستخدم وإدارة الحالة، فإن هذه الأطر تعالج التحديات الشائعة في بناء وكلاء الذكاء الاصطناعي. إنها توفر مكونات جاهزة للأنماط الفعالة التي اكتشفناها، مثل كيفية هيكلة عملية اتخاذ القرار لدى الوكيل، ودمج أدوات مختلفة، والحفاظ على السياق عبر تفاعلات متعددة. باستخدام إطار عمل، يمكن للمطورين التركيز على ما يجعل وكيلهم فريدًا - قدراته المحددة وحالات الاستخدام - بدلاً من إعادة بناء هذه المكونات الأساسية. بإمكانهم إنشاء وكلاء ذكاء اصطناعي متطورين في أيام أو أسابيع بدلاً من أشهر، وتجربة طرق مختلفة بسهولة أكبر، والتعلم من أفضل الممارسات التي اكتشفها المطورون الآخرون والمجتمع. لفهم أهمية إطار العمل بشكل أفضل، فكر في مطور يقوم ببناء وكيل لمساعدة الأطباء في مراجعة التقارير الطبية. بدون إطار عمل، سيحتاجون إلى برمجة كل شيء من الصفر: التعامل مع مرفقات البريد الإلكتروني، واستخراج النص من ملفات PDF، وإدخال النص في LLM بالتنسيق الصحيح، وإدارة سجل المحادثة لتتبع ما تمت مناقشته، وضمان استجابة الوكلاء بشكل مناسب. يعد هذا قدرًا كبيرًا من التعليمات البرمجية المعقدة لمهمة ليست فريدة لحالة الاستخدام المحددة الخاصة بها.
باستخدام إطار عمل الوكيل، يمكن استخدام العديد من هذه العناصر الأساسية بشكل مباشر. يتولى الإطار مسؤولية قراءة رسائل البريد الإلكتروني وملفات PDF، ويوفر أنماطًا لبناء مطالبات المعرفة الطبية، ويدير تدفق المحادثات، ويساعد حتى في تتبع التفاصيل المهمة عبر اتصالات متعددة. يمكن للمطورين التركيز على ما يجعل وكيلهم فريدًا، مثل ضبط مطالبات التحليل الطبي أو إضافة فحوصات السلامة الخاصة بالتشخيص، بدلاً من إعادة اختراع الأنماط الشائعة. ما كان يمكن أن يستغرق شهورًا للبناء من الصفر يمكن الآن إنشاء نموذج أولي له في غضون أيام.
أصبح LangChain بمثابة السكين السويسري لتطوير الذكاء الاصطناعي، حيث يوفر مجموعة أدوات مرنة لبناء تطبيقات تعتمد على LLM. على الرغم من أنه ليس إطار عمل وكيلًا صارمًا، إلا أنه يوفر اللبنات الأساسية التي يتم بناء معظم أطر الوكيل عليها، من سلاسل ترتيب مكالمات LLM إلى أنظمة الذاكرة للحفاظ على السياق. إن نظامها البيئي الواسع من التكاملات والتوثيق الغني يجعلها نقطة انطلاق رائعة للمطورين الذين يتطلعون إلى بناء تطبيقات الذكاء الاصطناعي العملية.
ثم هناك أطر عمل متعددة الوكلاء مثل CrewAI و AutoGen، والتي تمكن المطورين من بناء أنظمة مع العديد من وكلاء الذكاء الاصطناعي الذين يعملون معًا، كل منهم له دوره وقدراته الفريدة. بدلاً من مجرد تنفيذ المهام بشكل متسلسل، تؤكد هذه الأطر على التعاون بين الوكلاء من خلال الحوار لحل المشكلات بشكل مشترك.

على سبيل المثال، عند تعيين تقرير بحثي، قد يحدد وكيل واحد هيكله، وقد يجمع آخر المعلومات ذات الصلة، وقد يعلق ثالث على المسودة النهائية ويصقلها. إنه مثل تشكيل فريق افتراضي حيث يمكن لوكلاء الذكاء الاصطناعي مناقشة الحلول والنقاش حولها وتحسينها معًا. غالبًا ما يُشار إلى أنظمة الوكلاء المتعددين الذين يعملون معًا بهذه الطريقة لتحقيق أهداف عالية المستوى باسم "أسراب" من وكلاء الذكاء الاصطناعي. على الرغم من أنه ليس إطار عمل تقليديًا، إلا أن AutoGPT كان رائدًا في مفهوم وكلاء الذكاء الاصطناعي المستقلين. إنه يوضح كيف يمكن للذكاء الاصطناعي أن يأخذ هدفًا عالي المستوى، ويقسمه إلى مهام فرعية، ويكملها بشكل مستقل مع الحد الأدنى من التدخل البشري. على الرغم من قيودها، أشعلت AutoGPT موجة من الابتكار في الوكلاء المستقلين وأثرت على تصميم الأطر الأكثر هيكلة اللاحقة.
ولكن لماذا يتم تشفيره؟ كل هذه الخلفية تقودنا في النهاية إلى صعود أطر عمل وكلاء الذكاء الاصطناعي الأصلية المشفرة. في هذه المرحلة، قد تتساءل، لماذا يحتاج Web3 إلى إطار عمل خاص به عندما يكون لدينا أطر عمل ناضجة نسبيًا مثل Langchain و CrewAI في Web2؟ بالتأكيد يمكن للمطورين استخدام هذه الأطر الموجودة لبناء أي وكلاء يريدونهم؟ إن هذا التشكك معقول نظراً لميل الصناعة إلى فرض Web3 في أي رواية أو قصة. نعتقد أن هناك ثلاثة أسباب وجيهة لوجود إطار عمل وكيل خاص بـ Web3. الوكلاء الماليون يعملون على السلسلة
نعتقد أن معظم المعاملات المالية في المستقبل سيتم إجراؤها على مسارات blockchain. وقد أدى هذا إلى تسريع الحاجة إلى فئة من وكلاء الذكاء الاصطناعي القادرين على تحليل البيانات الموجودة على السلسلة، وإجراء معاملات blockchain، وإدارة الأصول الرقمية عبر بروتوكولات وشبكات متعددة. من روبوتات التداول الآلية التي يمكنها اكتشاف فرص التحكيم إلى مديري المحافظ الذين ينفذون استراتيجيات العائد، يعتمد هؤلاء الوكلاء على التكامل العميق لقدرات blockchain في سير العمل الأساسية الخاصة بهم. لا توفر أطر عمل Web2 التقليدية مكونات أصلية لهذه المهام. يتعين عليك تجميع مكتبات الطرف الثالث للتفاعل مع العقود الذكية، وتحليل الأحداث الخام على السلسلة، والتعامل مع إدارة المفتاح الخاص - مما يؤدي إلى تعقيد وثغرات أمنية محتملة. في المقابل، يمكن لأطر عمل Web3 المخصصة التعامل مع هذه الوظائف خارج الصندوق، مما يسمح للمطورين بالتركيز على منطق وسياسات عملائهم بدلاً من المصارعة مع سباكة blockchain منخفضة المستوى.
التنسيق والحوافز الأصلية
لا يقتصر عمل تقنية البلوك تشين على العملة الرقمية فحسب. إنهم يوفرون نظامًا عالميًا للسجلات يقلل من مستوى الثقة مع أدوات مالية مدمجة تعمل على تعزيز التنسيق بين الوكلاء المتعددين. يمكن للمطورين استخدام العناصر البدائية الموجودة على السلسلة مثل التخزين والإيداع ومجموعات الحوافز لتنسيق مصالح وكلاء الذكاء الاصطناعي المتعددين، بدلاً من الاعتماد على السمعة خارج السلسلة أو قواعد البيانات المنعزلة.
تخيل مجموعة من الوكلاء يتعاونون لإكمال مهمة معقدة (على سبيل المثال، تصنيف البيانات لتدريب نموذج جديد). من الممكن تتبع أداء كل وكيل على السلسلة، ويتم توزيع المكافآت تلقائيًا بناءً على المساهمة. إن الشفافية وعدم قابلية التغيير التي تتمتع بها الأنظمة القائمة على تقنية blockchain تسمح بالتعويض العادل، وتتبع السمعة بشكل أكثر قوة، وبرامج الحوافز التي تتطور في الوقت الفعلي. يمكن أن تتضمن الأطر الأصلية للعملات المشفرة هذه القدرات صراحةً، مما يسمح للمطورين بتصميم هياكل حوافز باستخدام العقود الذكية دون الحاجة إلى إعادة اختراع العجلة في كل مرة يحتاج فيها وكيل إلى الثقة أو يلزم إجراء دفعة إلى وكيل آخر.
فرص جديدة في الأسواق المبكرة
في حين أن الأطر مثل LangChain لديها بالفعل تأثير على حصة العقل والشبكة، فإن مجال وكلاء الذكاء الاصطناعي لا يزال في مهده. من غير الواضح ما هو الشكل النهائي الذي ستبدو عليه هذه الأنظمة، ولا توجد طريقة واحدة للسيطرة على السوق. تفتح الحوافز الاقتصادية المشفرة إمكانيات جديدة لكيفية بناء الأطر وإدارتها وتحقيق الدخل منها والتي لا تتوافق بشكل أنيق مع اقتصاديات SaaS أو Web2 التقليدية. يمكن أن تؤدي التجارب في هذه المرحلة المبكرة إلى إطلاق استراتيجيات جديدة لتحقيق الدخل للإطار نفسه، وليس فقط للوكلاء المبنيين فوقه.
المنافسون
ElizaOS، المرتبط بالمشروع الشهير AI16Z، هو إطار عمل قائم على Typescript لإنشاء ونشر وإدارة وكلاء الذكاء الاصطناعي. تم تصميمه كنظام تشغيل وكيل الذكاء الاصطناعي الصديق لـ Web3 والذي يسمح للمطورين ببناء وكلاء بشخصيات فريدة وأدوات مرنة للتفاعل مع blockchain والتوسع بسهولة من خلال أنظمة متعددة الوكلاء.
Rig هو إطار عمل مفتوح المصدر لوكيل الذكاء الاصطناعي تم تطويره بواسطة Playgrounds Analytics Inc.، وتم بناؤه باستخدام لغة البرمجة Rust لإنشاء وكلاء الذكاء الاصطناعي المعياريين والقابلين للتوسيع. وهو مرتبط بمشروع AI Rig Complex (ARC). Daydreams هو إطار عمل للوكيل المولد تم إنشاؤه في الأصل لإنشاء وكلاء مستقلين للألعاب على السلسلة، ولكن تم توسيعه منذ ذلك الحين لأداء المهام على السلسلة.
Pippin هو إطار عمل لوكيل الذكاء الاصطناعي تم تطويره بواسطة Yohei Nakajima، مؤسس BabyAGI، وتم تصميمه لمساعدة المطورين على إنشاء مساعدين رقميين معياريين ومستقلين. قام يوهي أولاً ببناء وكيل مستقل ثم قام بتوسيعه إلى إطار عام.
ZerePy هو إطار عمل Python مفتوح المصدر مصمم لنشر وكلاء مستقلين عبر منصات متعددة وسلاسل كتل، مع التركيز على الذكاء الاصطناعي الإبداعي والتكامل مع وسائل التواصل الاجتماعي. مثل Pippin، بدأ Zerepy كعامل مستقل، Zerebro، ثم توسع لاحقًا إلى إطار عمل.
المعايير
لتقييم قوة كل إطار عمل، أخذنا وجهة نظر مطور يريد بناء وكيل الذكاء الاصطناعي. ماذا سوف يهتمون به؟ نعتقد أنه من المفيد تقسيم التقييم إلى ثلاث فئات رئيسية: الخبرة الأساسية والوظيفية وخبرة المطور. يمكنك أن تفكر في جوهر الإطار باعتباره الأساس الذي يتم بناء جميع الوكلاء الآخرين عليه. إذا كان النواة ضعيفة، أو بطيئة، أو لا تتطور، فإن الوكلاء الذين تم إنشاؤهم باستخدام الإطار سيكونون محدودين على نحو مماثل. يمكن تقييم النواة بناءً على المعايير التالية:
حلقة التفكير الأساسية:عقل أي إطار عمل للوكيل؛ كيف يحل المشكلات. يدعم الإطار القوي كل شيء بدءًا من تدفقات الإدخال والإخراج الأساسية وحتى الأنماط المعقدة مثل تسلسل الأفكار. بدون قدرات التفكير القوية، لا يستطيع الوكلاء تحليل المهام المعقدة بشكل فعال أو تقييم خيارات متعددة، مما يقللهم إلى مجرد برامج محادثة روبوتية.
آلية الذاكرة:يحتاج العملاء إلى ذاكرة قصيرة المدى للمحادثات المستمرة وتخزين طويل المدى للمعرفة المستمرة. إن الأطر الجيدة تفعل أكثر من مجرد التذكر، فهي تفهم العلاقات بين قطع المعلومات المختلفة ويمكنها تحديد أولويات ما يستحق الاحتفاظ به وما يستحق النسيان.
التضمين ودعم RAG:يجب على الوكلاء المعاصرين استخدام المعرفة الخارجية مثل المستندات وبيانات السوق. يمكن لإطار عمل قوي تضمين هذه المعلومات بسهولة واسترجاعها سياقيًا من خلال RAG، وبالتالي بناء الاستجابات على أساس المعرفة المحددة بدلاً من الاعتماد فقط على تدريب النموذج الأساسي.
تكوين الشخصية:إن القدرة على تشكيل الطريقة التي يتواصل بها وكلاء خدمة العملاء لديك (النغمة وآداب التعامل والشخصية) أمر بالغ الأهمية لإشراك المستخدم. يمكن لإطار عمل جيد تكوين هذه الخصائص بسهولة، مع إدراك أن شخصية العميل يمكن أن تؤثر بشكل كبير على ثقة المستخدم.
التنسيق بين الوكلاء المتعددين: يوفر الإطار القوي أنماطًا مدمجة للوكلاء للتعاون، سواء من خلال المحادثات المنظمة، أو تفويض المهام، أو أنظمة الذاكرة المشتركة. يمكن أن يؤدي هذا إلى إنشاء فرق متخصصة حيث يجمع كل وكيل قدرات فريدة للعمل معًا لحل المشكلات.
بعيدًا عن الوظائف الأساسية، فإن الفائدة الفعلية لإطار العمل تعتمد إلى حد كبير على ميزاته وتكاملاته. تعمل الأدوات على توسيع الوظائف الفعلية للوكيل بشكل كبير. يمكن للوكيل الذي لديه حق الوصول إلى LLM فقط المشاركة في المحادثة، ولكن من خلال منحه حق الوصول إلى متصفح الويب، يمكنه استرداد المعلومات في الوقت الفعلي. قم بتوصيله بواجهة برمجة تطبيقات التقويم الخاصة بك وسيتمكن من جدولة الاجتماعات. تؤدي كل أداة جديدة إلى زيادة قدرات العميل بشكل كبير. من وجهة نظر المطور، كلما زاد عدد الأدوات، زادت الخيارات ونطاق التجارب.
نقوم بتقييم قدرات أطر التشفير الأصلية على طول ثلاثة أبعاد:
دعم نموذج الذكاء الاصطناعي وقدراته: توفر الأطر القوية تكاملاً أصليًا مع نماذج لغات متعددة - من سلسلة GPT من OpenAI إلى البدائل مفتوحة المصدر مثل Llama و Mistral. ولكن الأمر لا يقتصر فقط على درجة الماجستير في القانون. إن دعم إمكانيات الذكاء الاصطناعي الإضافية مثل تحويل النص إلى كلام واستخدام المتصفح وتوليد الصور واستنتاج النموذج المحلي يمكن أن يؤدي إلى توسيع قدرات الوكيل بشكل كبير. أصبح دعم النموذج القوي أمرًا ضروريًا للعديد من هذه الأطر.
دعم البنية التحتية لـ Web3:يتطلب إنشاء وكيل تشفير تكاملاً عميقًا مع البنية التحتية لـ blockchain. وهذا يعني دعم مكونات Web3 الضرورية مثل المحافظ لتوقيع المعاملات، وRPC لاتصالات السلسلة، والفهرسات للوصول إلى البيانات. يجب أن يتكامل الإطار القوي مع الأدوات والخدمات الأساسية عبر النظام البيئي، من أسواق NFT وبروتوكولات DeFi إلى حلول الهوية وطبقات توفر البيانات.
تغطية السلسلة: يحدد دعم البنية الأساسية لـ Web3 ما يمكن للوكلاء فعله، بينما تحدد تغطية السلسلة المكان الذي يمكنهم القيام بذلك فيه. يتطور نظام التشفير البيئي إلى عملاق لامركزي متعدد السلاسل، مما يسلط الضوء على أهمية التغطية الواسعة للسلسلة.
في النهاية، حتى الإطار الأقوى لا يكون جيدًا إلا بقدر تجربة المطور. يمكن أن يتمتع الإطار بأفضل الوظائف في فئته، ولكن إذا كان من الصعب على المطورين استخدامه بشكل فعال، فلن يحظى أبدًا بالتبني على نطاق واسع.
إن اللغة المستخدمة بواسطة إطار العمل تؤثر بشكل مباشر على من يمكنه البناء باستخدامها. تسيطر لغة Python على كل من مجالات الذكاء الاصطناعي وعلوم البيانات، مما يجعلها خيارًا طبيعيًا لأطر عمل الذكاء الاصطناعي. قد تتمتع الأطر المكتوبة بلغات متخصصة بمزايا فريدة، ولكنها قد تعزل نفسها عن النظام البيئي الأوسع للمطورين. إن انتشار JavaScript في تطوير الويب يجعله منافسًا قويًا آخر، وخاصةً بالنسبة للأطر التي تستهدف تكامل الويب.
إن التوثيق الواضح والشامل هو شريان الحياة للمطورين الذين يتبنون إطار عمل جديدًا. لا يتعلق الأمر فقط بمراجع واجهة برمجة التطبيقات (API)، على الرغم من أهميتها البالغة أيضًا. تتضمن الوثائق القوية نظرات عامة مفاهيمية تشرح المبادئ الأساسية، ودروسًا تعليمية خطوة بخطوة، وأكواد نموذجية مع تعليقات جيدة، ودروس تعليمية، وأدلة استكشاف الأخطاء وإصلاحها، وأنماط تصميم ثابتة.
النتائج
يلخص الجدول التالي أداء كل إطار في المعلمات التي حددناها للتو (مرتبة من 1 إلى 5). ورغم أن مناقشة الأسباب وراء كل نقطة بيانات تتجاوز نطاق هذه المقالة، فإليك بعض الانطباعات البارزة التي تركها كل إطار عمل علينا.
Eliza هو الإطار الأكثر نضجًا على الإطلاق في هذه القائمة. نظرًا لأن إطار عمل Eliza أصبح نقطة شيلينج لنظام التشفير البيئي للتفاعل مع الذكاء الاصطناعي في موجة الوكيل الأخيرة، فإن إحدى ميزاته البارزة هي العدد الهائل من الميزات والتكاملات التي يدعمها.

نظرًا للشعبية التي حققتها، سارعت كل أداة blockchain والتطوير إلى دمج نفسها في الإطار (يحتوي حاليًا على ما يقرب من 100 تكامل!). في الوقت نفسه، تجذب Eliza أيضًا نشاطًا أكبر من المطورين مقارنةً بمعظم الأطر الأخرى. تستفيد إليزا من بعض التأثيرات الشبكية الواضحة للغاية، على الأقل في المدى القصير. تمت كتابة الإطار بلغة TypeScript، وهي لغة ناضجة يستخدمها كل من المبتدئين والمطورين ذوي الخبرة، وهو ما يعزز شعبيتها بشكل أكبر. تتميز Eliza أيضًا بالمحتوى التعليمي الغني والبرامج التعليمية التي تقدمها للمطورين الذين يستخدمون الإطار. لقد رأينا مجموعة من الوكلاء يستخدمون إطار عمل Eliza، بما في ذلك Spore، وEliza (agent)، وPillzumi. ومن المتوقع إصدار نسخة جديدة من إطار عمل Eliza في الأسابيع المقبلة.
نهج Rig مختلف تمامًا عن نهج Eliza. يتميز بامتلاكه قلبًا قويًا وخفيف الوزن وعالي الأداء. إنه يدعم أنماط التفكير المختلفة، بما في ذلك تسلسل التلميحات (تطبيق التلميحات بشكل متسلسل)، والتنظيم (تنسيق وكلاء متعددين)، والمنطق الشرطي، والتوازي (تنفيذ العمليات بشكل متزامن). ومع ذلك، فإن الجهاز نفسه ليس متكاملاً بشكل غني. وبدلاً من ذلك، فإنه يتخذ نهجًا مختلفًا، يطلق عليه الفريق اسم "مصافحة القوس". هنا، يتعاون فريق Arc مع فرق مختلفة عالية الجودة في Web2 وWeb3 لتوسيع وظائف Rig. تتضمن بعض هذه التعاونات العمل مع Soulgraph على شخصيات الوكيل، ومع Listen وSolana Agent Kit على قدرات blockchain.
ومع ذلك، فإن الجهاز لديه عيبين. أولاً، تم كتابته بلغة Rust، والتي على الرغم من أدائها العالي، إلا أنها مألوفة لدى عدد قليل نسبيًا من المطورين. ثانيًا، لم نشاهد سوى عدد محدود من الوكلاء المعتمدين على Rig في تطبيقات العالم الحقيقي (AskJimmy هو استثناء)، مما يجعل من الصعب تقييم التبني الحقيقي للمطورين. قبل البدء في Daydreams، كان المؤسس lordOfAFew أحد المساهمين الرئيسيين في إطار عمل Eliza. وقد أتاح له هذا الفرصة للتعرف على نمو الإطار، والأهم من ذلك، التعرف على بعض عيوبه. تختلف أحلام اليقظة عن الأطر الأخرى في أنها تركز على التفكير المتسلسل لمساعدة الوكلاء على تحقيق أهداف طويلة الأجل. وهذا يعني أنه عند إعطاء هدف عالي المستوى ومعقد، يقوم العميل بإجراء تفكير متعدد الخطوات، ويقترح إجراءات مختلفة، ويقبلها أو يتجاهلها بناءً على ما إذا كانت تساعد في تحقيق الهدف، ويستمر في هذه العملية لتحقيق التقدم. وهذا يجعل الوكلاء الذين تم إنشاؤهم باستخدام Daydreams مستقلين حقًا.
لقد أثرت خلفية المؤسسين في بناء مشاريع الألعاب على هذا النهج. تُعد الألعاب، وخاصة الألعاب الموجودة على السلسلة، بيئة مثالية لتدريب العملاء واختبار قدراتهم. ليس من المستغرب أن بعض حالات الاستخدام المبكرة لوكلاء Daydreams كانت في ألعاب مثل Pistols، وIstarai، وPonziLand. يحتوي الإطار أيضًا على تنفيذ قوي لسير عمل التعاون والتنسيق بين العديد من الوكلاء.
على غرار Daydreams، Pippin هو أيضًا وافد متأخر في لعبة الإطار. سنتناول إطلاقه بالتفصيل في هذه المقالة. يتمثل جوهر رؤية يوهي في تمكين الوكلاء من أن يصبحوا "حضورًا رقميًا" قادرًا على العمل بذكاء واستقلالية، من خلال الوصول إلى الأدوات المناسبة. تنعكس هذه الرؤية في جوهر بيبين البسيط والأنيق. باستخدام بضعة أسطر فقط من التعليمات البرمجية، يمكنك إنشاء وكيل متطور يمكنه العمل بشكل مستقل وحتى كتابة التعليمات البرمجية لنفسه. العيب في هذا الإطار هو أنه يفتقر حتى إلى الميزات الأساسية مثل تضمين متجه الدعم وسير عمل RAG. كما أنها تشجع المطورين على استخدام مكتبة الطرف الثالث Composio لمعظم التكاملات. إنه ليس ناضجًا مثل الأطر الأخرى التي ناقشناها حتى الآن.
تتضمن بعض الوكلاء الذين تم إنشاؤهم باستخدام Pippin كل من Ditto و Telemafia.
Zerepy لديه تنفيذ أساسي بسيط نسبيًا. يقوم بشكل فعال باختيار مهمة من مجموعة من المهام المحددة ويقوم بتنفيذها عند الحاجة إليها. ومع ذلك، فإنه يفتقر إلى أنماط التفكير المعقدة مثل التخطيط الموجه نحو الهدف أو التخطيط عبر سلسلة الأفكار.
على الرغم من أنه يدعم استدعاءات الاستدلال إلى العديد من LLMs، إلا أنه يفتقر إلى أي تضمين أو تنفيذ RAG. كما أنه يفتقر إلى أي عناصر بدائية للذاكرة أو التنسيق بين الوكلاء المتعددين. ينعكس هذا الافتقار إلى الوظائف الأساسية والتكامل في اعتماد Zerepy. ولم نر حتى الآن أي وكلاء فعليين يأتون إلى الإنترنت باستخدام هذا الإطار.

البناء باستخدام الأطر
إذا كان كل هذا يبدو تقنيًا ونظريًا، فلا نلومك. السؤال الأكثر بساطة سيكون "ما نوع الوكلاء الذين يمكنني بناءهم باستخدام هذه الأطر دون الحاجة إلى كتابة مجموعة من التعليمات البرمجية بنفسي؟". لتقييم هذه الأطر عمليًا، حددنا خمسة أنواع شائعة من الوكلاء الذين يرغب المطورون غالبًا في إنشائهم. إنها تمثل مستويات متفاوتة من التعقيد وتختبر جوانب مختلفة من وظيفة كل إطار عمل.
وكيل دردشة المستندات: يختبر وظائف RAG الأساسية بما في ذلك التعامل مع المستندات وصيانة السياق ودقة المرجع وإدارة الذاكرة. يكشف هذا الاختبار عن قدرة الإطار على سد الفجوة بين الفهم الحقيقي للمستندات ومطابقة الأنماط البسيطة.
روبوتات الدردشة: تقييم أنظمة الذاكرة والاتساق السلوكي. يتعين على الإطار أن يحافظ على سمات شخصية متسقة، وأن يتذكر المعلومات الرئيسية عبر المحادثات، وأن يسمح بتكوين الشخصية، وبالتالي تحويل روبوت المحادثة عديم الجنسية إلى كيان رقمي دائم.
روبوتات التداول على السلسلة: اختبار التكاملات الخارجية من خلال معالجة بيانات السوق في الوقت الفعلي، وإجراء عمليات تداول عبر السلسلة، وتحليل المشاعر الاجتماعية، وتنفيذ استراتيجيات التداول. يكشف هذا عن كيفية تعامل الإطار مع البنية التحتية المعقدة لسلسلة الكتل واتصالات API.
الشخصيات غير القابلة للعب في اللعبة: على الرغم من أن العالم لم يبدأ في الاهتمام بالوكلاء إلا في العام الماضي، إلا أن الوكلاء لعبوا دورًا حيويًا كشخصيات غير قابلة للعب (NPCs) في الألعاب لعقود من الزمن. تتحول وكلاء الألعاب من وكلاء قائمين على القواعد إلى وكلاء أذكياء مدفوعين بـ LLMs ويظلون حالة الاستخدام الأساسية للإطار. هنا، نقوم باختبار قدرة العميل على فهم بيئته، والتفكير في السيناريوهات بشكل مستقل، وتحقيق الأهداف طويلة المدى.
المساعد الصوتي: يقوم بتقييم المعالجة في الوقت الفعلي وتجربة المستخدم من خلال معالجة الصوت ووقت الاستجابة السريع وتكامل منصة المراسلة. يقوم هذا الاختبار باختبار ما إذا كان الإطار قادرًا على دعم التطبيقات التفاعلية حقًا، وليس مجرد نموذج طلب واستجابة بسيط.
لقد أعطينا لكل إطار درجة من 5 لكل نوع من أنواع الوكلاء. إليكم أداء:
مقاييس المصدر المفتوحة
عند تقييم هذه الأطر ، فإن معظم التحليلات تركز بشكل كبير على مقاييس الجيش ، مثل النجوم والشوك. سنتناول هنا سريعًا ما هي هذه المقاييس وإلى أي مدى تشير إلى جودة الإطار.
تعتبر النجوم بمثابة الإشارة الأكثر وضوحًا للشعبية. إنها في الأساس عبارة عن إشارات مرجعية يقدمها المطورون للعناصر التي يجدونها مثيرة للاهتمام أو يرغبون في تتبعها. على الرغم من أن عدد النجوم المرتفع يشير إلى وعي واهتمام واسع النطاق، إلا أنه قد يكون مضللاً. في بعض الأحيان تحصل المشاريع على النجوم من خلال التسويق وليس من خلال الجدارة الفنية. فكر في النجوم باعتبارها دليلاً اجتماعيًا، وليس مقياسًا للجودة. يخبرك عدد الشوكات بعدد المطورين الذين قاموا بإنشاء نسخ خاصة بهم من قاعدة التعليمات البرمجية للبناء عليها. يشير العدد الأكبر من الشوكات عادةً إلى أن المطورين يستخدمون المشروع ويوسعونه بشكل نشط. ومع ذلك، يتم التخلي عن العديد من الشوكات في النهاية، لذا فإن عدد الشوكات الخام يحتاج إلى سياق.
يكشف عدد المساهمين عن عدد المطورين المختلفين الذين قاموا فعليًا بإرسال الكود إلى المشروع. عادةً ما يكون هذا أكثر أهمية من النجمة أو التشعب. يشير العدد الصحي من المساهمين المنتظمين إلى أن المشروع لديه مجتمع نشط يعمل على صيانته وتحسينه. لقد ذهبنا إلى خطوة أبعد وقمنا بتصميم مؤشرنا الخاص - درجة المساهم. نقوم بتقييم التاريخ العام لكل مطور، بما في ذلك مساهماته السابقة في مشاريع أخرى، وتكرار النشاط، وشعبية حسابه، لتعيين درجة لكل مساهم. ثم قمنا بحساب متوسط جميع المساهمين في المشروع ووزنهم حسب عدد المساهمات التي قدموها. ماذا تعني هذه الأرقام بالنسبة لإطار عملنا؟
في معظم الحالات، يكون عدد النجوم مهملاً. إنها ليست مؤشرات ذات مغزى للتبني. الاستثناء هنا هو Eliza، الذي أصبح في مرحلة ما مستودعًا رقم 1 لجميع المشاريع على GitHub، بما يتسق مع كونه نقطة شيلينج لجميع الذكاء الاصطناعي للعملات المشفرة. بالإضافة إلى ذلك، ساهم مطورون معروفون مثل 0xCygaar في المشروع. ويتجلى هذا أيضًا في عدد المساهمين - 10 مرات أكثر من المشاريع الأخرى - التي تجتذبها إليزا.
إلى جانب ذلك، فإن Daydreams مثيرة للاهتمام بالنسبة لنا ببساطة لأنها تجذب مطورين ذوي جودة عالية. وباعتبارها شركة متأخرة في إطلاقها بعد ذروة الضجيج، فإنها لم تستفد من تأثير الشبكة الذي أحدثته إليزا.
ما هو التالي؟
إذا كنت مطورًا، نأمل أن نكون قد قدمنا لك على الأقل نقطة بداية لاختيار الإطار الذي تريد البناء عليه (إذا كنت بحاجة إلى واحد). وبعيدًا عن ذلك، لا يزال يتعين عليك بذل الجهد لاختبار ما إذا كان المنطق الأساسي والتكامل لكل إطار عمل مناسبًا لحالة الاستخدام الخاصة بك. هذا أمر لا مفر منه. من وجهة نظر المراقب، من المهم أن نتذكر أن جميع أطر عمل وكلاء الذكاء الاصطناعي هذه لا يتجاوز عمرها ثلاثة أشهر. (نعم، يبدو الأمر أطول.) خلال ذلك الوقت، انتقلوا من الترويج المفرط لهم إلى أن أصبحوا يُطلق عليهم "قلاع في الهواء". هذه هي طبيعة التكنولوجيا. وعلى الرغم من هذه التقلبات، فإننا نعتقد أن هذه المساحة تمثل تجربة جديدة ومثيرة للاهتمام في عالم العملات المشفرة.
الأمر المهم التالي هو مدى نضوج هذه الأطر من حيث التكنولوجيا والربحية.
من حيث التكنولوجيا، فإن الميزة الأكبر التي يمكن للإطار أن يخلقها لنفسه هي تمكين الوكلاء من التفاعل بسلاسة على السلسلة. هذا هو السبب الأول الذي يجعل المطورين يختارون أطر العمل الأصلية المشفرة بدلاً من الأطر العامة. علاوة على ذلك، فإن الوكلاء وتكنولوجيا بناء الوكلاء هي قضايا تقنية متطورة في جميع أنحاء العالم، مع حدوث تطورات جديدة كل يوم. ويجب على الإطار أيضًا أن يستمر في التطور والتكيف مع هذه التطورات. والأمر الأكثر إثارة للاهتمام هو كيفية تحقيق الربح من هذا الإطار. في هذه الأيام الأولى، كان إنشاء منصة إطلاق مستوحاة من Virtuals بمثابة إنجاز سهل بالنسبة للمشروع. لكننا نعتقد أن هناك مجالًا كبيرًا للتجريب هنا. نحن نتجه نحو مستقبل يضم ملايين الوكلاء المتخصصين في كل مجال يمكنك تخيله. إن الأدوات التي تساعدهم على التنسيق بكفاءة قد تؤدي إلى تحقيق قيمة هائلة من رسوم المعاملات. وباعتبارها بوابة للمطورين، فإن الأطر هي بالتأكيد الأنسب لالتقاط هذه القيم. في الوقت نفسه، فإن تحقيق الربح من الأطر يتخفى أيضًا في صورة قضية تحقيق الربح من المشاريع مفتوحة المصدر ومكافأة المساهمين، الذين قاموا تاريخيًا بعمل مجاني وغير مجزٍ. إذا تمكن فريق ما من التوصل إلى حل لكيفية إنشاء اقتصاد مفتوح المصدر مستدام مع الحفاظ على أخلاقياته الأساسية، فإن التأثير سوف يمتد إلى ما هو أبعد من إطار الوكالة. هذه هي المواضيع التي نأمل أن نستكشفها في الأشهر المقبلة.