المؤلف: Wuyue, Geek web3
مع تكرار تقنية blockchain بشكل أسرع وأسرع، أصبح تحسين الأداء مشكلة رئيسية، وكانت خارطة طريق Ethereum واضحة جدًا هي المركز والمعاملة التسلسلية تعد خصائص المعالجة الخاصة بـ EVM قيدًا ولا يمكنها تلبية سيناريوهات الحوسبة عالية التزامن المستقبلية.
في المقالة السابقة——"بالنظر إلى طريق التحسين لـ EVM الموازي من Reddio"، قدمنا نظرة عامة موجزة عن أفكار تصميم EVM المتوازية لـ Reddio، واليوم في وفي هذه المقالة، سنقدم شرحًا أكثر تعمقًا للحل التقني ودمجه مع الذكاء الاصطناعي.
نظرًا لأن الحل الفني لـ Reddio يستخدم CuEVM، فهذا مشروع يستخدم GPU لتحسين كفاءة تنفيذ EVM. سنبدأ بـ CuEVM أولاً.
نظرة عامة على CUDA
CuEVM هو مشروع يستخدم GPU لتسريع EVM ويقوم بتحويل أكواد تشغيل Ethereum EVM إلى CUDA Kernels للتشغيل على التنفيذ المتوازي. نفيديا GPU. تحسين كفاءة تنفيذ تعليمات EVM من خلال إمكانيات الحوسبة المتوازية لوحدة معالجة الرسومات. غالبًا ما يسمع مستخدمو بطاقة N كلمة CUDA - Compute Unified Device Architecture، وهي في الواقع منصة حوسبة متوازية ونموذج برمجة تم تطويره بواسطة NVIDIA. فهو يتيح للمطورين الاستفادة من إمكانات الحوسبة المتوازية لوحدات معالجة الرسومات للحوسبة العامة (مثل التعدين في Crypto وعمليات ZK وما إلى ذلك)،وليس فقط معالجة الرسومات.
كإطار حوسبة متوازي مفتوح، يعد CUDA في الأساس امتدادًا للغة C/C++، ويمكن لأي مبرمج منخفض المستوى على دراية بـ C/C++ أن يبدأ بسرعة. أحد المفاهيم المهمة جدًا في CUDA هو Kernel (وظيفة kernel)، وهي أيضًا وظيفة C++.

ولكن على عكس وظائف C++ العادية التي يتم تنفيذها مرة واحدة فقط، يتم تشغيل وظائف kernel هذه بعد بناء الجملة <<<...>>>
سيتم تنفيذه N مرات بالتوازي بواسطة N سلاسل CUDA مختلفة عند استدعائها.

يتم تعيين معرف مؤشر ترابط مستقل لكل مؤشر ترابط في CUDA ويستخدم التسلسل الهرمي لمؤشر الترابط لتخصيص سلاسل الرسائل إلى كتل وشبكات لتسهيل إدارة عدد كبير من الخيوط المتوازية. من خلال برنامج التحويل البرمجي nvcc الخاص بـ NVIDIA، يمكننا تجميع كود CUDA في برنامج يمكن تشغيله على وحدة معالجة الرسومات.

سير العمل الأساسي لـ CuEVM
< p>بعد فهم سلسلة من المفاهيم الأساسية لـ CUDA، يمكنك إلقاء نظرة على سير عمل CuEVM.
المدخل الرئيسي لـ CuEVM هو run_interpreter، ومن هنا، يتم إدخال المعاملات التي سيتم معالجتها بالتوازي في شكل ملفات json. يمكن أن نرى من حالات استخدام المشروع أن المدخلات عبارة عن محتوى EVM قياسي، وليست هناك حاجة للمطورين للمعالجة والترجمة وما إلى ذلك بشكل منفصل.

كما ترون في run_interpreter()، فإنه يستخدم < يستدعي بناء الجملة <...>> وظيفة kernel_evm(). كما ذكرنا أعلاه، يتم استدعاء وظائف kernel بالتوازي على وحدة معالجة الرسومات.

سيتم استدعاء evm->run() بطريقة kernel_evm() يمكننا أن نرى أن هناك عددًا كبيرًا من الأحكام الفرعية لتحويل أكواد تشغيل EVM إلى عمليات CUDA.

بأخذ رمز عملية الإضافة OP_ADD في EVM كمثال، يمكنك أن ترى أنه سيتم تحويل ADD إلى cgbn_add. CGBN (الأرقام الكبيرة للمجموعات التعاونية) هي مكتبة العمليات الحسابية ذات الأعداد الصحيحة عالية الأداء ومتعددة الدقة الخاصة بـ CUDA.

تقوم هاتان الخطوتان بتحويل رمز تشغيل EVM إلى عملية CUDA. يمكن القول أن CuEVM يقوم أيضًا بتنفيذ جميع عمليات EVM على CUDA. أخيرًا، تقوم طريقة run_interpreter() بإرجاع نتيجة العملية، وهي الحالة العالمية والمعلومات الأخرى.
في هذه المرحلة، تم تقديم منطق التشغيل الأساسي لـ CuEVM.
يتمتع CuEVM بالقدرة على معالجة المعاملات بالتوازي، ولكن الغرض من مشروع CuEVM (أو حالة الاستخدام الرئيسية الموضحة) هو إجراء اختبار Fuzzing: Fuzzing هو نوع من الأتمتة تقنية اختبار البرمجيات التي تحدد الأخطاء المحتملة والمشكلات الأمنية عن طريق إدخال كميات كبيرة من البيانات غير الصالحة أو غير المتوقعة أو العشوائية في البرنامج لمراقبة استجابة البرنامج.
يمكننا أن نرى أن Fuzzing مناسب جدًا للمعالجة المتوازية. لا تتعامل CuEVM مع مشكلات مثل تعارض المعاملات، وهذا ليس من اختصاصها. إذا كنت ترغب في دمج CuEVM، فستحتاج أيضًا إلى التعامل مع المعاملات المتضاربة.
مقالنا السابق"النظر في تحسين EVM المتوازي من Reddio" تم تقديم آلية معالجة التعارض التي يستخدمها Reddio في المقالة ولن يتم تكرارها هنا. بعد أن يقوم Reddio بفرز المعاملات باستخدام آلية معالجة التعارض، يمكن بعد ذلك إرسالها إلى CuEVM. بمعنى آخر، يمكن تقسيم آلية فرز المعاملات في Reddio L2 إلى قسمين: معالجة التعارض + التنفيذ المتوازي لـ CuEVM.
الطبقة 2، وEVM الموازي، والتقاطع الثلاثي للذكاء الاصطناعي
كما ذكرنا أعلاه، فإن EVM وL2 المتوازيين هما فقط نقطة البداية لـ Reddio، و تجمع خارطة الطريق المستقبلية الخاصة بها بين السرد الصريح والذكاء الاصطناعي. يعد Reddio، الذي يستخدم وحدات معالجة الرسومات للمعاملات المتوازية عالية السرعة، مناسبًا بشكل طبيعي لحوسبة الذكاء الاصطناعي مع العديد من الميزات:
- < p>تتمتع وحدة معالجة الرسومات بقدرات معالجة متوازية قوية ومناسبة لتنفيذ عمليات الالتواء في التعلم العميق. هذه العمليات هي في الأساس عمليات ضرب مصفوفات واسعة النطاق، وقد تم تحسين وحدات معالجة الرسومات لمثل هذه المهام.
يمكن أن يتطابق الهيكل الهرمي للخيط لوحدة معالجة الرسومات مع العلاقات المقابلة لهياكل البيانات المختلفة في حوسبة الذكاء الاصطناعي، والتي يمكن تحسينها من خلال الإفراط في التزويد بالخيط ووحدات تنفيذ الاعوجاج حساب الكفاءة وإخفاء زمن وصول الذاكرة.
تعد كثافة الحوسبة مؤشرًا رئيسيًا لقياس أداء حوسبة الذكاء الاصطناعي. تعمل وحدة معالجة الرسومات على تحسين مضاعفة المصفوفات في حوسبة الذكاء الاصطناعي من خلال تحسين كثافة الحوسبة، مثل تقديم Tensor Core الأداء، وتحقيق التوازن الفعال بين الحوسبة ونقل البيانات.
إذًا كيف نجمع بين الذكاء الاصطناعي واللغة الثانية؟
نحن نعلم أنه في التصميم المعماري لمجموعة Rollup، فإن الشبكة بأكملها ليست مجرد جهاز تسلسل، ولكن لديها أيضًا أدوار مثل المشرفين ومعيدي التوجيه للتحقق من المعاملات أو جمعها بشكل أساسي نفس العميل مثل فارز، ولكنهم يؤدون وظائف مختلفة. في مجموعة التحديثات التقليدية، تكون وظائف وأذونات هذه الأدوار الثانوية محدودة للغاية. على سبيل المثال، يكون دور المراقب في Arbitrum سلبيًا ودفاعيًا ومصلحة عامة بشكل أساسي، كما أن نموذج الربح الخاص به مشكوك فيه أيضًا.
سوف يتبنى Reddio بنية فرز لا مركزية، وسيوفر القائمون بالتعدين وحدات معالجة الرسومات كعقد. يمكن لشبكة Reddio بأكملها أن تتطور من شبكة L2 خالصة إلى شبكة L2+AI شاملة، والتي يمكنها تنفيذ بعض حالات استخدام AI+blockchain بشكل جيد:
AI Agent Interactive basic الشبكة
مع التطور المستمر لتقنية blockchain، أصبحت إمكانات تطبيق AI Agent في شبكات blockchain ضخمة. لنأخذ وكلاء الذكاء الاصطناعي الذين يقومون بالمعاملات المالية كمثال. يمكن لهؤلاء الوكلاء الأذكياء اتخاذ قرارات معقدة بشكل مستقل وتنفيذ عمليات التداول، ويمكنهم أيضًا الاستجابة بسرعة في ظل ظروف عالية التردد. ومع ذلك، فمن المستحيل بشكل أساسي على L1 أن يحمل كميات ضخمة من المعاملات عند التعامل مع مثل هذه العمليات المكثفة.

باعتباره مشروع L2، يمكن لـ Reddio تحسين قدرات معالجة المعاملات المتوازية بشكل كبير من خلال وحدة معالجة الرسومات تسارع. بالمقارنة مع L1، فإن L2، الذي يدعم التنفيذ المتوازي للمعاملات، يتمتع بإنتاجية أعلى ويمكنه التعامل بكفاءة مع طلبات المعاملات عالية التردد من عدد كبير من وكلاء الذكاء الاصطناعي لضمان التشغيل السلس للشبكة.
في التداول عالي التردد، لدى وكلاء الذكاء الاصطناعي متطلبات صارمة للغاية بشأن سرعة المعاملة ووقت الاستجابة. يعمل L2 على تقليل وقت التحقق من المعاملات وتنفيذها، وبالتالي تقليل زمن الوصول بشكل كبير. يعد هذا أمرًا بالغ الأهمية لوكلاء الذكاء الاصطناعي الذين يحتاجون إلى الاستجابة على مستوى المللي ثانية. من خلال ترحيل عدد كبير من المعاملات إلى L2، يتم أيضًا تخفيف مشكلة الازدحام في الشبكة الرئيسية بشكل فعال. جعل تشغيل وكلاء الذكاء الاصطناعي أكثر فعالية من حيث التكلفة.
مع نضوج مشاريع L2 مثل Reddio، سيلعب AI Agent دورًا أكثر أهمية في blockchain، مما يعزز ابتكار DeFi وسيناريوهات تطبيق blockchain الأخرى جنبًا إلى جنب مع الذكاء الاصطناعي.
سوق طاقة الحوسبة اللامركزية
سيعتمد Reddio بنية فارز لا مركزية في المستقبل. سيستخدم عمال المناجم قوة الحوسبة GPU لتحديد حقوق الفرز بشكل عام ستتحسن وحدات معالجة الرسومات الخاصة بالمشاركين في الشبكة تدريجيًا مع المنافسة، ويمكنها أيضًا الوصول إلى المستوى المستخدم في تدريب الذكاء الاصطناعي.
قم ببناء سوق طاقة حوسبة لامركزية لوحدة معالجة الرسومات لتوفير موارد حوسبة منخفضة التكلفة للتدريب والاستدلال في مجال الذكاء الاصطناعي. بدءًا من قوة الحوسبة الصغيرة إلى الكبيرة، ومن أجهزة الكمبيوتر الشخصية إلى مجموعات غرف الكمبيوتر، يمكن لجميع مستويات قوة حوسبة وحدة معالجة الرسومات الانضمام إلى السوق للمساهمة في قوة الحوسبة الخاملة وكسب الدخل. يمكن لهذا النموذج تقليل تكاليف حوسبة الذكاء الاصطناعي والسماح لعدد أكبر من الأشخاص بالمشاركة تطوير النموذج وتطبيقه.
في حالة استخدام سوق طاقة الحوسبة اللامركزية، قد لا يكون جهاز التسلسل مسؤولاً بشكل أساسي عن الحساب المباشر للذكاء الاصطناعي، وتتمثل وظيفته الرئيسية في معالجة المعاملات وتنسيق قوة حوسبة الذكاء الاصطناعي في الشبكة بأكملها. أما بالنسبة لقوة الحوسبة وتخصيص المهام، فهناك وضعان:
الأعلى التلقائي- أسفل التوزيع المركزي. بفضل الفارز، يمكن للفارز تخصيص طلبات طاقة الحوسبة المستلمة للعقد التي تلبي المتطلبات وتتمتع بسمعة جيدة. على الرغم من أن طريقة التخصيص هذه تعاني من مشاكل المركزية وعدم العدالة من الناحية النظرية، إلا أن مزايا الكفاءة التي تجلبها تفوق بكثير عيوبها، وعلى المدى الطويل، يجب أن يفي جهاز الفرز بالمجموع الإيجابي للشبكة بأكملها من أجل التطوير على المدى الطويل أي أن هناك قيودًا ضمنية ولكن مباشرة تضمن عدم انحياز أداة الفرز.
اختيار المهام تلقائيًا من القاعدة إلى القمة. يمكن للمستخدمين أيضًا إرسال طلبات حوسبة الذكاء الاصطناعي إلى عقد تابعة لجهات خارجية، وفي مجالات تطبيق محددة للذكاء الاصطناعي، من الواضح أن هذا أكثر كفاءة من إرسالها مباشرة إلى جهاز التسلسل، ويمكنه أيضًا منع الرقابة والتحيز من قبل جهاز التسلسل. بعد اكتمال العملية، ستقوم العقدة بمزامنة نتائج العملية مع جهاز التسلسل وتحميلها إلى السلسلة.
يمكننا أن نرى أنه في بنية L2 + AI، يتمتع سوق طاقة الحوسبة بمرونة عالية للغاية ويمكن تركيزه في اتجاهين للتسوية الطاقة، وتعظيم الاستفادة من الموارد.
استدلال الذكاء الاصطناعي على السلسلة
في الوقت الحالي، أصبح النموذج مفتوح المصدر ناضجًا بما يكفي لتلبية الاحتياجات المتنوعة. من خلال توحيد خدمات الاستدلال بالذكاء الاصطناعي، من الممكناستكشاف كيفية وضع قوة الحوسبة في السلسلة لتحقيق التسعير الآلي. ومع ذلك، يتطلب هذا التغلب على العديد من التحديات التقنية:
كفاءة توزيع الطلب وتسجيله: يتطلب الاستدلال النموذجي الكبير متطلبات زمن استجابة عالية، وتعد آلية توزيع الطلب الفعالة أمرًا بالغ الأهمية. على الرغم من أن بيانات الطلب والاستجابة كبيرة وخاصة ولا ينبغي نشرها للعامة على blockchain، إلا أنه يجب إيجاد توازن بين التسجيل والتحقق - على سبيل المثال، عن طريق تخزين التجزئة.
التحقق من مخرجات عقدة طاقة الحوسبة: هل أكملت العقدة بالفعل مهام الحوسبة المحددة؟ على سبيل المثال، تستخدم التقارير الخاطئة للعقدة نتائج حساب النماذج الصغيرة بدلاً من النماذج الكبيرة.
استدلال العقود الذكية: يعد الجمع بين نماذج الذكاء الاصطناعي والعقود الذكية لإجراء العمليات الحسابية أمرًا ضروريًا في العديد من السيناريوهات. نظرًا لأن منطق الذكاء الاصطناعي غير مؤكد ولا يمكن استخدامه في جميع جوانب السلسلة، فمن المحتمل أن يكون منطق تطبيقات الذكاء الاصطناعي المستقبلية موجودًا جزئيًا خارج السلسلة والجزء الآخر موجود في العقود الموجودة على السلسلة المدخلات المقدمة خارج السلسلة محدودة بطبيعتها والشرعية العددية. في النظام البيئي لـ Ethereum، يجب أن يواجه الدمج مع العقود الذكية التسلسل غير الفعال لـ EVM.
ولكن في بنية Reddio، من السهل نسبيًا حل هذه المشكلات:
يعد توزيع الطلبات بواسطة أداة الفرز أكثر كفاءة بكثير من L1، ويمكن اعتباره مساويًا لكفاءة Web2. أما بالنسبة لموقع التسجيل وطريقة الاحتفاظ بالبيانات، فيمكن حلها من خلال العديد من حلول DA الرخيصة.
يمكن في النهاية التحقق من نتائج عمليات الذكاء الاصطناعي بواسطة ZKP للتحقق من صحتها وحسن نيتها. ما يميز ZKP هو أن التحقق سريع جدًا، لكن إنشاء البراهين بطيء. يمكن أيضًا تسريع إنشاء ZKP باستخدام GPU أو TEE.
Solidty → CUDA → GPU، الخط الرئيسي الموازي EVM، هو أساس Reddio. لذا، ظاهريًا، يبدو أن هذه هي المشكلة الأسهل بالنسبة لـ Reddio. تتعاون Reddio حاليًا مع eliza من AiI6z لتقديم وحداتها إلى Reddio، وهذا اتجاه يستحق الاستكشاف.
الملخص
بشكل عام، يبدو أن مجالات حلول Layer2 وتقنية EVM وتقنية الذكاء الاصطناعي غير مرتبطة ببعضها البعض ، لكن Reddio يجمع بذكاء بين مجالات الابتكار الرئيسية هذه من خلال الاستفادة الكاملة من خصائص الحوسبة الخاصة بوحدة معالجة الرسومات.
من خلال الاستفادة من خصائص الحوسبة المتوازية لوحدة معالجة الرسومات، يعمل Reddio على تحسين سرعة المعاملات وكفاءتها على الطبقة الثانية، وبالتالي تعزيز أداء الطبقة الثانية من Ethereum. يعد دمج تقنية الذكاء الاصطناعي في blockchain محاولة جديدة وواعدة. يمكن أن يوفر إدخال الذكاء الاصطناعي تحليلاً ذكيًا ودعمًا لاتخاذ القرار للعمليات على السلسلة، وبالتالي تحقيق تطبيقات blockchain أكثر ذكاءً وديناميكية. مما لا شك فيه أن هذا التكامل بين المجالات قد فتح مسارات وفرصًا جديدة لتطوير الصناعة بأكملها.
ومع ذلك، تجدر الإشارة إلى أن هذا المجال لا يزال في مراحله الأولى وما زال يتطلب الكثير من البحث والاستكشاف. إن التكرار المستمر للتكنولوجيا وتحسينها، بالإضافة إلى خيال وأفعال رواد السوق، سيكون بمثابة القوى الدافعة الرئيسية لنضج هذا الابتكار. لقد اتخذت Reddio خطوة مهمة وجريئة في هذا التقاطع، ونحن نتطلع إلى رؤية المزيد من الاختراقات والمفاجآت في مجال التكامل هذا في المستقبل.