وورلد لابز شركة ناشئة تأسست عام ٢٠٢٤ على يد فاي فاي لي، خبيرة الذكاء الاصطناعي الشهيرة وأستاذة في جامعة ستانفورد، مُكرسة لتطوير الجيل القادم من أنظمة الذكاء الاصطناعي المزودة بـ"الذكاء المكاني".
منذ تأسيسها، أكملت وورلد لابز جولتين من التمويل، وجمعت ما مجموعه حوالي ٢٣٠ مليون دولار أمريكي. ومن بين المستثمرين الرئيسيين: a16z، وRadical Ventures، وNEA، وNVIDIA NVentures، وAMD Ventures، وIntel Capital. تجاوزت قيمة الشركة مليار دولار أمريكي في ثلاثة أشهر فقط، مما يجعلها شركة ناشئة جديدة في مجال الذكاء الاصطناعي.
مؤخرًا، أجرت فاي فاي لي محادثة مع شريكين في a16z، وهما مارتن كاسادو وإريك تورينبرغ. لأول مرة، تحدثت علنًا عن بناء المفهوم، واتجاه البحث، والرؤية الشاملة وراء مشاركتهما في تأسيس مختبرات العالم. ماضي وحاضر استراتيجية منصة a16z: من رأس المال الاستثماري "غير الراغب في التنظيف" إلى "الخدمة الشاملة". أشارت فاي فاي لي إلى جوهر هذه المحادثة في البداية: "لا أحتاج إلى نموذج لغوي كبير لإقناعي، نموذج العالم هو الاتجاه الأهم حقًا". وأكدت أن الذكاء المكاني - سواء كان العالم المادي ثلاثي الأبعاد الذي نعيش فيه أو الكون الرقمي المُتخيل - جزء لا غنى عنه من الذكاء. واليوم، لدينا أخيرًا القدرة على توليد هذه الأكوان وإعادة بنائها.
▍ذكاءٌ أقدم من اللغة: الإدراك المكاني وإعادة البناء ثلاثي الأبعاد
أشارت فاي فاي لي إلى أن الإدراك المكاني، مقارنةً باللغة، يُعدّ قدرةً أقدم وأكثر غريزيةً في عملية التطور البشري. وشاركت تجربتها الشخصية: قبل بضع سنوات، فقدت مؤقتًا بصرها المجسم بسبب إصابة في القرنية. خلال تلك الفترة، لم تجرؤ على القيادة بمفردها. حتى في الشوارع المألوفة، كان من الصعب تقدير المسافة من السيارة المجاورة لها.
جعلتها هذه التجربة التجريبية تُدرك بعمق الدور الأساسي لنظام الإدراك ثلاثي الأبعاد في أفعال البشر. بالنسبة للذكاء الاصطناعي، إذا لم يتمكن من بناء نموذج ثلاثي الأبعاد للعالم، فلن يتمكن من فهم العالم الحقيقي أو تشغيله أو إعادة بنائه حقًا.
أضاف مارتن كاسادو أن نقص هذا الذكاء ثلاثي الأبعاد هو السبب الرئيسي لبطء وصول الروبوتات والأنظمة الذكية المجسدة. واستخدم مثالًا شائعًا للتوضيح: إذا أخذت شخصًا إلى غرفة غير مألوفة، وعصبت عينيه، واستخدمت اللغة فقط لوصف المكان، ثم طلبت منه إكمال مهمة - فسيكون ذلك مستحيلًا تقريبًا. بمجرد فتح العينين، يمكن للدماغ إعادة بناء النموذج المكاني تلقائيًا وإكمال الإجراء. هذه القدرة على إعادة البناء مفقودة تمامًا في نموذج اللغة السائد الحالي. ▍النقطة التقنية الحاسمة من NeRF إلى نموذج العالم
بالحديث عن سبب اختيارها لتأسيس مختبرات العالم في هذا الوقت، تعتقد فاي فاي لي أن هذا نتيجة بحث أكاديمي طويل الأمد وتراكم أساسيات صناعية.
وتذكرت أنه قبل أربع سنوات، فتح اكتشاف بحثي يُسمى NeRF (مجال الإشعاع العصبي) آفاقًا جديدة للنمذجة المرئية ثلاثية الأبعاد. ومقترح NeRF هو بن ميلدنال، أحد المؤسسين المشاركين الحاليين لمختبرات العالم. أجرى كريستوفر، أحد مؤسسي الشركة، بحثًا رائدًا في مجال التمثيل ثلاثي الأبعاد الفعّال، مما عزز عودة النمذجة ثلاثية الأبعاد الحجمية في هذا المجال. بالتعاون مع جاستن جونسون، الذي طبّق تقنية الشبكات المولدة التنافسية لنقل أنماط الصور في بداياتها، يُمكن الآن دمج نتائج البحث المتفرقة هذه في فريق واحد، مع التركيز على هدف "نجم الشمال": بناء قدرات الذكاء الاصطناعي في مجال نماذج العالم. عزا مارتن هذا الهدف إلى التكامل العميق بين نظامين: أحدهما نموذج الذكاء الاصطناعي والبيانات والهندسة المعمارية نفسها، والآخر نظام هندسة عرض الرسومات وإعادة بناء الفضاء. وتُعدّ القدرة على تمكين خبراء هذين العالمين من التعاون بكفاءة على منصة واحدة بحد ذاتها ابتكارًا تنظيميًا مهمًا في قطاع التكنولوجيا. ▍نموذج اللغة ليس النهاية، بل هو المقدمة
أكدت لي فاي فاي أن إيمانها بنموذج العالم لم ينبع من خيبة أملها في ماجستير القانون، بل من فهم أعمق لطبيعة الذكاء. وأشارت إلى أن اللغة هي أسلوب إدراكي يعتمد على "الضغط الفاقد"، يُجرد العالم ولكنه يفقد أيضًا معلومات مادية وإدراكية غنية. فالعالم الحقيقي لا يحتوي على كلمات أو قواعد أو نصوص، بل فقط فيزياء وحركة وبنية ثلاثية الأبعاد. غيّر هذا الرأي أيضًا نظرتها للشكل الذي ينبغي أن تتخذه شركات الذكاء الاصطناعي. تحولت من أستاذة في جامعة ستانفورد إلى رائدة أعمال، إذ أدركت أن البحث الأكاديمي وحده لا يكفي لتحقيق نمذجة الذكاء المكاني - فهو يتطلب استثمارًا في قوة الحوسبة الصناعية، وجدولةً لهندسة النظام، وقدرةً تعاونيةً من أفضل المواهب العابرة للحدود. لا يمكن تطبيق كل هذا فعليًا إلا في شركة تتمتع بمستوى عالٍ من التنظيم وقدرات تعاون هندسية متكاملة ومتميزة.
▍تطبيقات الذكاء المكاني تتفوق على الروبوتات بكثير
بالنسبة لمعظم الناس، لا يزال "نموذج العالم" مصطلحًا بحثيًا علميًا مجردًا. لكن فاي فاي لي ومارتن أشارا معًا إلى أن تطبيقاته تتفوق بكثير على القيادة الذاتية والروبوتات.
الإبداع في جوهره بصري. يعتمد التصميم الصناعي، وصناعة الأفلام، والتركيب المعماري، وحتى تطوير الألعاب، جميعها على البناء والمعالجة ثلاثية الأبعاد.إذا امتلك الذكاء الاصطناعي قدرات نموذج العالم، فلن يتمكن فقط من "فهم" العالم ثلاثي الأبعاد، بل أيضًا من "إنشاء" و"تشغيل" الفضاء الافتراضي. وصف مارتن أنه بمجرد صورة طاولة، يمكن للنموذج استنتاج شكلها والمادة خلفها، ثم بناء مشهد مكاني متكامل. بناءً على ذلك، يمكن للمستخدمين قياس المساحة أو إضافتها أو حذفها أو إعادة تصميمها. تُعد هذه طريقة تفاعل بين الإنسان والحاسوب أكثر سهولة وحرية من التعليمات النصية، كما أنها تفتح آفاقًا جديدة للتصميم والإبداع وتجارب المحاكاة. اقترحت لي فايفي أيضًا أن الفضاء الرقمي يُتيح فرصةً غير مسبوقة للتغيير: "لم يعش البشر حتى الآن إلا في عالمٍ مادي ثلاثي الأبعاد. لكن العالم الرقمي سيُتيح لنا دخول "الكون المتعدد" لأول مرة." وسردت عدة أمثلة: بعض الأكوان مصممة خصيصًا للروبوتات، وبعضها لخدمة الإبداع البشري، وبعضها يُستخدم للسرد والتواصل وتجربة السفر. هذه المساحات التي كانت في السابق مجرد خيال، ستُولّد الآن وتُفهم وتُستخدم وتُحوّل بواسطة الآلات. ▍المعركة القادمة للنماذج الأساسية، النمذجة البانورامية ثلاثية الأبعاد
بالعودة إلى التكنولوجيا نفسها، أكدت فاي فاي لي أن مختبرات العالم لا تهدف فقط إلى إنشاء ذكاء اصطناعي "يستطيع الرؤية"، بل أيضًا إلى تمكين الذكاء الاصطناعي من فهم البنية ثلاثية الأبعاد وديناميكيات العالم ومنطقه التركيبي. هذه ليست مجرد مشكلة هندسية أكثر صعوبة، بل هي أيضًا فلسفة تمثيل جديدة.
تعتقد أن الاكتشافات العلمية، مثل البنية الحلزونية المزدوجة للحمض النووي وكرات الباكي، تُمثل بلورة الذكاء المكاني. من المستحيل استنتاج مثل هذه الهياكل الهندسية من خلال اللغة فقط. لهذا السبب، لا يقتصر دور نموذج العالم على تحسين قدرة الآلات على الفهم فحسب، بل يفتح أيضًا آفاقًا إبداعية جديدة للعلوم الإنسانية والفنون.
خلص مارتن إلى أن الثورة التي أحدثتها ماجستير القانون تُثبت حقيقةً مفادها: عندما نجد بنية البيانات وتمثيل النموذج المناسبين، ستتحسن قدرة الذكاء الاصطناعي بشكل كبير. والآن، يعتقدون أن "نموذج العالم" يقف عند نقطة حرجة مماثلة.
▍مفتاح فهم العالم وبنائه
"في الواقع، نحن نسير عكس اتجاه التطور." عندما طرح مارتن وجهة النظر هذه، اتجه النقاش برمته إلى المستوى الفلسفي. اللغة من أحدث مراحل تطور الدماغ البشري، بينما وُجد نظام الإدراك المكاني منذ المفصليات، أي قبل 500 مليون سنة. الذكاء الاصطناعي اليوم، إن كان يتعلم اللغة فقط، لا يُمكن وصفه بـ"فهم العالم". فقط من خلال بناء نموذج فضائي شبيه بالإنسان يُمكن للذكاء الاصطناعي أن يدخل عالم "الذكاء المُجسّد". واختتمت فاي فاي لي حديثها بنبرتها الحازمة المعتادة: "كنت أنتظر هذا اليوم بفارغ الصبر. ليس لأنني لا أؤمن بنماذج اللغة، بل لأنني أعلم جيدًا أن العالم الحقيقي ليس نصًا." ونموذج العالم هو مفتاح الذكاء الاصطناعي لفهم هذا العالم وبنائه حقًا. من I/O إلى iO، سيعمل جوني إيف على الترويج لحركة تصميم جديدة - حيث تعمل الذكاء الاصطناعي على إعادة كتابة نموذج الحوسبة وتعريف الأجهزة، كما أنها تشكل ساحة معركة جديدة بعد النموذج الكبير.