Please enable Javascript
تخطٍ للوصول إلى المحتوى الرئيسي
من البكسلات إلى الإدراك — كيف تمكّن تسمية دمج المستشعرات ثلاثية الأبعاد القابلة للتوسع الموجة القادمة من الذكاء الاصطناعي الفيزيائي
October 29, 2025

البيانات وراء الذكاء الجسدي

كل روبوت يتنقل في أرضية المصنع، وكل مركبة ذاتية القيادة تكتشف أحد المشاة، وكل طائرة بدون طيار تهبط على هدف متحرك تعتمد جميعها على شيء واحد: بيانات موصوفة عالية الجودة. ومع ازدياد تعقيد الذكاء الاصطناعي الفيزيائي، يزداد تعقيد خط أنابيب البيانات الخاص به أيضاً. يجب على أنظمة الروبوتات والأنظمة الذاتية القيادة فهم المدخلات القادمة من الكاميرات، وأجهزة الليدار، والرادارات، ووحدات القياس بالقصور الذاتي (IMUs)، وأجهزة استشعار GPS — وغالباً في الوقت الفعلي. هنا تصبح عملية توصيف البيانات من دمج مستشعرات ثلاثية الأبعاد أمراً بالغ الأهمية.

تحدي الإدراك في أنظمة الذكاء الاصطناعي الفيزيائية

تعتمد أنظمة الذكاء الاصطناعي الفيزيائية الحديثة على الإدراك متعدد الوسائط — الرؤية، الاستشعار وفهم البيئة المحيطة بها. لكن البيانات الخام التي تلتقطها تكون فوضوية:

  • سحب نقاط الليدار التي تحتوي على ملايين النقاط في كل إطار.
  • إشارات الرادار التي تلتقط العمق والسرعة ولكن ليس الشكل.
  • تدفقات الفيديو من كاميرات RGB أو الأشعة تحت الحمراء.
  • إشارات القصور الذاتي وGPS التي تتطلب محاذاة زمنية.

جمع هذه التدفقات معًا في مجموعة بيانات موحدة يتطلب خط معالجة دمج وفريق عمل يفهم الهندسة ثلاثية الأبعاد، وإطارات الإحداثيات ومعايرة الحساسات. وضع مربعات التحديد ثنائية الأبعاد التقليدية لم يعد كافيًا.

لماذا يُعد تصنيف البيانات ثلاثية الأبعاد معقدًا للغاية — ومكلفًا جدًا

يتطلب تصنيف بيانات ثلاثية الأبعاد أدوات وخبرات متخصصة:

  • يجب أن تتطابق الصناديق ثلاثية الأبعاد وتقسيم الدلالات بدقة مع مصفوفات معايرة المستشعرات.
  • تزامن الوقت بين عدة مستشعرات يضمن أن الإطارات تمثل نفس اللحظة.
  • معالجة الحجب وتتبع الإطارات المتعددة** يحددان ما إذا كان الكائن سيظهر مجددًا أو يخرج عن نطاق الرؤية.
  • اتساق التعليقات التوضيحية واتفاقية المعلقين (IAA) تؤثر بشكل مباشر على أداء النموذج.

وبسبب هذه التحديات، تواجه العديد من الشركات اختناقات في تدريب نماذج الإدراك — مثل محدودية السعة، وضعف الجودة، وطول أوقات التسليم. ولهذا السبب يتجهون إلى شركاء بمستوى المؤسسات يمكنهم تقديم خطوط تعليق توضيحي قابلة للتوسع والتدقيق.

تصنيف دمج المستشعرات — مستقبل توصيف بيانات الروبوتات

يعمل تصنيف دمج المستشعرات على جمع البيانات من عدة مصادر (ليدار، رادار، فيديو) لإنشاء تمثيل أكثر ثراءً للعالم المادي. بالنسبة للروبوتات والمركبات ذاتية القيادة، يعني ذلك:

  • دقة أعلى في اكتشاف الأجسام في ظروف الإضاءة الضعيفة أو الطقس السيئ. تحسين تقدير العمق والسرعة.
  • فهم أكثر قوة للمشهد من خلال مدخلات المستشعرات المتقاطعة والمُتحقق منها.
  • مناطق عمياء أقل وحالات فشل أقل في الحالات النادرة.

قضت حلول الذكاء الاصطناعي في أوبر عشر سنوات في تطوير هذه العملية عبر منصة التنقل الخاصة بها وبرامج الشركاء حول العالم.

الخلاصة — من البيانات الخام إلى الإدراك في العالم الحقيقي

الذكاء الاصطناعي الفيزيائي لا يكون جيدًا إلا بقدر جودة البيانات التي تعلمه الرؤية والتصرف. من خلال دمج تقنية تصنيف المستشعرات المتقدمة مع شبكة بشرية عالمية وأطر جودة صارمة، تمكّن حلول Uber AI الشركات من بناء روبوتات ومركبات وآلات موثوقة تعمل بأمان في العالم الحقيقي.