تشهد الساحة التقنية حاليًا اتجاهًا جديدًا مثيرًا للجدل: يعتمد عدد متزايد من المستخدمين على ChatGPT من OpenAI لتحديد الموقع الجغرافي للصور التي يرفعونها على المنصة.
أطلقت شركة OpenAI هذا الأسبوع أحدث نماذجها الذكية، o3 وo4-mini، وهما يتميزان بقدرات متقدمة في التحليل البصري المنطقي للصور. يمكن لهذين النموذجين تدوير الصور وتكبيرها واقتصاصها وتحليلها حتى وإن كانت مشوشة أو منخفضة الجودة.
تُعد هذه القدرة، عندما تُقرن بإمكانية البحث عبر الإنترنت، أداة فعالة للغاية لتحديد المواقع. حيث أثبت النموذج o3، بشكل خاص، دقة ملحوظة في تحديد المدن والمعالم والمطاعم والحانات فقط من خلال إشارات بصرية دقيقة في الصور.
التفاعل المجتمعي والسلوك الجديد للمستخدمين
لم ينتظر مستخدمو منصة X كثيرًا، إذ بدأوا سريعًا بمشاركة صور لواجهات مطاعم، أحياء سكنية، قوائم طعام، وحتى صور شخصية، وطلبوا من ChatGPT “تخمين” الموقع كما لو كان يلعب لعبة GeoGuessr الشهيرة، التي تعتمد على لقطات من Google Street View لتحديد الأماكن.
مخاوف الخصوصية: هل يتم استخدامها بشكل ضار؟
تكمن المخاوف الحقيقية في أن بعض الأفراد قد يستغلون هذه القدرة لخرق الخصوصية، كأن يلتقطوا لقطة شاشة من “قصة إنستغرام” لشخص ما ويطلبوا من ChatGPT تحديد موقعها.
ورغم أن هذه التقنية كانت ممكنة إلى حدٍ ما في السابق، فإن قوة نموذج o3 تفتح الباب أمام دقة غير مسبوقة في هذا المجال.
مقارنة بين النماذج: o3 مقابل GPT-4o
قام فريق TechCrunch باختبار عدة صور عبر نموذج o3 ونموذج GPT-4o الأقدم، الذي لا يملك القدرة على التحليل البصري المتقدم. والنتيجة كانت مفاجئة: GPT-4o وصل إلى نفس الموقع الصحيح في أغلب الحالات، بل وفي وقت أقل.
ومع ذلك، برز نموذج o3 في مواقف معينة. فمثلًا، عند تحليل صورة لرأس وحيد قرن أرجواني معلق في حانة خافتة الإضاءة، استطاع o3 تحديد الموقع بدقة بأنه من حانة سرّية في حي ويليامزبرغ، بينما أخطأ GPT-4o وظنها حانة بريطانية.
القيود والتحفظات في الأداء
لكن لا يمكن القول بأن o3 معصوم عن الخطأ. فقد فشل في عدة اختبارات، حيث علق في حلقات من التفكير دون الوصول لإجابة، أو قدم نتائج خاطئة.
كما أشار عدد من المستخدمين إلى أن تقديرات o3 قد تكون بعيدة عن الواقع أحيانًا، ما يطرح تساؤلات عن حدود دقة هذه النماذج.
غياب الضوابط الأمنية وسؤال مفتوح لـ OpenAI
يعكس هذا الاتجاه مخاطر ناشئة من نموذج الذكاء الاصطناعي القائم على “الاستدلال”. ومن اللافت أن تقرير الأمان الصادر عن OpenAI بشأن نماذجي o3 وo4-mini لم يتطرق إلى مشكلة “البحث العكسي عن الموقع الجغرافي من الصور”.
وقد تواصلت TechCrunch مع شركة OpenAI لطلب تعليق رسمي.
تحديث: رد OpenAI الرسمي
في وقت لاحق من مساء يوم النشر، أصدرت OpenAI بيانًا جاء فيه:
“تقدم نماذج o3 وo4-mini إمكانات الاستدلال البصري في ChatGPT، ما يجعلها مفيدة في مجالات مثل سهولة الوصول، البحث، أو تحديد المواقع في حالات الطوارئ. لقد عملنا على تدريب النماذج لرفض الطلبات المتعلقة بالمعلومات الخاصة أو الحساسة، وأضفنا ضوابط لمنع التعرف على الأفراد في الصور، ونقوم بمراقبة الاستخدام واتخاذ إجراءات ضد إساءة الاستخدام.”