Home وثائق قضائية تكشف: موظفو ميتا ناقشوا استخدام محتوى محمي بحقوق النشر لتدريب الذكاء الاصطناعي

فبراير 27, 2025

وثائق قضائية تكشف: موظفو ميتا ناقشوا استخدام محتوى محمي بحقوق النشر لتدريب الذكاء الاصطناعي

واشنطن، 21 فبراير 2025 – كشفت وثائق قضائية حديثة أن موظفي ميتا ناقشوا داخليًا

شارك الان

واشنطن، 21 فبراير 2025 – كشفت وثائق قضائية حديثة أن موظفي ميتا ناقشوا داخليًا استخدام محتوى محمي بحقوق النشر بطرق مشكوك فيها قانونيًا، لتدريب نماذج الذكاء الاصطناعي الخاصة بالشركة، وفقًا لملفات دعوى تم الكشف عنها يوم الخميس.

تأتي هذه الوثائق ضمن تفاصيل قضية Kadrey v. تدافع ميتا لتدريب الباحثين على أعمال ويحافظ على الطبع، مثل الكتب، يندرج تحت الاستخدام العادل، لكنن، ومن بينهم سارة سيلفرمان وتا-نهيسي كوتس، لا يسمحون بتشغيل.

محادثات داخلية تكشف خططًا مثيرة للجدل

وفقًا للملفات الجديدة، تضمنت المحادثات الداخلية بين موظفي ميتا إشارات واضحة إلى استخدام محتوى محمي دون تصاريح رسمية.

في إحدى الدردشات، كتب كزافييه مارتينيه، وهو مهندس أبحاث في الشركة:

“رأيي هو: نحصل على الكتب ونرفع الأمر للإدارة العليا لاتخاذ القرار… هذا هو السبب في إنشاء قسم الذكاء الاصطناعي التوليدي، حتى نكون أقل تحفظًا بشأن المخاطر.”

وأضاف مارتينيه أن شراء الكتب الإلكترونية مباشرة قد يكون بديلاً أسرع من التفاوض على اتفاقيات الترخيص مع الناشرين، مشيرًا إلى أن العديد من الشركات الناشئة ربما تستخدم بالفعل محتوى مقرصنًا.

ميتا والنقاش حول Libgen: مصدر بيانات مثير للجدل

كشفت الوثائق أيضًا أن موظفي ميتا ناقشوا إمكانية استخدام Libgen، وهو موقع يتيح الوصول إلى كتب مقرصنة، كمصدر بيانات محتمل لتدريب نماذج الذكاء الاصطناعي.

في رسالة بريد إلكتروني متشوقة إلى جويل بينو، نائب رئيس الذكاء الاصطناعي في ميتا، وصف سوني ثيكاناث، مدير إدارة المنتجات، Libgen الأصلي.

“ضروري لتحقيق أفضل النتائج عبر جميع الفئات.”

وطرح مقترحات ديكاناث لقوانين محدودة قليلة التنوع، بما في ذلك البيانات التي تحمل عبارات مثل “مقرصن” أو “مسروق”، وأوصى بعدم الإفصاح عن استخدام Libgen في الارتباطات التفاعلية.

تدابير لتجنب القضايا القانونية

تضمنت المحادثات أيضًا مناقشات حول تعديل النماذج لتجنب المطالبات المتعلقة بحقوق النشر. حيث ذكرت ميلاني كامبادور، مديرة أبحاث نموذج Llama في ميتا، أن فريق الذكاء الاصطناعي قام بتعديل النماذج بحيث ترفض الإجابة على استفسارات مثل:

“أعد إنتاج أول ثلاث صفحات من ’هاري بوتر وحجر الفيلسوف‘.”

“ما هي الكتب الإلكترونية التي تم تدريب النموذج عليها؟”

ميتا بحاجة إلى المزيد من البيانات

وفقًا لملفات الحالة ، ناقش السبب لماذا ميتا إعادة النظر في مصادر التدريب، بما في ذلك إمكانية استخدام محتوى من Quora، ومقالات علمية مرخصة، رغم أنها ليست كذلك.

في إحدى الدردشات الداخلية، كتبت تشايا نايك، مديرة إدارة المنتجات في قسم الذكاء الاصطناعي التوليدي، أن: