أطلقت شركة جوجل يوم الأربعاء تحديثات جديدة على نماذج الذكاء الاصطناعي الخاصة بها لتوليد المحتوى الإعلامي. هذه النماذج متاحة عبر منصة Vertex AI السحابية.
يقدم نموذج Lyria لتوليد الموسيقى من النصوص تجربة تجريبية حالياً لعدد محدود من العملاء. كما عززت جوجل نموذج الفيديو Veo 2 بخيارات جديدة لتحرير الفيديو وتخصيص المؤثرات البصرية. أطلقت الشركة أيضًا ميزة استنساخ الصوت المدعومة من نموذج Chirp 3 لفئة مختارة من المستخدمين. وأخيرًا، أضافت تحسينات كبيرة على مولد الصور Imagen 3 الذي أصبح يقدم أداءً محسناً بشكل ملحوظ.
تأتي هذه التحديثات ضمن فعاليات Cloud Next، حيث تسعى جوجل لتعزيز موقعها في سوق الذكاء الاصطناعي المؤسسي. وتتنافس الشركة بشكل مباشر مع أمازون، التي تقدم منصة Bedrock السحابية مع نماذج ذكاء اصطناعي خاصة بها.
نموذج Lyria.. بديل لمكتبات الموسيقى المجانية
تروج جوجل لنموذج Lyria كبديل مبتكر لمكتبات الموسيقى الخالية من حقوق الملكية. يمكن للعملاء من خلاله إنشاء أغانٍ بأنماط مختلفة، تتراوح بين مقطوعات البيانو الجازية إلى موسيقى الـ Lo-fi.
Chirp 3 وصوت مخصص بـ35 لغة
يدعم نموذج Chirp 3 تقنية تحويل النص إلى كلام بأكثر من 35 لغة. تم الكشف عنه لأول مرة في بداية العام الحالي، وهو المحرك وراء ميزة Instant Custom Voice، التي تتيح استنساخ الصوت باستخدام 10 ثوانٍ فقط من تسجيل صوتي. أصبح النموذج متاحًا الآن بشكل عام. كما يدعم Chirp 3 أداة جديدة تُسمى Transcription with Diarization، التي تميز المتحدثين المختلفين داخل التسجيلات متعددة المشاركين.
ولتجنب سوء الاستخدام، تخضع ميزة Instant Custom Voice لعملية تدقيق لضمان حصول المستخدمين على التصاريح اللازمة لاستخدام الأصوات.
ميزات Veo 2 الجديدة لتحرير الفيديو
يتيح نموذج Veo 2 الآن إزالة الخلفيات والشعارات والأجسام غير المرغوب فيها من مقاطع الفيديو. يمكنه أيضًا تمديد إطارات الفيديو لتحويل الفيديو من الوضع العرضي إلى العمودي. بالإضافة إلى ذلك، يمكن تعديل زوايا الكاميرا وسرعة المشاهد المُنشأة بالذكاء الاصطناعي. هذا يسمح بإنشاء تأثيرات مثل اللقطات السريعة والمشاهد الجوية. كما يدعم الانتقال التدريجي بين الإطارات المحددة بداية ونهاية المشهد.
تتوفر هذه الميزات في نسخة تجريبية حالياً.
تحسينات Imagen 3 في تحرير الصور
أعلنت جوجل أن تحديثات Imagen 3 تعزز قدرة النموذج على إزالة الأجسام غير المرغوبة. كما يمكنه إعادة بناء الأجزاء المفقودة أو التالفة من الصور بشكل أكثر دقة.
حماية المحتوى والتدقيق في حقوق الملكية
تُستخدم تقنية SynthID لوضع علامات مائية على جميع الوسائط التي تُولدها نماذج Imagen، Veo، وLyria، باستثناء Chirp. تؤكد جوجل أن جميع نماذجها تحتوي على “إجراءات أمان مضمنة” لمنع إنشاء محتوى ضار.
لم تكشف جوجل عن مصادر البيانات المستخدمة في تدريب نماذجها، وهو موضوع يثير جدلاً قانونيًا مرتبطًا بحقوق الملكية الفكرية. تستخدم بعض الشركات بيانات محمية بحقوق دون إذن مسبق، مستندة إلى قوانين الاستخدام العادل في الولايات المتحدة. لكن هذا يثير معارضة بعض المبدعين الذين رفعوا دعاوى قضائية.
أكدت جوجل سابقًا توفير آليات للسحب من تدريب النماذج. كما تقدم سياسة تعويض قانونية تحمي عملاء جوجل كلاود وVertex AI من النزاعات المتعلقة بحقوق الملكية الفكرية للذكاء الاصطناعي.