قوقل تحسن تقنيتها في إنشاء الصور لمواكبة منافسيها.
\nخلال مؤتمر المطورين I/O للشركة في ماونتن فيو يوم الثلاثاء، أعلنت قوقل عن Imagen 3، أحدث إصدار في عائلة نماذج الذكاء الاصطناعي Imagen للعملاق التكنولوجي.
\nصرح Demis Hassabis، الرئيس التنفيذي لشركة DeepMind، قسم بحوث الذكاء الاصطناعي التابع لقوقل، أن Imagen 3 تفهم النصوص التي تترجمها إلى صور بشكل أكثر دقة من سابقتها Imagen 2، وتكون أكثر "إبداعًا وتفصيلًا" في إنشاءاتها. بالإضافة إلى ذلك، ينتج النموذج مزيدًا من "التأثيرات المزعجة" والأخطاء أقل، وفقًا لقوله.
\nوأضاف Hassabis، "هذا أيضًا أفضل نموذج لدينا حتى الآن لتصور النصوص، والتي كانت تحدًا بالنسبة لنماذج إنشاء الصور".
\nلتهدئة المخاوف بشأن إمكانية إنشاء الفيديوهات المزيفة، يقول قوقل إن Imagen 3 ستستخدم SynthID، وهو نهج طورته DeepMind لتطبيق علامات مائية خفية وتشفيرية على الوسائط.
\nتتوفر التسجيلات لـ Imagen 3 في المعاينة الخاصة في أداة ImageFX من Google، وتقول قوقل إن النموذج سيصل "قريبًا" للمطورين والعملاء الشركات الذين يستخدمون Vertex AI، منصة قوقل المؤسسية لتطوير الذكاء الاصطناعي الإبداعي.
\nعادة ما لا تكشف قوقل الكثير عن مصدر البيانات التي تستخدمها لتدريب نماذجها الذكية — وهذه المرة لم تكن استثناءً. وهناك سبب وجيه لذلك. يأتي الكثير من بيانات التدريب من مواقع عامة، مستودعات البيانات والتجميعات حول الويب. وبعض هذه البيانات التدريبية، بالذات البيانات المحمية بحقوق الطبع والنشر التي تم جمعها دون إذن من مبدعي المحتوى، هي مصدر لدعاوي قضائية ذات صلة بحقوق الملكية الفكرية.
\nتسمح أدوات ناشر الويب التابعة لقوقل لأصحاب المواقع بمنع الشركة من جمع البيانات، بما في ذلك الصور ومقاطع الفيديو، من مواقعهم على الويب. ولكن قوقل لا تقدم أداة "اختيار الخروج"، و— على عكس بعض منافسيها — الشركة لم تلتزم بتعويض أصحاب الحقوق عن مساهماتهم (في بعض الحالات الغير مدركة) في مجموعات البيانات التدريبية.
\nعدم الشفافية ليس مفاجئًا. لكنه محبط — خاصةً من شركة بموارد مثل قوقل.
\nنحن نطلق نشرة إخبارية عن الذكاء الاصطناعي! سجل هنا لتبدأ في تلقيها في صناديق بريدك في الخامس من يونيو.
\n