تحسين تقنية إنشاء الصور الذكي من قوقل

\n

قوقل تحسن تقنيتها في إنشاء الصور لمواكبة منافسيها.

\n

خلال مؤتمر المطورين I/O للشركة في ماونتن فيو يوم الثلاثاء، أعلنت قوقل عن Imagen 3، أحدث إصدار في عائلة نماذج الذكاء الاصطناعي Imagen للعملاق التكنولوجي.

\n

صرح Demis Hassabis، الرئيس التنفيذي لشركة DeepMind، قسم بحوث الذكاء الاصطناعي التابع لقوقل، أن Imagen 3 تفهم النصوص التي تترجمها إلى صور بشكل أكثر دقة من سابقتها Imagen 2، وتكون أكثر "إبداعًا وتفصيلًا" في إنشاءاتها. بالإضافة إلى ذلك، ينتج النموذج مزيدًا من "التأثيرات المزعجة" والأخطاء أقل، وفقًا لقوله.

\n

وأضاف Hassabis، "هذا أيضًا أفضل نموذج لدينا حتى الآن لتصور النصوص، والتي كانت تحدًا بالنسبة لنماذج إنشاء الصور".

\n

لتهدئة المخاوف بشأن إمكانية إنشاء الفيديوهات المزيفة، يقول قوقل إن Imagen 3 ستستخدم SynthID، وهو نهج طورته DeepMind لتطبيق علامات مائية خفية وتشفيرية على الوسائط.

\n

تتوفر التسجيلات لـ Imagen 3 في المعاينة الخاصة في أداة ImageFX من Google، وتقول قوقل إن النموذج سيصل "قريبًا" للمطورين والعملاء الشركات الذين يستخدمون Vertex AI، منصة قوقل المؤسسية لتطوير الذكاء الاصطناعي الإبداعي.

\n
صورة رصيد: قوقل

عادة ما لا تكشف قوقل الكثير عن مصدر البيانات التي تستخدمها لتدريب نماذجها الذكية — وهذه المرة لم تكن استثناءً. وهناك سبب وجيه لذلك. يأتي الكثير من بيانات التدريب من مواقع عامة، مستودعات البيانات والتجميعات حول الويب. وبعض هذه البيانات التدريبية، بالذات البيانات المحمية بحقوق الطبع والنشر التي تم جمعها دون إذن من مبدعي المحتوى، هي مصدر لدعاوي قضائية ذات صلة بحقوق الملكية الفكرية.

\n

تسمح أدوات ناشر الويب التابعة لقوقل لأصحاب المواقع بمنع الشركة من جمع البيانات، بما في ذلك الصور ومقاطع الفيديو، من مواقعهم على الويب. ولكن قوقل لا تقدم أداة "اختيار الخروج"، و— على عكس بعض منافسيها — الشركة لم تلتزم بتعويض أصحاب الحقوق عن مساهماتهم (في بعض الحالات الغير مدركة) في مجموعات البيانات التدريبية.

\n

عدم الشفافية ليس مفاجئًا. لكنه محبط — خاصةً من شركة بموارد مثل قوقل.

\n

نحن نطلق نشرة إخبارية عن الذكاء الاصطناعي! سجل هنا لتبدأ في تلقيها في صناديق بريدك في الخامس من يونيو.

\n