يستخدم تحديث جوجل جيميني نموذج صور "الموزة النانوية" الذي طورته جوجل ديب مايند. الميزة متاحة الآن عالميًا للمستخدمين المجانيين والمدفوعين. تكمن أهم مزاياها في قدرتها على الحفاظ على تناسق الوجوه والأشياء في الصور، وهو أمر غالبًا ما تواجهه أدوات الذكاء الاصطناعي الأخرى.
قالت نيكول بريتشوفا، رئيسة قسم المنتجات في ديب مايند: "لقد حسّنا جودة الصور وقدرة النموذج على اتباع التعليمات بشكل ملحوظ. هذا التحديث يجعل عمليات التحرير أكثر سلاسة، والنتائج جيدة بما يكفي لاستخدامها لأي غرض".
احتفظ بـ "أنت" في كل صورة
من الأمور التي تجعل صور الذكاء الاصطناعي تبدو مزيفة تشوه التفاصيل الصغيرة. تقول جوجل إن جيميني يحل هذه المشكلة، إذ يسمح لك بتغيير المشهد بأكمله مع الحفاظ على الوجه وتعابير الوجه كما هي. يمكنك تجربة تسريحة شعر جديدة، أو تغيير لون الجدار، أو إدخال حيوان أليف إلى المشهد دون القلق بشأن تشوه الصورة.

يتيح لك تطبيق Gemini أيضًا تحميل صور متعددة لدمجها في صورة واحدة، مثل دمج صورة شخصية مع قطتك لإنشاء صورة لكما معًا أثناء ركوب السيارة على الطريق.
يدعم جيميني التحرير متعدد الأدوار، مما يسمح للمستخدمين بإضافة كل تفصيل إلى أي مساحة: من ورق الجدران، والأثاث، وحتى لون الطلاء. الميزة الإضافية هي أن الجزء الذي يحتاج إلى تعديل فقط هو الذي يتغير، بينما يبقى الباقي كما هو.
بالإضافة إلى ذلك، يستطيع الجوزاء مزج الأنماط بين الصور. على سبيل المثال، تحويل أحذية المطر إلى أحذية بنقشة زهور، أو تصميم فستان بنقشة فراشات.
سباق إنشاء الصور بالذكاء الاصطناعي بين عمالقة التكنولوجيا
يأتي تحديث جوجل مع احتدام المنافسة في مجال التصوير بالذكاء الاصطناعي. سبق أن أطلقت OpenAI برنامج GPT-4o، القادر على توليد الصور مباشرةً، وانتشر بشكل واسع عبر سلسلة من الميمات المستوحاة من استوديو جيبلي. كشف الرئيس التنفيذي سام ألتمان أن عدد المستخدمين زاد بشكل كبير لدرجة أن وحدات معالجة الرسومات الخاصة بالشركة "كادت أن تذوب".
ولمواكبة هذا التطور، أعلنت شركة Meta عن شراكة مع شركة Midjourney، في حين تهيمن شركة Black Forest Labs الألمانية الناشئة بنموذجها FLUX على العديد من المخططات.

تأمل جوجل أن يتمكن جيميني من سد الفجوة مع تشات جي بي تي. يبلغ عدد مستخدمي جيميني حاليًا 450 مليون مستخدم شهريًا، وفقًا للرئيس التنفيذي سوندار بيتشاي، وهو عدد يتخلف كثيرًا عن تشات جي بي تي، الذي يتجاوز 700 مليون مستخدم أسبوعيًا.
قالت بريشتوفا إن جيميني مصمم لسيناريوهات واقعية، بدءًا من تصوير غرف المعيشة والحدائق وصولًا إلى التقاط صور ترفيهية. يتميز النموذج بمعرفة أفضل بالعالم ، ويمكنه دمج صور ومجموعات ألوان متعددة في عرض تقديمي واحد.
مع ذلك، تفرض جوجل قيودًا صارمة. جميع الصور المُولَّدة تحمل علامة مائية واضحة وعلامة تعريف مخفية في البيانات الوصفية. تحظر الشركة بشدة إنشاء صور حساسة دون إذن لمنع إساءة استخدام التزييف العميق.
اعتذرت جوجل سابقًا عن الصور التاريخية غير الدقيقة لـ Gemini. هذه المرة، تعتقد الشركة أنها حققت توازنًا بين الإبداع والسلامة. وأكدت بريشتوفا: "نريد من المستخدمين أن يكونوا مبدعين، ولكن ليس كل شيء مسموحًا به" .
من خلال Gemini 2.5 Flash Image، تراهن Google على الارتقاء بتجربة تحرير الصور بالذكاء الاصطناعي، على أمل الاحتفاظ بالمستخدمين القدامى وجذب مستخدمين جدد في سباق تكنولوجي شرس مع OpenAI وMeta وغيرهما من المنافسين.
(وفقًا لـ TechCrunch و Tom's Guide)

المصدر: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html
تعليق (0)