لقد قدمت Google DeepMind للتو خطوة كبيرة إلى الأمام في مجال الذكاء الاصطناعي التوليدي (GenAI): نموذج Gemini 2.5 Flash Image.

يُعرف هذا النموذج باسم "Nano Banana" من قبل المجتمع، وهو أداة قوية قادرة على تحويل النصوص إلى صور وتحرير الصور الموجودة بدقة ومرونة كبيرتين.

يعد هذا استمرارًا لسلسلة طراز Gemini، ولكن تم تحسينه خصيصًا للمهام المتعلقة بالصور.

c732a0fbdcce57900edf.jpg
تصدرت كلمة الجوزاء قائمة الكلمات الأكثر شيوعًا على Google Trends في فيتنام في 4 سبتمبر. لقطة شاشة.

بفضل المزايا المتميزة في قدرات إنشاء الصور وتحريرها، يجذب Nano Banana اهتمامًا كبيرًا من مستخدمي التكنولوجيا العالميين، بما في ذلك فيتنام.

وفقًا لاتجاهات جوجل، ارتفعت عمليات البحث عن كلمتي "الجوزاء" و"الموز النانو" بشكل كبير خلال الأربع والعشرين ساعة الماضية. تُظهر إحصائيات 4 سبتمبر أن كلمة "الجوزاء" تصدّرت قائمة المواضيع الأكثر شيوعًا في جميع المواضيع.

في المنتديات ومجموعات الشبكات الاجتماعية، يقوم المستخدمون أيضًا بمشاركة واختبار أوامر ونصوص إنشاء الصور باستخدام Nano Banana.

يقدر معظم الأشخاص قدرة الأداة على إنشاء الصور "بسرعة وبدقة وسرعة" بالإضافة إلى جودة المنتج الناتج.

لا يقتصر برنامج Gemini 2.5 Flash Image على إنشاء صور من أوصاف نصية فحسب، بل يتفوق في العديد من الجوانب الأساسية: تحرير الصور عند الطلب، وتناسق الأحرف، وسرعة المعالجة المذهلة، وتقنية أمان SynthID.

يمكن للمستخدمين استخدام لغة البرمجة لتغيير عناصر الصورة. على سبيل المثال، اكتب الأمر "إضافة كرسي أحمر بجانب الطاولة" أو "تغيير الخلفية إلى غابة"، وسيقوم النموذج بإجراء التعديل بدقة وسلاسة.

يُعدّ اتساق الشخصية الميزة الأكثر ثورية. يستطيع النموذج تذكر وإعادة إنشاء صورة لشخصية أو شيء بخصائص متسقة (مثل الوجه والملابس والأسلوب) عبر صور متعددة.

يُعد هذا مفيدًا بشكل خاص للمشروعات الإبداعية التي تتطلب إنشاء سلسلة من الصور ذات الصلة، من القصص المصورة إلى الحملات التسويقية.

بفضل بنيته المحسّنة، يمكن لبرنامج Gemini 2.5 Flash Image إنتاج نتائج عالية الجودة في ثوانٍ، مما يؤدي إلى تسريع سير العمل الإبداعي بشكل كبير.

يتم وضع علامة مائية رقمية غير مرئية خاصة من Google على جميع الصور التي تم إنشاؤها أو تحريرها بواسطة النموذج، مما يسمح بالتعرف على الصور التي تم إنشاؤها باستخدام الذكاء الاصطناعي، مما يساهم في ضمان الشفافية وأصل المحتوى.

يفتح نموذج Gemini 2.5 Flash Image مجموعة واسعة من إمكانات التطبيق، من المستخدمين الأفراد إلى المطورين المحترفين.

يمكن للمطورين الوصول إلى النموذج من خلال واجهة برمجة تطبيقات Gemini وGoogle AI Studio لبناء تطبيقاتهم الخاصة، بينما يمكن للشركات استخدام النموذج على منصة Vertex AI.

بالنسبة للمستخدم العادي، تم دمج النموذج مباشرة في Google Gemini والتطبيقات الأخرى، مما يجعل التصوير بالذكاء الاصطناعي أداة سهلة الوصول وبديهية.

بفضل ميزاته المتميزة، وخاصة القدرة على الحفاظ على اتساق الأحرف، من المتوقع أن يصبح Gemini 2.5 Flash Image منافسًا هائلاً لبرامج تحرير الصور التقليدية مثل Photoshop، مما سيؤدي إلى تغيير الطريقة التي يتفاعل بها المبدعون والمستخدمون مع الصور الرقمية.

تفوقت الصين بشكل غير متوقع على الولايات المتحدة في مسابقة الترجمة الآلية العالمية للذكاء الاصطناعي . فاز نموذج Hunyuan-MT-7B مفتوح المصدر من Tencent (الصين) بشكل شبه كامل على "عمالقة" الولايات المتحدة في مسابقة الترجمة الآلية الدولية في إطار مؤتمر WMT25.

المصدر: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html