بعد أكثر من عام بقليل من منح OpenAI لمستخدمي ChatGPT خيار إنشاء الصور والتصميمات مباشرة من برنامج الدردشة الآلي الخاص بها، فإنها تطلق الآن ChatGPT Images 2.0. تصف OpenAI النظام الجديد بأنه “تغيير تدريجي” لنماذج توليد الصور، لا سيما عندما يتعلق الأمر بقدرة الأداة على اتباع التعليمات بالتفصيل، وتقديم نص كثيف ووضع الكائنات وربطها في المشهد. ولأول مرة، قامت OpenAI أيضًا ببناء نموذج صورة يتمتع بقدرات منطقية، مما يمنح النظام القدرة على القيام بأشياء مثل البحث في الويب والتحقق من مخرجاته. ووفقًا للشركة، يجب أن تترجم هذه القدرات إلى أداة أكثر موثوقية عندما تكون الدقة والاتساق والتماسك البصري ضرورية.
مثال على قدرات العرض غير اللاتينية الجديدة لـ ChatGPT. (أوبن آي)
تقول OpenAI إنها بذلت أيضًا الكثير من العمل لجعل Images 2.0 أفضل في فهم وعرض النصوص غير اللاتينية، مع “مكاسب كبيرة” عندما يتعلق الأمر بقدرة النموذج على التعامل مع اليابانية والكورية والصينية والهندية والبنغالية. وفي الوقت نفسه، تدعي الشركة أن النموذج الجديد أفضل في إعادة إنشاء الخصائص المحددة للغات المرئية المختلفة بأمانة. في هذه النقطة، يقول OpenAI أن هذا يجعل Images 2.0 أكثر فائدة لمهام مثل النماذج الأولية للعبة ولوحة القصة. وبعيدًا عن هذه الميزات، يعد النموذج الجديد أكثر مرونة عندما يتعلق الأمر بنسب العرض إلى الارتفاع، مما يسمح له بإنشاء صور بعرض 3:1 وطول يصل إلى 1:3. ويمكنه أيضًا إنتاج تصميمات بدقة تصل إلى 2K، وحتى إنشاء ما يصل إلى ثمانية مخرجات دفعة واحدة.

قطة على شكل صدفة السلحفاة بأسلوب الجيل الثالث من ألعاب بوكيمون. (شات جي بي تي)
لقد أتيحت لي الفرصة لمعاينة Images 2.0 قبل إصداره للعامة. في أول طلب لي، طلبت من ChatGPT إنشاء صورة لقطة سلحفاة بأسلوب فن البكسل للجيل الثالث من Pokémon. اعتقدت أن هذا سيكون اختبارًا جيدًا لأن نماذج الذكاء الاصطناعي عادةً ما تعاني من فن البكسل، كما أن ألعاب Game Boy Advance Pokémon مميزة لأسلوبها الفني، لدرجة أنه إذا كان ChatGPT يقترب من هذا الأسلوب فقط، فلن يكون الأمر كذلك. والنتيجة هي الصورة التي تراها أعلاه، وأعتقد أن ChatGPT قام بعمل جدير بالثناء هناك. ثم كلفت النموذج الجديد بتحويل تلك الصورة إلى PNG شفافة. في اختبار أخير، طلبت من ChatGPT إنشاء مانغا من أربع صفحات عن قطتي وهي تستمتع بيوم مشمس بجوار نهر المدينة الهادئ.

لاحظ كيف أن القطة لا تظهر تمامًا مثل تلك التي فوقها. (شات جي بي تي)
من بين هذه الاختبارات الثلاثة، قضى ChatGPT معظم الوقت في الاختبار الثاني وكان الإخراج هناك مختلفًا قليلاً عن الصورة الأولى التي أنشأها، والتي شعرت بأنها انحرفت عن موجهي. ومع ذلك، فقد تمكنت من إنشاء صورة شفافة مناسبة، وهو أمر قد تواجه نماذج الصور الأخرى صعوبة في القيام به بشكل صحيح. بمجرد أن تتاح الفرصة لمزيد من الأشخاص لاختبار النموذج، سيكون لدينا فكرة أفضل عن كيفية مقارنته بـ Nano Banana 2 من Google، وأين يمكن لـ OpenAI إجراء تحسينات إضافية.

مانغا تم إنشاؤها بواسطة ChatGPT حول قطة تستمتع بيوم مشمس. (شات جي بي تي)
يتوفر Images 2.0 بدءًا من اليوم لجميع مستخدمي ChatGPT، بما في ذلك مستخدمي مستويات Free and Go الخاصة بالشركة. يحصل مشتركو Plus وPro على إمكانية الوصول إلى مخرجات أكثر تقدمًا. تعمل OpenAI أيضًا على إتاحة النموذج من خلال خدمة API وتطبيق Codex للتشفير، والذي تم تحديثه الأسبوع الماضي ليوفر إمكانية إنشاء الصور المضمنة. والجدير بالذكر أن Images 2.0 يصل بعد أيام قليلة من دخول Anthropic إلى سوق التصميم المرئي باستخدام مساعد التصميم الخاص بها.

نبيل الصوفي صحفي يمني متخصص في الشؤون السياسية والاجتماعية، يتمتع بخبرة مهنية تمتد لأكثر من عشر سنوات في مجال الصحافة المكتوبة والرقمية. يركز في تغطيته على التطورات السياسية والاقتصادية والقضايا الإنسانية في اليمن والمنطقة، مع الالتزام بأعلى معايير الدقة والموضوعية.
خلال مسيرته المهنية، أعدّ تقارير إخبارية وتحقيقات صحفية معمّقة، وقدم تحليلات سياسية نُشرت عبر منصات إعلامية محلية وعربية. كما أجرى مقابلات مع مسؤولين حكوميين وخبراء وباحثين، وشارك في تغطية أحداث ميدانية بارزة.
يعتمد نبيل الصوفي في عمله على مصادر موثوقة وآليات تحقق دقيقة، مع حرص مستمر على الالتزام بأخلاقيات المهنة والمعايير التحريرية المعتمدة في المؤسسات الإخبارية.
للتواصل بخصوص الاستفسارات الإعلامية أو فرص التعاون:
📧 البريد الإلكتروني: [email protected]
📞 الهاتف: +967 78 129 7706
