شركة OpenAI تكشف عن نموذج صور متطور يفهم النصوص بدقة عالية
أعلنت OpenAI عن إطلاق ChatGPT Images 2.0، وهو نموذج جديد لتوليد الصور يهدف إلى التعامل مع المهام البصرية المعقدة بدقة عالية. وأوضحت الشركة أن هذا النموذج قادر على اتباع تعليمات مفصلة، ووضع العناصر وربطها بشكل دقيق، وإظهار التفاصيل الدقيقة في الصور، وعرض تخطيطات بصرية عالية الجودة. كما أشارت إلى أن ChatGPT Images 2.0 يتمتع بقدرات تفكير متقدمة بهدف تحسين التكوين البصري وجودة المخرجات.
ذكرت OpenAI أن هذه القدرات تهدف إلى إنتاج صور تبدو واقعية بدرجة عالية، وتدعم إنتاج مواد تسويقية بأحجام مختلفة، بالإضافة إلى القصص المصورة متعددة الإطارات. وأشارت إلى أن إنشاء الصور المعقدة قد يستغرق وقتاً أطول مقارنة بالإجابات النصية، لكن إنتاج محتوى مثل القصص المصورة متعددة الإطارات يمكن إنجازه خلال دقائق.
يستطيع ChatGPT Images 2.0 الوصول إلى معلومات حديثة حتى ديسمبر 2025 عبر البحث في الإنترنت، لكن ذلك قد يؤثر على دقة النتائج المتعلقة بالأحداث والمعلومات الحديثة. كما يمكنه إنشاء عدة صور من طلب واحد، مع إمكانية التحقق من صحة النتائج. ويدعم نسب أبعاد متعددة، ويمكنه إنشاء صور بدقة تصل إلى 2K.
يعالج النموذج الجديد أحد أبرز التحديات في أنظمة توليد الصور بالذكاء الاصطناعي، إذ تعاني معظم النماذج اللغوية الكبيرة صعوبة في إنتاج نصوص دقيقة بسبب محدودية القدرة على تمثيل النص داخل الصورة. وأما Images 2.0 فيتمتع بدقة عالية على إنشاء النصوص واضحة داخل الصور. ويتمتع أيضاً بالقدرة على فهم اللغات المتعددة؛ مما يُحسّن عرض النصوص ضمن مجموعة من اللغات، بما في ذلك اليابانية، والكورية، والصينية، والهندية، والبنغالية.
وفيما يتعلق بالتوفر وإمكانية وصول المستخدمين إلى النموذج الجديد، أفادت OpenAI أن نموذج ChatGPT Images 2.0 أصبح متاحاً لجميع مستخدمي ChatGPT وCodex، وكذلك عبر واجهات برمجة التطبيقات API.































