OpenAI تكشف عن تحديث رئيسي لتوليد الصور في ChatGPT

أطلقت OpenAI ميزة توليد الصور بالذكاء الاصطناعي المُحسّنة التي طال انتظارها. فبدلاً من استخدام نموذج توليد صور مُنفصل مثل Dall-E، أصبح مُولّد الصور المُتطور الجديد جزءًا من GPT-4o.
تتوفر العديد من نماذج توليد الصور بالذكاء الاصطناعي في السوق، والتي يُمكنها إنشاء مشاهد سريالية آسرة. ومع ذلك، تواجه جميعها صعوبة في إنشاء صور تتضمن نصوصًا وشعارات وعناصر شائعة الاستخدام في الحياة اليومية.
تؤكد OpenAI أن مُولّد الصور الجديد GPT-4o يُمكنه حل هذه العيوب، إذ يُمكنه عرض النصوص بدقة واتباع التعليمات بدقة من خلال الاستفادة من قاعدة المعرفة وسياق الدردشة. كما يُتيح هذا النموذج الجديد للمستخدمين تعديل الصور المُحمّلة أو إنشاء صور جديدة باستخدامها كمصدر إلهام بصري.
يتوفر نموذج توليد الصور الجديد GPT-4o الآن لجميع مستخدمي ChatGPT Plus وPro وTeam وFree. وبما أن هذا النموذج الجديد سيصبح مُولّد الصور الافتراضي في ChatGPT، فسيتمكن المستخدمون من استخدامه دون الحاجة إلى أي خيارات إضافية قبل ظهور التعليمات. يمكن للمستخدمين أيضًا تخصيص صورهم من خلال تحديد نسبة العرض إلى الارتفاع، والألوان الدقيقة باستخدام الرموز السداسية، أو خلفية شفافة. ستُطلق OpenAI هذا النموذج الجديد لمستخدمي ChatGPT Enterprise وEdu في الأسابيع المقبلة.
يمكن الوصول إلى هذا النموذج الجديد أيضًا في Sora لإنشاء الصور وعبر DALL·E GPT المخصص. بالنسبة للمطورين، سيتم طرح إنشاء الصور باستخدام واجهة برمجة التطبيقات GPT-4o في الأسابيع القليلة المقبلة.
OpenAI تطور مولد الصور بالذكاء الاصطناعي

يواجه النموذج أيضًا بعض القيود. أولًا، نظرًا لأنه يُنشئ صورًا أكثر تفصيلًا، فقد يستغرق وقت الإنشاء ما يصل إلى دقيقة واحدة.
يواجه النموذج القيود التالية عند الإطلاق، والتي ستعمل OpenAI على إصلاحها في الأسابيع والأشهر المقبلة:
- قد يقتص أحيانًا الصور الطويلة، مثل الملصقات، بشكل مُفرط، خاصةً بالقرب من الجزء السفلي.
- قد يُؤدي إنشاء الصور أيضًا إلى تكوين معلومات، خاصةً في المطالبات ذات السياق المنخفض.
عند إنشاء صور تعتمد على قاعدة المعرفة الخاصة به، قد يواجه صعوبة في عرض أكثر من 10-20 مفهومًا مُميزًا بدقة في آنٍ واحد، مثل الجدول الدوري الكامل. يواجه النموذج أحيانًا صعوبة في عرض اللغات غير اللاتينية، وقد تكون الأحرف غير دقيقة أو مُصطنعة، خاصةً مع التعقيدات العالية. - لا تُجدي طلبات تعديل أجزاء مُحددة من الصورة المُولّدة، مثل الأخطاء المطبعية، نفعًا دائمًا، وقد تُغيّر أيضًا أجزاءً أخرى من الصورة بطريقة لم تُطلب أو تُؤدي إلى المزيد من الأخطاء.
- من المعروف أن النموذج يُواجه صعوبة عند طلب عرض معلومات مُفصّلة بحجم صغير جدًا.
ستأتي جميع الصور المُولّدة باستخدام هذا النموذج الجديد مع بيانات تعريف C2PA، ويمكن لأداة OpenAI الداخلية التحقق مما إذا كانت الصورة قد وُلدت باستخدام هذا النموذج.
على الرغم من القيود الحالية، يَعِد نموذج GPT-4o الجديد بتزويد المستخدمين بإمكانيات إنشاء صور أكثر دقة وقابلية للتخصيص. ومع استمرار OpenAI في تحسين النموذج، يُمكننا توقع المزيد من التحسينات في أدائه وموثوقيته.
لا يسمح بنقل هذا المحتوى من سوالف دون الاشارة برابط مباشر