ملاحظاتي على أحدث نموذج توليد الصور من ChatGPT

Ayman abdallahمنذ ساعتين

321

ملاحظاتي على أحدث نموذج توليد الصور من ChatGPT

خلال الأشهر الأخيرة أصبح واضحًا أن سباق الذكاء الاصطناعي لم يعد يقتصر على النصوص فقط، بل انتقل بقوة إلى عالم الصور. ومع إطلاق أحدث نموذج توليد الصور من ChatGPT بدأت التجربة تختلف بشكل ملحوظ عن الأجيال السابقة، ليس فقط في جودة الصور، بل في طريقة فهم الأوامر نفسها. وبعد استخدام طويل للنموذج في تصميمات متنوعة بين الصور الواقعية والإنفوجرافيك والبوسترات والمشاهد السينمائية، ظهرت مجموعة من الملاحظات التي تستحق الحديث فعلًا.

أول شيء ستلاحظه فور استخدام النموذج الجديد هو أنه أصبح “يفهم” الفكرة أكثر مما “ينفذ الكلمات”. هذه نقطة مهمة جدًا. في النماذج القديمة كنت تحتاج أحيانًا لكتابة برومبت طويل جدًا ومليء بالتفاصيل الدقيقة حتى تحصل على نتيجة قريبة مما تريده، بينما الآن أصبح النموذج قادرًا على استيعاب السياق بشكل أذكى. أحيانًا جملة قصيرة تكفي لإنتاج صورة متماسكة بإضاءة صحيحة وتكوين بصري جيد.

لكن هذا لا يعني أن كتابة البرومبت لم تعد مهمة، بالعكس. كلما كان وصفك أوضح وأكثر إنسانية، حصلت على نتائج أقرب لما تتخيله. المثير هنا أن النموذج الجديد يبدو وكأنه يفهم “المزاج” المطلوب للصورة، وليس فقط العناصر الموجودة داخلها. عندما تطلب مشهدًا دافئًا أو سينمائيًا أو حزينًا، ستلاحظ أن الإضاءة والألوان وزوايا التصوير تتغير فعلًا بطريقة مقنعة.

ملاحظاتي على أحدث نموذج توليد الصور من ChatGPT 1 — ملاحظاتي على أحدث نموذج توليد الصور

أكثر ما أعجبني في أحدث نموذج توليد الصور من ChatGPT

المحتويات إخفاء

1 أكثر ما أعجبني في أحدث نموذج توليد الصور من ChatGPT

2 لكن ما زالت هناك مشاكل حقيقية

3 هل أصبح بديلاً للمصممين والمصورين؟

4 هل نحن أمام مستقبل جديد فعلًا؟

أحد أكبر التحسينات الواضحة هو جودة الوجوه البشرية. في الماضي كانت تفاصيل الأيدي أو العيون أو تعابير الوجه أحيانًا تبدو غريبة أو غير متناسقة، لكن الآن أصبحت النتائج أكثر واقعية بشكل واضح، خصوصًا في الصور القريبة Portraits.

حتى الصور الكرتونية والأنماط الفنية مثل Ghibli أو Pixar أصبحت أكثر استقرارًا من السابق. النموذج يحافظ على الهوية البصرية للشخصيات بشكل أفضل، ويقدم تفاصيل دقيقة في الملابس والإضاءة والخلفيات دون الحاجة للكثير من التعديلات.

كذلك لاحظت تحسنًا ضخمًا في فهم اللغة العربية داخل الصور والإنفوجرافيك. صحيح أن الأخطاء ما زالت موجودة أحيانًا، لكنها أقل بكثير من السابق. أصبح بالإمكان إنتاج تصميمات عربية مقبولة جدًا مقارنة بما كان يحدث قبل عامين فقط، حين كانت النصوص العربية تظهر مشوهة بالكامل تقريبًا.

أيضًا هناك تطور واضح في التعامل مع المشاهد المعقدة. إذا طلبت صورة تحتوي على عدة شخصيات أو عناصر كثيرة داخل المشهد، ستلاحظ أن التوازن البصري أفضل، وأن الصورة لا تنهار بسهولة كما كان يحدث في بعض النماذج القديمة.

لكن ما زالت هناك مشاكل حقيقية

رغم كل هذا التطور، ما زالت هناك نقاط ضعف لا يمكن تجاهلها. أهمها أن النموذج أحيانًا “يتخيل أكثر من اللازم”. بمعنى أنه يضيف عناصر لم تطلبها أصلًا، أو يغيّر بعض التفاصيل بناءً على فهمه الخاص للمشهد.

في بعض الأحيان تطلب صورة بسيطة جدًا، فتجد النموذج يحاول جعلها درامية أو سينمائية أكثر من المطلوب. وهذا قد يكون رائعًا أحيانًا… ومزعجًا جدًا أحيانًا أخرى.

كذلك ما زالت مشكلة النصوص داخل الصور ليست مثالية بالكامل، خصوصًا في الجمل الطويلة أو الخطوط العربية الدقيقة. لذلك إذا كنت تعمل على تصميم احترافي للطباعة أو إعلان تجاري، ستظل غالبًا بحاجة لبعض التعديلات اليدوية لاحقًا.

ومن الأمور التي لاحظتها أيضًا أن النموذج يميل أحيانًا إلى “تجميل” الأشخاص بشكل مبالغ فيه، حتى عند طلب الواقعية. لذلك إذا كنت تريد صورة مطابقة تمامًا لشخص حقيقي، ستحتاج إلى توجيهات دقيقة جدًا للحفاظ على الملامح الطبيعية.

كيف تعمل ميزة جهة الاتصال الموثوقة في ChatGPT؟

هل أصبح بديلاً للمصممين والمصورين؟

في رأيي الشخصي… لا، لكنّه غيّر قواعد اللعبة بالكامل.

الذكاء الاصطناعي اليوم لا يقتل الإبداع بقدر ما يغيّر طريقة تنفيذه. الشخص الذي يفهم التكوين البصري والإضاءة والألوان وكتابة البرومبت سيحصل على نتائج مذهلة أسرع بكثير من السابق. أما من يعتمد على الذكاء الاصطناعي وحده دون فهم فني، فغالبًا سيحصل على صور جميلة بصريًا لكنها بلا روح أو هوية واضحة.

المثير للاهتمام أن كثيرًا من المصممين أنفسهم بدأوا يستخدمون هذه الأدوات يوميًا لتسريع العمل بدل مقاومتها. بعضهم يستعملها لتوليد أفكار أولية، وآخرون يستخدمونها لصناعة الخلفيات أو تحسين الصور أو حتى إنتاج حملات كاملة للسوشيال ميديا.

هل نحن أمام مستقبل جديد فعلًا؟

أعتقد أن ما يحدث الآن يشبه اللحظة التي انتقلت فيها الكاميرات من التصوير الفيلمي إلى الرقمي. في البداية كان هناك خوف ورفض، ثم أصبحت التقنية جزءًا طبيعيًا من الصناعة.

ومع أحدث نموذج توليد الصور من ChatGPT يبدو أننا دخلنا مرحلة جديدة فعلًا، حيث أصبحت الفكرة أهم من الأداة نفسها. الشخص القادر على تخيل المشهد ووصفه بذكاء أصبح يمتلك قوة إبداعية ضخمة حتى بدون خبرة تقنية معقدة.

لكن في النهاية، ورغم كل هذا التطور، ما زالت أفضل الصور هي تلك التي تحمل إحساسًا حقيقيًا أو فكرة واضحة خلفها. الذكاء الاصطناعي يستطيع رسم المشهد… لكن الإنسان ما زال هو من يمنحه المعنى.