الذكاء الاصطناعي

جيميني يقتحم عالم الموسيقى: جوجل تتيح توليد مقاطع بمدة 30 ثانية

جيميني يقتحم عالم الموسيقى: جوجل تتيح توليد مقاطع بمدة 30 ثانية
جيميني يقتحم عالم الموسيقى: جوجل تتيح توليد مقاطع بمدة 30 ثانية

في خطوة جديدة لتعزيز قدرات نموذجها اللغوي المتطور، بدأت شركة جوجل في طرح تحديثات تجريبية لأداة جيميني “Gemini 1.5 Pro”، تتضمن ميزة مثيرة للاهتمام تتيح للذكاء الاصطناعي توليد مقاطع صوتية وموسيقية قصيرة بناءً على وصف نصي من المستخدم.

بعد تجربة الميزة، يمكن للمستخدمين الآن الطلب من Gemini إنشاء مقطع موسيقي مدته 30 ثانية تقريباً (على سبيل المثال: “أنشئ أغنية شعبية عن الرحلات”). وتضع هذه الميزة جوجل في منافسة مباشرة مع منصات توليد الموسيقى بالذكاء الاصطناعي الصاعدة مثل Suno وUdio، وإن كانت بمدة زمنية محدودة حالياً.

تقييم الأداء لجديد جيميني: بارع في العزف، فاشل في الغناء

أشار التقرير إلى تباين كبير في جودة المخرجات الصوتية لـ Gemini:

  • الموسيقى الآلية (Instrumentals): أظهر النموذج قدرة “جيدة إلى حد كبير” على توليد موسيقى خلفية مقنعة. الأمثلة التي تحاكي موسيقى “السينث-بوب” (Synth-pop) أو إيقاعات الهيب هوب كانت واقعية بما يكفي لتبدو كموسيقى مخزنة (Stock Music) احترافية يمكن استخدامها في الفيديوهات.
  • الغناء والكلمات (Vocals): هنا تكمن نقطة الضعف الكبرى. وصف التقرير محاولات Gemini لتوليد غناء بشري بأنها “صعبة الاستماع”. الأصوات تبدو روبوتية للغاية ومثقلة بتأثيرات الـ “Auto-tune”، والأهم أن الكلمات التي يتم غناؤها تكون غالباً غير مفهومة ومجرد تمتمات عشوائية (Gibberish) تشبه اللغة الخيالية المستخدمة في لعبة “The Sims”.

تعد هذه الميزة خطوة أولى واعدة من جوجل في مجال الصوتيات التوليدية، خاصة لمن يبحث عن خلفيات موسيقية سريعة. ومع ذلك، لا يزال أمام الشركة طريق طويل لتمكين Gemini من إنتاج أغانٍ متكاملة تحتوي على غناء بشري واقعي وكلمات ذات معنى.

لا يسمح بنقل هذا المحتوى من سوالف دون الاشارة برابط مباشر

استضافة مجانية استضافة محتوى

Ayman abdallah

مؤسس ومدير تنفيذي لمشروع [محتوى] للمواقع العربية، مدير ادارة المحتوى في شركة Super App والرئيس التنفيذي ومدير التحرير والاعلانات لموقع سوالف سوفت.

اقرأ أيضا:

اترك تعليقاً

زر الذهاب إلى الأعلى