جوجل تكشف عن Gemini Omni

في سباق الذكاء الاصطناعي الذي أصبح يتحرك بسرعة غير مسبوقة، يبدو أن جوجل قررت أن تغيّر شكل المنافسة مرة أخرى.
خلال فعاليات Google I/O 2026 أعلنت الشركة عن Gemini Omni، وهي عائلة جديدة من نماذج الذكاء الاصطناعي متعددة الوسائط، لكن الفكرة هنا أكبر من مجرد نموذج جديد أو تحديث اعتيادي. الهدف المعلن من جوجل يبدو طموحًا جدًا: الوصول إلى القدرة على إنشاء أي نوع من المحتوى انطلاقًا من أي نوع من المدخلات.
النسخة الأولى التي كشفت عنها الشركة تحمل اسم Gemini Omni Flash، وهي تركز حاليًا على توليد الفيديو، لكنها تختلف عن الأدوات التقليدية لأن المستخدم لا يحتاج للاعتماد على النص فقط. يمكنك إعطاء النموذج صورة أو فيديو أو مقطع صوتي أو حتى مزج أكثر من نوع من المدخلات معًا، ثم يخرج لك فيديو جديد مبني على كل هذه العناصر في وقت واحد.
هذا التطور يمثل خطوة مختلفة عن كثير من أدوات الجيل السابق التي كانت تعمل بمنطق: “اكتب وصفًا واحصل على نتيجة”. هنا الفكرة أصبحت أقرب إلى حوار إبداعي مستمر مع النموذج.
ماذا يجعل Gemini Omni مختلفًا؟
الشيء اللافت أن جوجل لا تتحدث عن Omni باعتباره مجرد أداة فيديو، بل تعتبره بداية منصة أوسع لبناء المحتوى متعدد الوسائط. الشركة وصفت الفكرة بأنها “Create anything from any input”، أي تحويل أي مدخل إلى أي مخرج مستقبليًا. البداية بالفيديو فقط، لكن الرؤية أكبر من ذلك بكثير.
بحسب المعلومات المعلنة، يستطيع النموذج التعامل مع:
- نصوص
- صور
- فيديوهات
- تسجيلات صوتية
- مزج أكثر من نوع داخل نفس الطلب
ثم إنتاج فيديو متماسك يحافظ على العناصر والشخصيات أثناء التعديل. وهذا يفتح بابًا ضخمًا لصناع المحتوى، لأن الفكرة لم تعد تبدأ من شاشة فارغة.
تخيل أن ترفع صورة لشخص، مع تسجيل صوتي قصير ووصف نصي للمشهد… ثم تحصل على فيديو جاهز خلال دقائق.
هل هذا يعني نهاية أدوات الفيديو الحالية؟
ليس بهذه السرعة.
جوجل نفسها ما زالت تمتلك أدوات أخرى مثل Veo، لكن Gemini Omni يبدو وكأنه محاولة لتوحيد التجربة داخل بيئة Gemini نفسها بدل توزيع الأدوات على نماذج منفصلة. أحد الفروق المهمة أن Veo كان يركز أساسًا على النص إلى فيديو، بينما Omni يتعامل مع أنواع متعددة من المدخلات داخل نفس العملية.
هناك أيضًا نقطة مثيرة: النموذج يدعم التحرير الحواري. بدل إعادة إنشاء الفيديو من البداية، يمكن تعديل العناصر أثناء العمل باستخدام أوامر طبيعية مثل تغيير الخلفية أو إعادة تشكيل الحركة أو تعديل المشهد نفسه.
لماذا قد يكون هذا الإعلان مهمًا فعلًا؟
لأن الاتجاه العام في الذكاء الاصطناعي تغيّر.
- الجيل الأول ركّز على إنشاء النصوص.
- الجيل الثاني ركّز على الصور.
- والمرحلة الحالية تتحرك نحو النماذج الشاملة التي ترى وتسمع وتفهم وتنتج.
جوجل أيضًا أعلنت أن Gemini وصل إلى مئات الملايين من المستخدمين شهريًا وتواصل دمجه داخل خدماتها المختلفة، ما يعني أن قدرات Omni قد لا تبقى محصورة داخل تطبيق واحد فقط.
لكن رغم كل الحماس، يبقى السؤال الحقيقي: هل سيستخدم الناس هذه الأدوات لإنتاج محتوى أفضل… أم سنشهد انفجارًا أكبر في المحتوى المكرر؟
الإجابة لم تظهر بعد.
لكن الواضح أن Gemini Omni ليس مجرد تحديث صغير، بل محاولة جديدة لجعل الذكاء الاصطناعي يتعامل مع الإبداع كعملية واحدة متصلة بدل أدوات منفصلة لكل نوع من المحتوى.

لا يسمح بنقل هذا المحتوى من سوالف دون الاشارة برابط مباشر





