جوجل تطلق نموذج Gemini Omni.. ذكاء اصطناعي متعدد المدخلات ينتج مقاطع فيديو من أي محتوى

جوجل تطلق نموذج Gemini Omni.. ذكاء اصطناعي متعدد المدخلات ينتج مقاطع فيديو من أي محتوى

كشفت شركة جوجل عن نموذجها الجديد للذكاء الاصطناعي “Gemini Omni” خلال مؤتمر المطورين السنوي Google I/O 2026. وتصف الشركة النموذج بأنه نظام قادر على “إنشاء أي شيء انطلاقًا من أي نوع من المدخلات”، مع تركيز أولي على توليد مقاطع الفيديو بالاعتماد على النصوص والصور والصوت وحتى المقاطع المصورة المدخلة من المستخدمين.

التوفر والإصدار الأول للجمهور

ويبدأ الإصدار الأول من النموذج، الذي يحمل اسم “Gemini Omni Flash”، بالتوافر ابتداءً من اليوم داخل تطبيق جوجل Gemini، بالإضافة إلى منصتَي Flow ويوتيوب Shorts. ويمكن الوصول إلى هذه الخدمة عبر باقات Google AI Plus و Pro و Ultra على مستوى العالم.

قدرات متقدمة تفوق الأدوات السابقة

وتقدم جوجل النموذج الجديد بوصفه خطوة متقدمة مقارنة بأدواتها السابقة مثل Nano Banana ونموذج توليد الفيديو Veo 3.1. فمن خلال Gemini Omni، يمكن للمستخدم إدماج النصوص والصور والصوت والفيديو في طلب واحد لإنتاج مقاطع فيديو عالية الجودة تستند إلى معرفة النموذج بالعالم الحقيقي.

وبخلاف نموذج Veo 3.1 الذي اعتمد بصورة أساسية على الأوامر النصية والصور، يدعم Gemini Omni نطاقًا أوسع من المدخلات، مع إمكانية تعديل المقاطع المنتجة عبر محادثة طبيعية متواصلة. ويحافظ النموذج على اتساق الشخصيات والعناصر في أثناء تنفيذ التعليمات المتتابعة التي يعطيها المستخدم.

تعديل الفيديو وتحسين الواقعية

وتقول جوجل إن المستخدم يستطيع تصوير مقطع فيديو عادي ثم الطلب من Omni تغيير ما يحدث داخله، سواء عبر إضافة شخصيات وعناصر جديدة، أو تعديل البيئة وزوايا التصوير والأسلوب البصري، وحتى تفاصيل المشهد الدقيقة.

وتؤكد الشركة أن النموذج يفهم بصورة أفضل العوامل الفيزيائية مثل الجاذبية والطاقة الحركية وديناميكيات السوائل، مما يفترض أن يمنح مقاطع الفيديو مظهرًا أكثر واقعية مقارنة بنماذج توليد الفيديو الحالية. وتضيف جوجل أن النظام يستفيد أيضًا من معرفة Gemini بالتاريخ والعلوم والسياقات الثقافية لإنتاج محتوى أكثر ترابطًا وواقعية.

ميزة الشخصية الرقمية والمخاوف المحتملة

ومن جهة أخرى، يتيح Gemini Omni إنشاء شخصية رقمية تحاكي المستخدم بصوته وشكله اعتمادًا على عينات صوتية وصور شخصية، وهي ميزة قد تثير مخاوف تتعلق بالخصوصية والتزييف العميق. وتقول جوجل إنها تعتمد “سياسات واضحة” للحد من إساءة استخدام أدوات الذكاء الاصطناعي، كما تختبر حاليًا أدوات تعديل الصوت والكلام قبل طرحها بصورة أوسع.

وأشارت الشركة إلى أن كافة مقاطع الفيديو المُنشأة عبر Gemini Omni ستحمل العلامة المائية الرقمية SynthID الخاصة بجوجل، بهدف التحقق من أن المحتوى مُنتج بالذكاء الاصطناعي.

وحتى الآن ما زالت جودة مقاطع الفيديو المولدة بالذكاء الاصطناعي تواجه انتقادات بسبب ظهور المشاهد بنحو غير طبيعي أحيانًا، لذلك يبقى الأداء الفعلي لنموذج Gemini Omni ومدى قدرته على تجاوز هذه المشكلة موضع اختبار مع بدء توفره للمستخدمين هذا الأسبوع.

الكويت الان ، موقع إخباري شامل يهتم بتقديم خدمة صحفية متميزة للقارئ، وهدفنا أن نصل لقرائنا الأعزاء بالخبر الأدق والأسرع والحصري بما يليق بقواعد وقيم الأسرة السعودية، لذلك نقدم لكم مجموعة كبيرة من الأخبار المتنوعة داخل الأقسام التالية، الأخبار العالمية و المحلية، الاقتصاد، تكنولوجيا ، فن، أخبار الرياضة، منوعات و سياحة.

اخبار تهمك