جيميني (Gemini) هو نموذج جديد للذكاء الاصطناعي متعدد الوسائط من غوغل، وهو قادر على فهم ومزج بين اللغة والفهم البصري. وفقًا لشركة غوغل، يمكن لجيميني «التفاعل مع البيانات المرئية والنصية والصوتية بطرق مبتكرة ومفيدة». ويهدف النموذج إلى تحسين تجربة المستخدمين مع الذكاء الاصطناعي وجعلها أكثر طبيعية وممتعة.
ماذا يظهر العرض التوضيحي لجيميني؟
باالأمس نشرت غوغل عرضًا توضيحيًا يظهر بعض قدرات جيميني في التفاعل مع الوسائط المختلفة. في الفيديو، يمكننا رؤية جيميني وهو يروي رسمًا تخطيطيًا لبطة، ويتعرف على لعبة بطة زرقاء، ويجيب على الأسئلة الصوتية حولها. كما يظهر الفيديو جيميني وهو يقوم بمهام أخرى مثل تتبع الكرة في لعبة تبديل الأكواب، والتعرف على إيماءات دمية الظل، وإعادة ترتيب رسومات الكواكب.
الفيديو حقق مليون مشاهدة خلال اليوم الماضي، وأثار إعجاب الكثيرين بالقدرات الرائعة لجيميني. ومع ذلك، فإن الفيديو ليس كله حقيقي، بحسب تقرير لموقع تيك كرانتش، المتخصص في التكنولوجيا.
اقرأ أيضًا.. جيميني.. تعرّف إلى أداة غوغل الجديدة المنافسة لـ«تشات جي بي تي»
ما الذي يخفيه العرض التوضيحي لجيميني؟
في نهاية الفيديو، ينبه غوغل من أنه تم تقليل زمن الوصول وتم تقصير مخرجات جيميني. ولكن هذا ليس كل شيء. تكشف غوغل عن أن العرض التوضيحي تم إنشاؤه من خلال استخدام إطارات الصور الثابتة من لقطات لاختبار قدرات جيميني، والمطالبة عبر النص. وهذا يعني أن التفاعلات التي نراها في الفيديو لم تحدث في الواقع، وإنما هي نتيجة لمطالبات نصية مضبوطة بعناية مع الصور الثابتة.
🚨PSA about Google’s jaw-dropping video demo of Gemini – the one with the duck:
It was not carried out in real time or in voice. The model was shown still images from video footage and human prompts narrated afterwards, per a spokesperson. More here: https://t.co/ITU29Z5Oi9 pic.twitter.com/b9Bl9EpuuI
— Parmy Olson (@parmy) December 7, 2023
وهذا يثير الشكوك حول مدى قدرة جيميني على القيام بالمهام التي يعرضها غوغل في الفيديو بشكل مباشر وبالطريقة التي يشير إليها ضمنيًا. فمن الممكن أن يكون جيميني أقل سرعة ودقة ومرونة مما يبدو. وقد أبلغ بارمي أولسون من بلومبرغ عن هذا التناقض بين العرض التوضيحي والواقع.
اقرأ أيضًا.. «Gemini» أداة غوغل لمنافسة ChatGPT: ما مميزاتها؟
ما هي ردود الفعل على العرض التوضيحي لجيميني؟
ردود الفعل على العرض التوضيحي لجيميني كانت متباينة بين الإعجاب والانتقاد. بعض المشاهدين أعربوا عن إعجابهم بالتقدم الذي أحرزته غوغل في مجال الذكاء الاصطناعي، واعتبروا العرض التوضيحي مصدر إلهام وتحفيز. وبعضهم الآخر شعروا بخيبة أمل وغضب من كشف غوغل عن أن العرض التوضيحي ليس حقيقيًا، واعتبروا ذلك خداعًا وتضليلاً للجمهور.
وقد أثار العرض التوضيحي أيضًا بعض الأسئلة الهامة حول مسؤولية غوغل تجاه المستخدمين والمجتمع. هل يجب على غوغل أن تكون أكثر شفافية وصدقًا في عرض تقنياتها؟ هل يجب على غوغل أن تحترم حقوق الخصوصية والأمان للمستخدمين؟ هل يجب على غوغل أن تلتزم بالقواعد الأخلاقية والقانونية في استخدام الذكاء الاصطناعي؟