أطلقت شركة DeepSeek الصينية، المتخصصة في الذكاء الاصطناعي، نموذجًا «مفتوحًا» جديدًا وقد أثار هذا النموذج جدلاً واسعًا لكونه يشبه ChatGPT ولكنه مجاني.
بحسب موقع «بيزنس إنسايدر»، تأسست DeepSeek في عام 2023، وهدفها، كما ذكرت في ورقتها البحثية، هو استكشاف إمكانات الذكاء الاصطناعي في «تطوير قدرات الاستدلال دون الاعتماد على أي بيانات خاضعة للإشراف»، وهي تقنية شائعة في أبحاث الذكاء الاصطناعي. كشفت الشركة أيضًا أن إصدارًا سابقًا من R1 يُدعى R1-Zero كان بمثابة «لحظة إدراك» لهم، حيث «تعلّم الذكاء الاصطناعي تخصيص وقت تفكير أطول للمشكلة من خلال إعادة تقييم منهجه الأولي».
لماذا تثير DeepSeek جدلاً؟
أداء يضاهي o1 من OpenAI: أعلنت الشركة أن أحد إصدارات الذكاء الاصطناعي الخاصة بها وهو R1 يُحقق «أداءً يُضاهي أداء نموذج o1 من OpenAI في مهام الرياضيات والبرمجة والاستدلال». تُوضّح ورقتها البحثية أن هذا الإنجاز يعود إلى استخدام «التعلم بالتعزيز الخالص»، وهي تقنية شبيهة بالأسلوب الذي مكّن AlphaZero من Google DeepMind من إتقان ألعاب مثل Go والشطرنج من الصفر، «دون الحاجة إلى تقليد حركات الأساتذة البشر أولاً»، كما علّق جيم فان، مدير أبحاث أول في Nvidia، على منصة X، واصفًا ذلك بأنه «أهم ما توصلت إليه الورقة».
مستوى عال من الشفافية: كذلك تُقدّم النتيجة النهائية ما وصفه أستاذ Wharton، إيثان موليك، بردود من R1 تبدو «كأنها إنسان يُفكر بصوت عالٍ»، ما يُشير إلى مستوى عالٍ من الشفافية والوضوح في عملية التفكير لدى النموذج. والجدير بالذكر أن هذا المستوى من الشفافية نادر في الإصدارات السابقة لنماذج مماثلة من شركات مثل OpenAI.
اقرأ أيضًا.. «Stargate» يشعل حربًا بين إيلون ماسك وسام ألتمان.. ما القصة؟
يُؤكّد ناثان لامبرت، الباحث في معهد Allen للذكاء الاصطناعي، على Substack أن ورقة R1 «تُمثّل نقطة تحول رئيسية في أبحاث نماذج الاستدلال»، حيث «كانت هذه النماذج حتى الآن مجالًا رئيسيًا للبحث الصناعي دون وجود ورقة بحثية أساسية واضحة».
التزام بروح المصادر المفتوحة: تم إصدار نموذج R1 من DeepSeek برخصة MIT، وهي المعيار الصناعي لتراخيص البرامج. تُشكّل هذه الجوانب المُجتمعة في R1 تحديًا كبيرًا للاعبين الأمريكيين المُشاركين في سباق التسلح في مجال الذكاء الاصطناعي مع الصين، الخصم الجيوسياسي الرئيسي للولايات المتحدة، وذلك لعدة أسباب:
المنافسة التقنية: يُظهر R1 أن الصين قادرة على مُنافسة أفضل نماذج الذكاء الاصطناعي في الصناعة ومواكبة أحدث التطورات في Silicon Valley.
تحدي نماذج الأعمال: يُمكن أن يُشكّل فتح مصدر الذكاء الاصطناعي المُتقدّم تحديًا للشركات التي تسعى إلى تحقيق أرباح ضخمة من بيع تقنيتها، حيث يُمكن للنماذج مفتوحة المصدر أن تُقدّم قدرات مُماثلة مجانًا.
سباق التسلح في الذكاء الاصطناعي
تُشكّل العناصر المُجتمعة في نموذج R1 تحديًا مُعقدًا للشركات الأمريكية المُشاركة في سباق التسلح في مجال الذكاء الاصطناعي مع الصين، التي تُعتبر منافسًا جيوسياسيًا رئيسيًا للولايات المتحدة. يرجع ذلك لعدة أسباب:
أولاً، يُثبت R1 أن الصين قادرة على مُنافسة أفضل نماذج الذكاء الاصطناعي في الصناعة ومواكبة أحدث التطورات القادمة من وادي السيليكون.
ثانيًا، يُمكن أن يُشكّل توفير نموذج ذكاء اصطناعي مُتقدّم مفتوح المصدر تحديًا للشركات التي تسعى إلى تحقيق أرباح كبيرة من بيع تقنياتها. على سبيل المثال، قدّمت OpenAI اشتراك ChatGPT Pro في ديسمبر بسعر 200 دولار شهريًا، مُروّجةً له كاشتراك يُوفّر “وصولاً غير محدود” إلى نموذجها الأكثر تطورًا في ذلك الوقت، o1. إذا كان نموذج مفتوح المصدر يُقدّم قدرات مُماثلة مجانًا، فمن المُحتمل أن يقلّ الحافز لشراء اشتراك مدفوع مُكلّف.
وقد لخّص جيم فان من Nvidia الوضع على منصة X بقوله: «نحن نعيش في زمن تُحافظ فيه شركة غير أمريكية على المهمة الأصلية لـ OpenAI – بحث حدودي مفتوح حقًا يُمكّن الجميع».
سبق لـ DeepSeek أن أظهرت قدرات استدلالية مُبهرة. ففي نوفمبر، أطلقت الشركة «R1-lite-preview» الذي عرض «عملية التفكير الشفافة في الوقت الفعلي» . وفي ديسمبر، أطلقت نموذج V3 ليُشكّل أساسًا جديدًا وأكثر تطورًا لقدرات الاستدلال في النماذج المستقبلية.
نموذج DeepSeek V3 شبيه ChatGPT
على الجانب الآخر، تُظهر الاختبارات والمنشورات على منصة X أن DeepSeek V3 يُعرّف نفسه بشكل متكرر على أنه ChatGPT، منصة الدردشة الآلية من OpenAI. بل ويُصرّ على أنه نسخة من نموذج GPT-4 الذي أطلقته OpenAI في عام 2023. يتجاوز الأمر مجرد التعريف بالاسم، حيث يُقدّم DeepSeek V3 تعليمات حول كيفية استخدام واجهة برمجة تطبيقات OpenAI عند سؤاله عن واجهة برمجة تطبيقات DeepSeek الخاصة به، حتى أنه يُعيد سرد بعض النكات التي يرويها GPT-4 بنفس الصياغة.
بحسب موقع «تيك كرانتش»، يُعزى هذا السلوك الغريب إلى طريقة عمل نماذج الذكاء الاصطناعي الإحصائية. يتم تدريب هذه النماذج على كميات هائلة من البيانات، ما يُمكنها من تعلّم الأنماط وإجراء التنبؤات. لم تكشف DeepSeek عن مصدر بيانات تدريب DeepSeek V3، ولكن من المُرجّح أنه تم تدريبه على مجموعات بيانات عامة تحتوي على نصوص مُولّدة بواسطة GPT-4 عبر ChatGPT. هذا قد يُفسّر قيام النموذج بحفظ بعض مخرجات GPT-4 وإعادة إنتاجها حرفيًا.
اقرأ أيضًا.. ما هو مشروع الذكاء الاصطناعي «Stargate»؟
يُعلّق مايك كوك، الباحث في جامعة كينغز كوليدج لندن والمتخصص في الذكاء الاصطناعي، قائلاً: «من الواضح أن النموذج اطلع على استجابات ChatGPT الأولية في مرحلة ما، ولكن من غير الواضح أين حدث ذلك.» ويُضيف أن تدريب النماذج على مخرجات أنظمة ذكاء اصطناعي مُنافسة قد يكون له آثار سلبية على جودة النماذج، حيث يُمكن أن يؤدي إلى الهلوسة والإجابات المُضلّلة، بالإضافة إلى إمكانية انتهاك شروط الخدمة الخاصة بتلك الأنظمة.
من جانبها، تحظر شروط OpenAI استخدام مخرجات منتجاتها، بما في ذلك ChatGPT، لتطوير نماذج مُنافسة. لم تُصدر OpenAI وDeepSeek ردًا رسميًا على طلبات التعليق، إلا أن سام ألتمان، الرئيس التنفيذي لـ OpenAI، نشر تغريدة على منصة X بدت وكأنها تعليق على DeepSeek ومنافسين آخرين، حيث كتب: «من السهل (نسبيًا) نسخ شيء تعرف أنه ناجح. من الصعب للغاية القيام بشيء جديد ومحفوف بالمخاطر وصعب عندما لا تعرف ما إذا كان سينجح أم لا.»
DeepSeek V3 ليس الأول يخطئ في تعريف نفسه
يُذكر أن DeepSeek V3 ليس النموذج الأول الذي يُخطئ في تعريف نفسه، حيث سبق أن ادعت نماذج أخرى، مثل Gemini التابعة لـ Google، أنها نماذج مُنافسة. يُعزى ذلك إلى «تلوث» الإنترنت بمخرجات الذكاء الاصطناعي، حيث تُستخدم هذه التقنية لإنشاء محتوى Clickbait وملء المنصات بالروبوتات. يُقدّر البعض أن 90% من محتوى الويب قد يتم إنشاؤه بواسطة الذكاء الاصطناعي بحلول عام 2026.
تُشير هايدي خلاف، كبيرة علماء الذكاء الاصطناعي في معهد AI Now، إلى أن التوفير في التكاليف الناتج عن «تقطير» معرفة النماذج الحالية قد يكون جذابًا للمطورين، بغض النظر عن المخاطر. وتُضيف أن النماذج التي يتم تدريبها عن طريق الخطأ على مخرجات ChatGPT أو GPT-4 لن تُظهر بالضرورة مخرجات تُشبه رسائل OpenAI.
الكفاءة العالية والاستهلاك الأقل للموارد
أشار عوني حنون، الباحث في مجال التعلم الآلي في شركة Apple، إلى أن إحدى المزايا الرئيسية لنموذج R1 هي كفاءته العالية واستهلاكه المنخفض للموارد، ما يُبشّر بإمكانية تشغيل نماذج الذكاء الاصطناعي المُتقدّمة، المُشابهة لنموذج o1 مفتوح المصدر من OpenAI، على الأجهزة الاستهلاكية المنزلية. يُمكن «تقطير» النموذج، أي إنشاء إصدارات أصغر حجمًا ولكنها لا تزال قوية، لتشغيلها على أجهزة ذات قدرات حوسبية أقل من تلك الموجودة في الخوادم الضخمة بمراكز البيانات التي تعتمد عليها معظم شركات التكنولوجيا.
وقد أوضح حنون هذه النقطة من خلال مشاركة مقطع فيديو على منصة X يُظهر إصدارًا من R1 يحتوي على 671 مليار مُعامل يعمل على شريحتين من Apple M2 Ultra، ويُقدّم استجابة منطقية لسؤال حول أفضلية اللعب المباشر أو التدفق في لعبة البوكر Texas Hold’em، مُشيرًا إلى أن الاستجابة جاءت «أسرع من سرعة القراءة».
مخاوف بشأن الرقابة
مع ذلك، أثارت هيلين تونر، العضوة السابقة في مجلس إدارة OpenAI، مخاوف بشأن وجود رقابة على نموذج R1، حيث أشارت على منصة X إلى وجود عروض توضيحية للنموذج “يُغلق فيها نفسه عند سؤاله عن مواضيع لا تُفضّلها الحكومة الصينية”. ومع ذلك، رجّحت تونر أن “الرقابة تُطبّق من خلال طبقة برمجية إضافية، وليست مُدمجة في النموذج نفسه”. لم تُصدر شركة DeepSeek أي تعليق رسمي على هذه الادعاءات.
من الجدير بالذكر أن OpenAI قدّمت نموذجًا جديدًا يُدعى o3، يُفترض أنه خليفة لنموذج o1 الذي يُنافسه DeepSeek. أوضح ناثان لامبرت في مدونته أن OpenAI «مُتقدّمة على الأرجح من الناحية التقنية»، لكنه أشار إلى أن نموذج o3 “غير مُتاح للجمهور حاليًا”، وأن معلومات أساسية عنه، مثل «أوزانه»، لن تكون مُتاحة قريبًا.
بناءً على التطورات السريعة التي تُحققها DeepSeek، ليس من المُستبعد أن يُحقق نموذجها التالي مستوى أداء مُكافئًا لنموذج o3، ما يُنذر بمنافسة شرسة بين قادة التكنولوجيا في الولايات المتحدة والصين.