أعلن سام ألتمان، الرئيس التنفيذي لشركة OpenAI، خلال بث مباشر، عن أول تحديث رئيسي لقدرات ChatGPT على إنشاء الصور منذ أكثر من عام. يستطيع ChatGPT الآن الاستفادة من نموذج GPT-4o لإنشاء وتعديل الصور تلقائيًا، بعد أن كان النموذج يقتصر على إنشاء وتحرير النصوص فقط.
وأوضح ألتمان أن ميزة إنشاء الصور الأصلية بواسطة GPT-4o متاحة حاليًا لمشتركي باقة Pro في ChatGPT وSora، منتج OpenAI لإنشاء مقاطع الفيديو بالذكاء الاصطناعي، مقابل 200 دولار شهريًا.
تعتزم OpenAI طرح الميزة قريبًا لمستخدمي ChatGPT المميزين والمجانيين، بالإضافة إلى المطورين الذين يستخدمون واجهة برمجة التطبيقات (API) الخاصة بالشركة.
تحسينات ملحوظة في جودة الصور
بحسب موقع TechCrunchيتميز GPT-4o بقدرته على إنتاج صور ذات جودة ودقة أعلى مقارنةً بنموذج DALL-E 3، مع إخراج صور أكثر تفصيلًا. يتيح النموذج أيضًا تعديل الصور الموجودة، بما في ذلك الصور التي تحتوي على أشخاص، وإضافة عناصر جديدة إلى المقدمة والخلفية.
بيانات التدريب ومخاوف الملكية الفكري
أفادت OpenAI بأنها دربت GPT-4o على “بيانات متاحة للعامة” وبيانات خاصة من شراكاتها مع شركات مثل Shutterstock.
تعتبر بيانات التدريب ميزة تنافسية، ولكنها أيضًا مصدر محتمل لدعاوى قضائية تتعلق بالملكية الفكرية.
,أكد براد لايتكاب، الرئيس التنفيذي للعمليات في OpenAI، احترام الشركة لحقوق الفنانين، مشيرًا إلى وجود سياسات تمنع إنتاج صور تحاكي أعمال أي فنان حيّ بشكل مباشر.
توفر OpenAI نموذجًا لإلغاء الاشتراك يسمح للمبدعين بطلب إزالة أعمالهم من مجموعات بيانات التدريب. كما تؤكد الشركة أنها تحترم طلبات منع روبوتات استخراج البيانات من الويب من جمع بيانات التدريب.
مقارنة مع Gemini 2.0 Flash من جوجل
يأتي هذا التحديث في أعقاب تجربة جوجل لإنتاج الصور الأصلية بواسطة Gemini 2.0 Flash، والتي أثارت جدلًا بسبب عدم وجود حواجز حماية كافية. تبين أن مُكوّن الصور في Gemini 2.0 Flash يسمح للمستخدمين بإزالة العلامات المائية وإنشاء صور تُصوّر شخصيات محمية بحقوق الطبع والنشر.























