مقابل 30 دولاراً فقط، باحثون يعيدون إنشاء تقنية DeepSeek الأساسية

⬤ نجح باحثون بإعادة إنشاء التقنية الأساسية في DeepSeek بتكلفة زهيدة تؤكد إمكانية التطوير الرخيص للذكاء الاصطناعي.

⬤ أظهر النموذج المعاد إنشاؤه قدرة على التعلم التعزيزي والتصحيح الذاتي، مما سمح له بتحسين دقته وأدائه تدريجياً.

⬤ أثارت نماذج DeepSeek جدلاً واسعاً مؤخراً بشأن صحة تكلفتها المعلنة ومخاوف تتعلق بإرسال بيانات المستخدمين إلى الصين.

أعلن باحثون من جامعة كاليفورنيا في بيركلي أنهم تمكنوا من إعادة إنشاء التقنية الأساسية التي تقوم عليها منظومة الذكاء الاصطناعي الصينية الثورية DeepSeek، وبتكلفة لم تتجاوز 30 دولاراً. وتُعدّ هذه المحاولة الناجحة مؤشراً جديداً على أن تطوير النماذج الذكية قد يكون أقل تكلفة بكثير مما هو متوقع، رغم الإنجازات الكبيرة التي حققتها الشركات الكبرى في هذا المجال.

قام فريق البحث بمحاكاة قدرات التعلم التعزيزي لنموذج DeepSeek R1-Zero باستخدام نموذج لغة صغير يضم 3 مليارات معامل فقط. ورغم صغر حجمه نسبياً، أظهر الذكاء الاصطناعي القدرة على التحقق الذاتي وإجراء عمليات بحث متكررة، وهي ميزات أساسية تمكنه من تحسين استجاباته تدريجياً.

لاختبار النموذج، استخدم الباحثون لعبة Countdown، وهي أحجية رقمية مستوحاة من برنامج بريطاني حيث يتعين على اللاعبين استخدام العمليات الحسابية للوصول إلى رقم معين. وفي البداية، قدم النموذج تخمينات عشوائية، لكنه طور بمرور الوقت استراتيجيات للتصحيح الذاتي، والمراجعة، وحل المسائل بشكل تكراري من خلال التعلم التعزيزي.

مواضيع مشابهة

خلقت هذه التجربة حالة من الحيرة في أوساط الباحثين، فهي ليست سوى جزء ضئيل للغاية مقارنة بالمبالغ الهائلة التي تنفقها الشركات الرائدة على عمليات تدريب الذكاء الاصطناعي واسعة النطاق.

اختبر الباحثون عدة نماذج بأحجام مختلفة، بدءاً من نموذج يحتوي على 500 مليون معامل، إلا أن قدرته اقتصرت على تقديم تخمينات دون تحسين في الأداء، بغض النظر عن دقة إجاباته. ولدى توسيع تعداد المعاملات إلى 1.5 مليار، بدأ النموذج المُعاد إنشاؤه استخدام تقنيات المراجعة. وأفاد فريق البحث بأن النماذج التي تراوح حجمها بين 3 و7 مليارات معامل أظهرت تحسناً ملحوظاً، حيث أصبحت قادرة على حل المشكلات بعدد أقل من الخطوات وبدقة أعلى.

في سياق المقارنة، تتقاضى OpenAI رسوماً قدرها 15 دولاراً لكل مليون رمز يتم استخدامه عبر واجهة برمجية التطبيق الخاصة بها، في حين تقدم DeepSeek تكلفة أقل بكثير تبلغ 0.55 دولار لكل مليون رمز، وهو فارق شاسع وغير مفهوم تماماً بالنظر للمبالغ الطائلة التي تستثمرها الشركات الرائدة في المجال حالياً. ولكن رغم ذلك، تبرز هواجس عدة إزاء استخدام DeepSeek.

هنالك في المقام الأول التشكيك في ادعاءات DeepSeek حول تكلفتها المنخفضة. فقد أعرب الباحث في الذكاء الاصطناعي ناثان لامبرت عن تشكيكه بصحة الرقم المعلن عن تكلفة تدريب نموذج DeepSeek الذي يضم 671 مليار معامل، والتي يُقال إنها بلغت 5 ملايين دولار فقط، معتبراً أن هذا الرقم قد لا يعكس الصورة الكاملة.

بالإضافة إلى ذلك، تقوم منظومة الذكاء الاصطناعي هذه بإرسال كميات كبيرة من البيانات إلى الصين، وهو ما يثير قلق الحكومات الغربية والعالمية ويدفع العديد من الجهات في الولايات المتحدة لاقتراح حظر استخدام DeepSeek. ناهيك عن الادعاءات بانتهاك الأخير لسياسات وشروط استخدام نماذج OpenAI واستخدام ChatGPT في عمليات التدريب.

لكن مع ذلك، يثبت بحث فريق بيركلي إمكانية تحقيق تقدم كبير في التعلم التعزيزي المتقدم دون الحاجة إلى الميزانيات الضخمة التي تخصصها شركات مثل OpenAI وGoogle وMicrosoft. ومع وصول إنفاق بعض مختبرات الذكاء الاصطناعي إلى 10 مليارات دولار سنوياً على تدريب النماذج، تسلط هذه الدراسة الضوء على احتمال حدوث تحول جذري في هذا المجال.

شارك المحتوى |
close icon