شركة OpenAI تصعد حربها على المبرمجين بإطلاق عائلة نماذج GPT-4.1 المركزة على المجال

⬤ أطلقت OpenAI نماذج GPT-4.1 البرمجية الجديدة لتعزيز أتمتة تطوير البرمجيات باستخدام الذكاء الاصطناعي.
⬤ تتميز النماذج بقدرات تقنية متقدمة مثل نافذة سياقية بمليون رمز وتحسينات كبيرة بناء على ملاحظات المطورين.
⬤ رغم الأداء القوي، تواجه GPT-4.1 منافسة شديدة من نماذج Google وAnthropic وتحديات في الدقة عند تحليل الأكواد الطويلة.
كشفت شركة OpenAI، يوم الإثنين، عن مجموعة نماذج GPT-4.1 الجديدة، والمصممة خصيصاً لتعزيز قدراتها في مجال البرمجة. وتشمل كلاً من نماذج GPT-4.1، وGPT-4.1 Mini، وGPT-4.1 Nano، وهي متاحة مباشرة للمطورين عبر واجهة برمجة التطبيقات (API)، دون دمجها حتى الآن في خدمة ChatGPT الموجهة للمستخدمين العاديين.
يعكس هذا الإطلاق التركيز المتزايد في صناعة الذكاء الاصطناعي على تطوير قدرات النماذج اللغوية الضخمة في إنتاج وتحرير الأكواد البرمجية. في ظل تسابق شركات منافسة مثل OpenAI وGoogle وAnthropic، إلى جانب شركات ناشئة مثل DeepSeek الصينية، نحو أدوات تحدث نقلة نوعية في أتمتة تطوير البرمجيات. وقد عبرت المديرة المالية لدى OpenAI، سارة فراير، عن طموح الشركة في بناء «مهندس برمجيات وكيل» قادر على إدارة دورة التطوير البرمجي الكاملة، من كتابة الكود إلى اختباره وتوثيقه. ويُعد إصدار GPT-4.1 خطوة متقدمة في هذا الاتجاه.
إلى جانب ذلك، صرح متحدث باسم OpenAI بأن النماذج الجديدة «تم تحسينها للاستخدام الواقعي بناء على ملاحظات مباشرة من المطورين،» مشيراً إلى تحسينات في مجالات حيوية مثل برمجة الواجهات الأمامية، وتقليل التعديلات غير الضرورية، والالتزام بالتنسيقات، والتنظيم الدقيق للردود، والاستخدام المتسق للأدوات، وغيرها.
تمتاز النماذج الجديدة بحدود معرفية محدثة تصل إلى يونيو 2024، إلى جانب تطورات تقنية بارزة، إذ تضم نافذة سياقية ضخمة بسعة مليون رمز، ما يسمح لها بتحليل ما يقارب 750 ألف كلمة، أو ما يعادل ثمانية أضعاف حجم الأكواد مقارنة بالنماذج السابقة، في جلسة واحدة. وهو ما يحسن من قدرتها على فهم الأكواد المعقدة، وإجراء تحسينات جوهرية، واكتشاف الأخطاء وإصلاحها بكفاءة.
تؤكد OpenAI أن النموذج الرائد GPT-4.1 يتفوق على النماذج الشهيرة السابقة مثل GPT-4o وGPT-4o Mini في اختبارات البرمجة، وحتى على GPT-4.5 الأكبر حجماً في بعض الجوانب، وفقاً لكبير مسؤولي المنتجات في الشركة، كيفن وايل.
على مقياس SWE-Bench الشائع لتقييم كفاءة النماذج في البرمجة، سجل GPT-4.1 نتائج تتراوح بين 52% و54.6% على المجموعة الفرعية Verified التي تم التحقق منها بشرياً، متفوقاً بعدة نقاط على نماذج OpenAI السابقة. مع الإشارة إلى أن OpenAI لم تتمكن من تشغيل بعض الاختبارات ضمن بنيتها التحتية. إلا أن هذه الأرقام تظل أقل من أداء Google بنموذج Gemini 2.5 Pro الذي حقق 63.8%، وClaude 3.7 Sonnet من Anthropic الذي سجل 62.3%.
بالإضافة إلى مهاراتها في البرمجة، أظهرت نماذج GPT-4.1 قدرات متعددة الوسائط، حيث تصدرت نتائج اختبار Video-MME في فئة «الفيديو الطويل بدون ترجمة» بدقة بلغت 72%، ما يعكس تفوقها في فهم محتوى الفيديو.
يكمن عامل الجذب الرئيسي في النماذج الجديدة في كفاءتها، ذلك أن GPT-4.1 أسرع بنسبة 40% من GPT-4o. كما وتأتي العائلة الجديدة بتسعير متدرج يتيح الوصول إلى قدرات متقدمة بأسعار معقولة. وبهذا الصدد، أشارت OpenAI إلى تقليص تكلفة الرموز المدخلة بنسبة 80% مقارنة بالإصدارات السابقة، في إشارة على الأرجح إلى تسعير نموذج Nano.
النموذج | تكلفة الرموز المدخلة (مليون رمز) | تكلفة الرموز المخرجة (مليون رمز) |
GPT-4.1 | 2.00 | 8.00 |
GPT-4.1 Mini | 0.40 | 1.60 |
GPT-4.1 Nano | 0.10 | 0.40 |
GPT-40 | 3.00 | 10.00 |
GPT-40 Mini | 0.15 | 0.60 |
يتزامن الإطلاق مع مساعي OpenAI لتحويل الشعبية الهائلة التي حققها ChatGPT إلى نشاط تجاري قوي، مع تقارير تفيد باقترابه من مليار مستخدم نشط أسبوعياً، وسط تحديات جسيمة لتحقيق استدامة مالية، في ظل تكاليف البحث والتطوير والبنية التحتية الباهظة، والتي كان آخر تجلياتها مشروع Stargate للذكاء الذي يُقدر بنحو 500 مليار دولار، بالشراكة مع SoftBank وOracle.
علاوة على ذلك، يشهد مشهد الذكاء الاصطناعي العالمي تزاحماً متزايداً، إذ أشار تقرير صادر عن جامعة Stanford إلى أن نماذج Google وDeepSeek باتت تضاهي قدرات OpenAI، بينما تلاحقها بقوة شركات مثل Anthropic وMeta وMistral الفرنسية.
رغم كل هذه التطورات، لا تخفي OpenAI وجود بعض القيود. فقد أظهرت الاختبارات الداخلية أن دقة GPT-4.1 تنخفض من 84% عند التعامل مع 8,000 رمز إلى 50% عند الوصول إلى مليون رمز. كما أوضحت الشركة أن النموذج الجديد يتمتع بسلوك «حرفي» أكثر بالمقارنة مع GPT-4o، ما قد يتطلب تعليمات أكثر وضوحاً ودقة.