تحديثات جديدة تتيح أقوى ميزات ChatGPT مجاناً وتضيف قدرات محادثة صوتية فورية
نموذج GPT-4o الجديد يدرك بالصّوت والصّورة مباشرة
⬤ أعلنت شركة OpenAI يوم أمس عن التحديثات الجديدة المضافة لروبوت محادثة ChatGPT بعد العديد من التخمينات السابقة.
⬤ تضمنت الميزات إتاحة قدرات الروبوت مجاناً، وسرعة عالية وبالأخص في المحادثات باللغة الطبيعية والقدرة على الترجمة الحية.
⬤ سبق وأن تناولت الشائعات إصدار محرك بحث من الشركة أو ربما GPT-5، لكن سام ألتمان أكد أن ذلك لن يحدث الآن على الأقل.
بعد سيل من التوقّعات حول التّحديثات الجديدة المرتقبة من OpenAI، وتوقّعات حول نموذج جديد كلّيّاً ومحرّك بحث ثوريّ، هدم سام ألتمان، المدير التّنفيذيّ للشّركة كلّ تلك الأمانيّ عبر تغريدة بسيطة على منصّة إكس قال فيها بكلّ وضوح وبساطة: «لا GPT-5، ولا محرّك بحث». لحسن الحظّ، جاء اليوم المنتَظر، وأعلنت OpenAI أخيراً عن الميزات والإضافات الجديدة على خدمات الذّكاء الاصطناعيّ خاصّتها، وذلك في حدثها الأخير يوم 13 مايو الفائت، ويمكننا القول إنّ جديد الشّركة كان مميّزاً إلى حدّ كبير، لكن ليس بالثّوريّ تماماً.
ثلاثة أشياء فقط. هكذا قالت ميرا موراتي، رئيس الخبراء التقنيين في OpenAI، في مستهلّ حديثها عن الإعلان عن “تحديث الرّبيع” الجديد لنماذج الذّكاء الاصطناعيّ المقدّمة من الشّركة، والّذي ركّزت فيه بالدّرجة الأولى على جانبَين اثنَين. الجانب الأوّل تمثّل إتاحة خدمات وميزات النماذج المحدّثة لأكبر شريحة ممكنة من المشتركين، والتّقليل قدر الإمكان من المعوقات الّتي تحدّ من استخدام ChatGPT في أيّ مكان. أمّا الجانب الثّاني فقد كان إطلاق تطبيق ChatGPT لأجهزة الحاسوب، بالإضافة إلى تحديث عامّ على واجهة الاستخدام، لجعلها أبسط في الاستخدام.
على أنّ الخبر الأهمّ كان الإعلان عن النّموذج الجديد الرّائد من OpenAI، والّذي حمل الاسم GPT-4o. الحرف “o” هو اختصار لكلمة “omni”، كما تقول ميرا، والّذي يرمز إلى التّعدّد أو الشّموليّة، وهو ما كرّسته الشّركة فعليّاً، إذ أعلنت أنّ النّموذج الجديد سيضع قدرات GPT-4 الحاليّ بين أيدي الجميع، ومن ضمنهم بالتّحديد مستخدمي ChatGPT ذوي الاشتراك المجّانيّ.
تطبيق ChatGPT على أجهزة الحاسوب… أخيراً
يأتي الإعلان عن التّطبيق الجديد في إطار مساعي OpenAI على “تسهيل الوصول والاستخدام” لخدماتها، وهي بذلك تقدّم حلّاً أكثر اندماجاً وتكاملاً مع كلّ من نظامَي Windows وmacOS. تلك الخطوة هي امتداد للتّحديثات الجديدة الّتي طرأت على واجهة استخدام ChatGPT، والّتي كان الهدف منها الحدّ من التّعقيد المرتبط بالميّزات والخدمات، وتوجيه تركيز المستخدم نحو التّفاعل أكثر مع الذّكاء الاصطناعيّ.
لقد باتت OpenAI مدركة جيّداً لأهميّة إتاحة إمكانات نماذج الذّكاء الاصطناعيّ خاصّتها للعموم للاستخدام المجّانيّ، فذلك ـ من جهة ـ أفضل سبيل لتثقيف المستخدمين بميزات الخدمة وما هي قادرة عليه فعليّاً، ومن جهة أخرى، محاولة لاستعادة الزّخم بعد أن شهد ChatGPT منافسة كبيرة من أداوت أخرى مثل Copilot وGemini اللّتان تقدمان مجموعة ميزات متقدّمة في خطط الاشتراك المجّانيّ.
ذكاء GPT-4، لكن على نحو أسرع وأشمل
في إطار الهدف ذاته، أي تقديم أكبر كمّ ممكن من الخدمات والميزات إلى كافّة المستخدمين، ركّزت OpenAI مع النّموذج الجديد في المقام الأوّل على جعل قدرات GPT-4 متاحة بالمجّان. بات بإمكان كلّ من لديه حساب ChatGPT الآن مخاطبة النّموذج الأذكى عبر الصّوت والصّور والمستندات، وعبر الإنترنت أيضاً من خلال ميزة التّصفّح الّتي تتيح الوصول إلى معلومات مباشرة من الإنترنت. في هذا الصّدد، أكّدت موراتي أنّ OpenAI لا تنوي الحصول على المال من خلال عرض الإعلانات لمشتركي الحسابات المجّانيّة.
التّرقية الكبيرة تمثّلت في إسباغ طابع تفكير أكثر تقدّماً مع GPT-4o، حيث بات بإمكانه الآن “الإدراك بالصّوت، والنّص، والرّؤية” وفي الوقت الفعليّ، وبسرعة أكبر تضاهي تقريباً سرعة استجابة الإنسان خلال الحوار الطّبيعيّ.
على صعيد الصّوت
ضمن اللّقاء التّقديميّ، استعرضت الشّركة إمكانيّات النّموذج الجديد على أرض الواقع. في البداية، أُجريت محادثة صوتيّة مع النّموذج الجديد، ليكشف عن تحسّن هائل في استيعاب السّياق وفي لهجة الخطاب الّتي باتت محاكية لطريقة تحدّث البشر الاعتياديّة إلى حدّ معقول. إحدى الإضافات البارزة تمثّلت في أنّ ChatGPT بات قادراً الآن على الاستجابة للمقاطعة في جلسات الحوار الصّوتيّ، ولم يعد من الضّروريّ انتظار أن ينتهي النّموذج من نطق كامل ما لديه، بل أصبح من الإمكان مقاطعته في الحديث وقتما كان.
كذلك الأمر، رأينا تحسّناً كبيراً على صعيد استجابة النّموذج الصّوتيّ في الوقت الفعليّ، وباتت بسرعة أكبر تضاهي تقريباً سرعة استجابة الإنسان خلال الحوار الطّبيعيّ، ورأينا كيف جرّب فريق التّقديم استخدامه كمترجم فوريّ بين الإنجليزيّة والإيطاليّة.
لعلّ الجزء الأكثر إثارة للاهتمام كان قدرة ChatGPT على التقاط المشاعر في طريقة وأسلوب التّحدّث إليه، ما يفتح مجالاً لتفاعل أكثر دقّة وفعاليّة. بات ChatGPT نفسه الآن قادراً على التّحدّث بأنماط صوتيّة متباينة، إذ يمكنه أن يتحدّث بجدّيّة أو حزن، يمكنه أن يغنّي حتّى، لكنّك لن تُطرَب لصوته على الأرجح!
قدرة أكبر على الإبصار
خلال العرض، كان من المبهر حقّاً رؤية كيفيّة تفاعل ChatGPT بالصّوت والصّورة عندما طُلب منه المساعدة في حلّ مسألة رياضيّة. شغّل كاميرا هاتفك ليرى النّموذج المسألة ويرشدك في الحلّ، وكأنّها مكالمة فيديو مباشرة بين تلميذ ومدرّس.
ينسحب الأمر ذاته على تطبيق ChatGPT الجديد على أجهزة الحاسوب، والّذي يمكنك مشاركة عرض الشّاشة مباشرة معه والسّؤال عن أيّ شيء، بالصّوت والصّورة أيضاً.
إضافات أخرى
لم تقتصر إضافة نموذج GPT-4o الجديد على واجهة المحادثة ChatGPT، بل أُدخل أيضاً إلى واجهة برمجة التّطبيقات (API) من OpenAI، وتعد الشّركة بأنّه أسرع بمرّتَين مقارنة مع إصدار GPT-4 Turbo السّابق، وأرخص بنسبة 50%، ويمتاز أيضاً بسقف محدوديّة أعلى بخمسة أضعاف.
يأتي الإعلان عن تحديثات OpenAI الجديدة قبل يوم واحد من مؤتمر Google السّنويّ للمطوّرين 2024، والّذي من المتوقّع أن يشهد إعلان الأخيرة عن عدد من المنتجات والميزات الجديدة المرتبطة بالذّكاء الاصطناعيّ. لقد أشارت تقارير عدّة عن عزم OpenAI إطلاق منتج جديد متعلّق بالبحث باستخدام الذّكاء الاصطناعيّ، والّذي سيكون مباشرة منافساً لمحرّك Google، لكنّ يُرجّح أنّ الشّركة ارتأت تأجيل الأمر. يُشار إلى أنّ قيمة أسهم شركة Alphabet المالكة لشركة Google كانت قد انخفضت بنسبة 0.4% عقب حدث OpenAI الأخير، وذلك بعد هبوطها بنسبة 3% تقريباً في وقت سابق، في حين هبطت قيمة أسهم Microsoft بنحو 0.2%.