يُقال أن إصدار ChatGPT-4 أكثر تطوراً بعشر مرات من سابقه GPT-3.5. ولكن لماذا؟ وما هو الفرق بين هذين النموذجين؟ وما الذي جعل الإصدار الجديد ينتشر بسرعة رهيبة؟ هذا ما سنجيب عنه في هذا المقال.
ما هو GPT-4؟
هو النموذج اللغوي الأخير الذي أصدرته شركة OpenAI. وهذا النموذج يندرج ضمن أحد اهتمامات الشركة في مجال الذكاء الاصطناعي التوليدي Generative AI؛ وهو المجال الذي يهتم بتطوير تقنيات الذكاء الاصطناعي التي تعمل على إنتاج (أو توليد) أي نوع من المحتوى بما فيها الصور والنصوص والفيديوهات وغيرها من البيانات.
يُستخدَم هذا النموذج في الكثير من الخدمات اليوم، فمثلاً يستخدم في روبوت ChatGPT كما يستخدم في أحدث إصدار من Bing Chat وفي تطبيق Duolingo لتعلّم اللغات وغيرها.
والحقيقة أن هذا الإصدار الأخير يُعد قفزة نوعية في مجال الذكاء الاصطناعي وطريقة تواصلنا مع الآلات. خصوصاً وأنه يعد نموذجاً لغوياً متعدد الوسائط Multi-Modal LLM، أي أنه يستطيع معالجة مختلف المعلومات كتحليل الصور والفيديوهات إلى جانب النصوص. وهذا يجعله مفيداً جداً لكافة المهن والوظائف. حتى أنه بدأ باحتلال سوق العمل ويهدد وظائف الملايين من البشر.
يعد هذا النموذج أقدر على فهم السياق واكتشاف الثغرات، وهذا يجعله أدق من سابقيه وأكثر قدرة على إعطاء إجابات صحيحة ومترابطة.
كما أن الحد الأقصى للكلمات المُدخَلَة ازداد بشكل ملحوظ من 3125 كلمة في GPT-3.5 إلى 25000 كلمة في GPT-4. وهذا يجعل الإصدار الجديد أقدر على إنشاء المحتوى الطويل وتذكر المحادثات السابقة والبحث في المستندات وغيرها.
تصريح لشركة OpenAI: “أمضينا أكثر من 6 أشهر لجعل GPT-4 أكثر أماناً. وهو الآن أقل احتمالاً للإجابة عن أسئلة المستخدمين التي يطلبون فيها معلومات ضارة أو خطرة بـ82%، وازداد احتمال إعطائه لأجوبة واقعية بـ40% بالمقارنة مع GPT-3.5.”
الفرق بين GPT-3.5 وGPT-4
1. القدرة على كتابة كود برمجي
وهي من الميزات التي لقيت اهتماماً كبيراً. إذ يستطيع GPT-4 كتابة قطع من الأكواد البرمجية وكذلك تصحيح الأخطاء الموجودة في كود ما بكفاءة أكبر بكثير من GPT-3.5، وهذا يجعله أداة هامة للمبرمجين. فمن خلال الاستعانة بـGPT-4 يمكن اختصار أسابيع من العمل في ساعات قليلة فقط، والحصول على نتائج ممتازة أيضاً.
جرّب مثلاً الأوامر التالية:
- I’m getting this error. Fix it.
- Now improve the performance.
- Now wrap it in a GUI.
2. جمع المعلومات وتركيبها بشكل مفهوم
يمكن لـGPT-4 الإجابة عن الأسئلة المعقدة من خلال تجميع المعلومات من مصادر متعددة وربطها بشكل متناسق ومفهوم، بينما كان GPT-3.5 يعاني من صعوبة في إنشاء جمل مترابطة وجمع المعلومات من أكثر من مصدر.
انظر مثلاً للمثال التالي حيث سُئل GPT-4 عن تأثير أعداد النحل في مجال الزراعة. ستلاحظ أن الإجابة شاملة ودقيقة، والمصادر التي استعان بها متنوعة وقد ذكرها في نهاية كل جملة.
وخاصية ذكر المصادر هذه التي يتميز بها GPT-4 تجعل من السهل على المستخدم التحقق من صحة المعلومات التي يُقدّمها.
3. الإبداع والترابط المنطقي للأفكار
يستطيع GPT-3.5 إنتاج نصوص إبداعية، ولكن GPT-4 يتفوق عليه في إمكانية إنتاج قصص وأشعار ومقالات، مع تحسّن في الترابط بين الأفكار.
فعلى سبيل المثال يمكن لـGPT-4 أن يؤلف قصة بحبكة جيدة وشخصيات قريبة من الواقع، على عكس GPT-3.5.
4. حل المشاكل المعقدة
يتفوق GPT-4 بأشواط على GPT-3.5 في مجال حل المعادلات الرياضية وفهم المبادئ العلمية، حيث يمكنه على سبيل المثال حل معادلات التفاضل والتكامل المعقدة، ويمكنه كذلك محاكاة التفاعلات الكيميائية بفعالية أكبر من GPT-3.5.
لا يقتصر ذلك على الرياضيات والكيمياء، بل يمكن لـGPT-4 فهم مواد أخرى مثل الفيزياء والبيولوجيا وعلوم الفضاء والتعامل معها. ويُعتَقَد أنه سيتوسع مستقبلاً ليشمل الكثير من المجالات الأخرى.
5. فهم الصور والرسوميات
يمكن لـGPT-4 فهم الصور بالإضافة للنصوص، بينما كان GPT-3.5 يعتمد على النصوص فقط كمُدخلات. وهكذا فإن GPT-4 يمكنه تحليل محتويات الصور والتعليق عليها.
من استخدامات هذه الميزة الطلب من GPT-4 توصيف صورة معينة لضعاف البصر ليتمكنوا من فهم محتوياتها، كما يمكنه تحليل الرسوم البيانية وفهمها. وكل ذلك يجعله مفيداً في مجالات التعليم وإنشاء المحتوى.
تخيّل أن تُدمج هكذا أداة بـGoogle Analytics، سيساعد هذا مطوري المواقع كثيراً على تحسين مواقعهم والحصول على المعلومات المفيدة من GA دون أي عناء.
6. البراعة اللغوية
على الرغم من أن GPT-3.5 يستطيع إنتاج إجابات تحاكي البشر، إلّا أن GPT-4 يتفوّق عليه خصوصاً في فهم اللهجات المختلفة واستخدام أساليب متنوّعة، بالإضافة لفهم المشاعر والتفاعل معها.
فعلى سبيل المثال يمكن لـGPT-4 أن يتعرّف على المشاعر التي تعبّر عنها في سؤالك، ومن ثم يجيب بما يتوافق مع الحزن أو الإحباط الذي تعبّر عنه في طرحك.
كما أنه تحسّن كثيراً في فهم اللهجات والأساليب المختلفة. لا شك أن اللغة العربية تعد من أغنى اللغات في لهجاتها، ولكن عند مقارنة GPT-3.5 بـGPT-4 فإنه يتفوق عليه كثيراً في فهم اللغة العربية، إلّا أنه لا يزال قاصراً بعض الشيء في فهم اللهجات العربية المختلفة.
7. التقليل من إعطاء ردود منحازة أو غير لائقة
أي أنه أقل احتمالاً من سابقه لإعطاء إجابات قد تكون جارحة أو مهينة للمستخدم، أو منحازة سياسياً أو دينياً، أو أي معلومات ضارة. وهذا ما يجعله أكثر أماناً وموثوقية من سابقه.
إن احتمال إعطاء GPT-4 إجابات ضارة يبلغ 0.73% مقارنةً بـ6.48% لـGPT-3.5
8. واقعية الإجابات
كان من أهم مشاكل GPT-3.5 هو أنه يعطي أحياناً إجابات غير منطقية أو واقعية، انظر على سبيل المثال للمحادثة التالية.
لا تزال تحدث مثل هكذا “هلوسات” في GPT-4 ولكن احتمال حدوث ذلك أقل بحوالي 40% من GPT-3.5.
9. سعة المحادثة
وهي تعني كمية البيانات التي يمكن للنموذج اللغوي الاحتفاظ بها في الذاكرة خلال جلسة واحدة ولمدة محددة.
يتفوّق GPT-4 بأشواط على GPT-3.5 من هذه الناحية، وهذا يجعله أقدر على تذكر محادثات وتعليمات أكثر ولمدة أطول من سابقه.
فعلى سبيل المثال إذا طلبت من GPT-3.5 أن يخاطبك باسمك فسيقوم بذلك لمدة محددة من المحادثة ثم يتوقف عن ذلك لأن سعة المحادثة عنده منخفضة، وهذا أقل حدوثاً في GPT-4 لأن السعة ازدادت من 4000 إلى 32000 Token (أي من حوالي 3150 إلى 25000 كلمة).
مما يتعلق بهذه الخاصية أيضاً محدودية حجم الأمر الذي يمكنك طلبه من GPT. فمثلاً إذا أردت منه تلخيص ملف PDF فقد تضطر لتقسيم الملف لعدة أجزاء صغيرة عند استخدام GPT-3.5، بينما يمكنك تزويد GPT-4 بملفات كبيرة دفعة واحدة.
على الرغم من تطوّر GPT كثيراً منذ إطلاقه لأول مرة في عام 2018، إلّا أنه بحاجة لكثير من التحسينات خصوصاً في مجال فهم المستخدم، وكذلك تمييز المعلومات الخاطئة التي يزوده بها، وبالطبع فإن تحسناً في سعة البيانات المُدخلة وسرعة الاستجابة ضرورية في كل جيل من أجيال النموذج اللغوي GPT.