GPT-5: ثورة أم تراجع؟ تقييم شامل لقدرات الذكاء الاصطناعي في البرمجة والتطوير
مدونة العالم الافتراضي: دليلك الشامل لاستكشاف أحدث تقنيات الذكاء الاصطناعي، تطبيقات الذكاء الاصطناعي، وتحليل أدائها بدقة واحترافية.
تحليل حصري من فريق مدونة العالم الافتراضي | أحدث التحديثات لعام 2025
3 نقاط يجب تذكرها حول قدرات GPT-5 في البرمجة
- ❌ فشل منتج OpenAI الجديد المتميز GPT-5 في نصف اختبارات البرمجة لدي.
- ✅ لقد حققت إصدارات OpenAI السابقة نتائج تقريباً مثالية.
- 🔄 الآن بعد أن أعدّلت OpenAI إمكانيات التفويض إلى LLM أخرى، هناك خيارات للابتعاد عن GPT-5.
GPT-5 هي هنا. لقد خرج. تم نشرها. إنها الموضوع الأكثر تداولاً حالياً. وقد يوجد لديها بعض المشاكل. فشل GPT-5 في نصف اختبارات البرمجة الخاصة بي. إنه الأسوأ نتيجة تم الحصول عليها على الإطلاق من قبل أبرز نماذج LLM في OpenAI.
قبل الغوص في التفاصيل، دعنا نأخذ لحظة لمناقشة ميزة صغيرة أخرى وهي غريبة قليلاً. انظر إلى الزر الجديد لتعديل في أعلى قوائم الكود التي يولدها.
لقطة شاشة بواسطة مدونة العالم الافتراضي
عند الضغط على زر "تعديل"، تصل إلى محرر شفرة صغير. هنا، قمت بتعديل حقل المؤلف، مباشرةً في نتائج ChatGPT.
لقطة شاشة بواسطة مدونة العالم الافتراضي
كان يبدو جيدًا، ولكن تبين أنه سؤال غير ملموس في النهاية. عندما أغلق المحرر، سألني إذا كنت تريد حفظ التغييرات. قمت بذلك. وفي ذلك الوقت، ظهر هذا الرسالة غير المفيدة.
لقطة شاشة بواسطة مدونة العالم الافتراضي
لم أعد أعود إلى جلستي الأولية. كان علي تقديم طلبي الأول مرة أخرى وترك GPT-5 يقوم بعمله مرة أخرى.
لكن توقفوا. هذا ليس كل شيء. دعونا نلقي نظرة على نتائج اختباري...
1. كتابة وحدة تحميل لـ WordPress
هذا كان أول اختبار برمجي لي مع ذكاء اصطناعي. كان هذا ما أعطاني شعورًا أوليًا بأن "العالم على وشك التغير"، وقد تم تنفيذه في البداية باستخدام GPT-3.5.
الاختبارات التالية، باستخدام نفس النص المقدم ولكن مع نماذج ذكاء اصطناعي مختلفة، أعطت نتائج متفاوتة. بعض الذكاء الاصطناعي كانوا يتصرفون بشكل جيد، وبعضهم الآخر لا. بعض الذكاء الاصطناعي، مثل ذكاء اصطناعي مايكروسوفت وغوغل، تحسنوا مع الوقت.
النموذج الخاص بـ ChatGPT كان المعيار الذهبي لهذا الاختبار منذ البداية. لذا، فإن نتائج GPT-5 أكثر إثارة للإعجاب بشكل أكبر.
تم الترميز الخاص بـ GPT-5 بالكامل. قام GPT-5 بإنشاء قطعة واحدة من الكود، والتي لصقتها في ملف وتمكنت من تشغيلها. قدمت واجهة المستخدم المطلوبة.
عندما لصقت أسماء الاختبارات، قام بتحديث عدد الأسطر ديناميكيًا، على الرغم من أنه وصفه بـ "السطر لتعيينه عشوائيًا" بدلاً من "الأسطر لتعيينها عشوائيًا".
لقطة شاشة بواسطة مدونة العالم الافتراضي
لكن عندما قمت بالنقر على Randomize، لم يتم تنفيذ الأمر. بدلاً من ذلك، قام بتوجيهي إلى tools.php. لم يواجه ChatGPT أي مشكلة في هذا الاختبار، سواء كان الأمر يتعلق بـ GPT-3.5، أو GPT-4، أو GPT-4o. هل فشل GPT-5 المتوقع بشدة من OpenAI من البداية؟ هذا أمر محبط.
عندما أقوم بالنقر على randomize، أتم توجيهي إلى http://testsite.local/wp-admin/tools.php. لا أحصل على قائمة بالنتائج المتبادلة. هل يمكنك تصحيح ذلك؟
كان النتيجة خطًا يحتاج إلى تعديل. هذه الطريقة لا تثير إعجابي لأنها تجبر المستخدم على البحث في الكود وعدم إرتكاب خطأ عند استبدال خط.
لقطة شاشة بواسطة مدونة العالم الافتراضي
لذا سألت GPT-5 عن وحدة تحكم كاملة. أعطاني النص الكامل للوحدة التي يمكنني نسخها ولصقها. هذه المرة، نجحت.
لقطة شاشة بواسطة مدونة العالم الافتراضي
هذه المرة، قام بإعادة ترتيب الأسطر بشكل جيد. عندما واجه تكرارات، فصل بينهم، وفقاً لتوجيهاته. في النهاية.
آسف، OpenAI. يجب أن أمنح درجة سلبية لهذا الاختبار. لكنك لست قد نجحت حتى لو كانت الأخطاء الوحيدة هي عدم استخدام جمع "السطر" عندما كان ذلك ضرورياً. لكن الأمر الذي فشل فيه هو أن قدم لي وحدة برمجية لم تعمل من المحاولة الأولى. وحتى لو أتمت الذكاء الاصطناعي العمل بها في المحاولة الثانية.
بغض النظر عن الطريقة التي نفسر بها، فإنه يشكل تراجعاً في الأداء مقارنة بالـ LLM الآخرين.
2. تعديل دالة سلسلة من الأحرف
هذا الاختبار الثاني مصمم لتحسين دالة سلسلة من الأحرف لتدقيق الدولارات والسنتات بشكل أفضل. كان الكود الأصلي الذي طلبناه من GPT-5 تعديله لا يسمح بالسنتات (فإنه فقط تدقيق الأعداد الصحيحة).
GPT-5 نجح في هذا الاختبار جيدًا. قدم نتيجة بسيطة لأنه لم يتحقق من الأخطاء. لم يتحقق من وجود مدخلات أخرى غير سلاسل حروف، أو مسافات بيضاء إضافية، أو أرقام ميلية، أو رموز مالية.
لكن هذا ليس ما طلبت منه. طلبت منه أن يكتب دالة مرة أخرى، والتي لم تكن تحتوي على أي تحقق من الأخطاء. قام GPT-5 بفعل ما طلبت منه بدقة، بدون أي إضافة غير ضرورية. وأنا راضٍ عن ذلك، لأنه لا يعرف ما إذا كان الكود السابق لهذه الدالة قد قام بهذا العمل بالفعل.
نجح GPT-5 في هذا الاختبار.
3. إيجاد خطأ مزعج
هذا الاختبار ظهر لأنني كنت أتعامل مع خطأ غير واضح في كودي. بدون الدخول في تفاصيل كيفية عمل إطار العمل WordPress، الإجابة الواضحة ليست الصحيحة.
تحتاج إلى معرفة غامضة نسبيًا حول كيفية نقل معلومات مرشحات ووردبريس. كان هذا الاختبار عقبة أمام أكثر من LLM في مجال الذكاء الاصطناعي.
ومع ذلك، كان GPT-5 قد فهم المشكلة، كما فهم GPT-4 و GPT-4o قبل ذلك. لقد وضع حلًا واضحًا.
نجح TPG-5 في هذا الاختبار.
4. كتابة سكريبت
هذا الاختبار يطلب من الذكاء الاصطناعي دمج أداة كتابة Mac غامضة نسبياً تُدعى Keyboard Maestro، بالإضافة إلى لغة الكتابة الخاصة بآبل، AppleScript، والسلوكيات الخاصة بالكتابة في كروم.
في الواقع، يُشكل هذا اختبارًا لتغطية الذكاء الاصطناعي من حيث المعرفة، وفهمه لبناء الصفحات الويب، وقدرته على كتابة الكود في ثلاث بيئات متصلة.
عدة أتمتة ذكية فشلت في هذا الاختبار، ولكن سبب الفشل عادةً هو نقص معرفة بـ Keyboard Maestro. GPT-3.5 لم تكن تعرف Keyboard Maestro. لكن ChatGPT نجحت في هذا الاختبار منذ GPT-4. حتى الآن.
من أين تبدأ؟ الأخبار الجيدة هي أن GPT-5 قد أدارت بشكل جيد جزء Keyboard Maestro من المشكلة. لكنها ارتكبت خطأ في الكود بسبب نقص فهمها لآلية التراكيب في AppleScript.
لقطة شاشة بواسطة مدونة العالم الافتراضي
في الحقيقة، اخترع شيئًا ما. إنه واحد من الحالات، حيث تقدم ذكاءً اصطناعيًا باطمئنان على إجابة تكون بالكامل خاطئة.
AppleScript هي نaturally case-insensitive. إذا أردت أن AppleScript يهتم بالكasing، يجب عليك استخدام مربع "مع مراعاة الكasing". هذا ما حدث.
لقطة شاشة بواسطة مدونة العالم الافتراضي
السبب في أن رسالة الخطأ تذكر عنوان أحد مقالاتي هو لأنها كانت النافذة الرئيسية في كروم. هذه الوظيفة تتحقق من النافذة قبل ذلك وتقوم بأشياء بناءً على العنوان.
لقطة شاشة بواسطة مدونة العالم الافتراضي
لكن عدم فهم آلية الترتيب الأحرف لم يكن السبب الوحيد للأخطاء التي أحدثتها GPT-5 في AppleScript. كما أنها أشارت إلى متغير يسمى searchTerm دون تعريفه. وهذا يعتبر ممارسة تسبّب أخطاء في أي لغة برمجة.
ردود فعل المستخدمين: غضب واسع وعودة GPT-4o
رغم التوقعات العالية، شهد إطلاق GPT-5 رد فعل سلبياً من قبل قاعدة واسعة من المستخدمين. تم الإبلاغ عن ثلاثة أسباب رئيسية للإحباط:
- إزالة خيار اختيار النموذج: لم يعد بإمكان المستخدمين اختيار GPT-4o أو GPT-4.5، حيث أصبح النظام يفرض GPT-5 تلقائيًا.
- قيود استخدام صارمة: تم تحديد عدد الرسائل بـ 80 رسالة كل 3 ساعات للمستخدمين المميزين، مما أثر على سير العمل.
- انخفاض ملحوظ في الأداء: أفاد العديد من المطورين أن GPT-5 أقل دقة من سابقه، حتى في مهام بسيطة مثل العد أو كتابة الأسماء.
استجابة لهذا الغضب، أعلنت OpenAI عبر منصات مثل Reddit عن عودة "الأنماط القديمة"، حيث يمكن للمستخدمين الآن تفعيل خيار عرض الأنماط القديمة من إعدادات ChatGPT واستخدام GPT-4o مرة أخرى، خاصة للمشتركين المميزين.
جدول مقارنة بين GPT-5 و GPT-4o
المعيار | GPT-5 | GPT-4o |
---|---|---|
نافذة السياق | 256K tokens | 200K tokens |
السعر (الإدخال) | 1.25$ / مليون token | 1.50$ / مليون token |
السعر (الإخراج) | 10$ / مليون token | 12$ / مليون token |
القدرة على التفكير العميق | متوفر (GPT-5 Thinking) | متوفر |
الدقة في البرمجة | متوسطة إلى منخفضة | عالية |
التفاعل والطبيعة الإنسانية | بارد وسردي | طبيعي وودود |
الأسئلة الشائعة (FAQ)
هل يمكنني استخدام GPT-4o بعد إطلاق GPT-5؟
نعم، بعد الضغط الكبير من المستخدمين، أعادت OpenAI خيار استخدام GPT-4o. يمكنك تفعيل "الأنماط القديمة" من إعدادات ChatGPT واختيار النموذج الذي تريده.
هل GPT-5 أرخص من GPT-4o؟
نعم، GPT-5 أرخص بنسبة 16.7% في الإدخال و16.7% في الإخراج، مع دعم تقنية التخزين المؤقت بنسبة 90%.
ما هي الميزات الجديدة في GPT-5؟
تشمل الميزات الجديدة: نافذة سياق أوسع (256K)، تحكم في مستوى التفكير، دعم تعدد الوسائط، تقليل الهلوسة، وتحسين التفاعل مع الأدوات الخارجية.
هل GPT-5 مناسب للمطورين؟
رغم الوعود، أظهر GPT-5 أداءً غير متسق في مهام البرمجة المعقدة. يُنصح باستخدام GPT-4o لمهام تطوير دقيقة حتى يتم تحسين GPT-5.
ليست هناك تعليقات:
إرسال تعليق
اترك لنا تعليق أسفله و شكرا على مساهمتكم