تواجه نماذج الذكاء الاصطناعي الجديدة مثل o3 وo4-mini من OpenAI تحديات ملحوظة، تتمثل في ارتفاع معدلات “الهلاوس” أو تقديم معلومات مختلقة مقارنة بإصدارات سابقة. هذه النماذج، رغم تفوقها في مجالات منطقية وتحليلية مثل حل المشكلات الرياضية وكتابة الأكواد البرمجية، إلا أنها تظهر أداء متذبذبًا يشير إلى الحاجة الملحة لتحسين مستويات الدقة والمصداقية.
تحديات الهلاوس في النماذج الجديدة من OpenAI
الهلاوس تمثل عقبة كبيرة تواجه مجال الذكاء الاصطناعي، حيث تعني تزويد المستخدم بمعلومات غير حقيقية بشكل يبدو منطقيًا تمامًا، وهو ما لاحظه المستخدمون والباحثون في نموذجَي o3 وo4-mini. وفقًا لتقارير OpenAI الداخلية، سجل نموذج o3 نسبة هلاوس بلغت 33% عند اختباره في معيار “PersonQA” الذي يقيس دقة معرفة النموذج بالمعلومات عن الأشخاص، بينما وصل معدل الهلاوس في o4-mini إلى 48%. مقارنة بالنماذج القديمة مثل o1 وo3-mini، فإن هذا الارتفاع مثير للقلق، خاصة عندما يتعلق الأمر باستخدام الذكاء الاصطناعي في تطبيقات ذات حساسية مثل الطب أو القانون.
نتائج الاختبارات والتحديات الرئيسية
قد يهمك «فرصة محدودة» جدول قطارات القاهرة الإسكندرية اليوم الأربعاء 9-7-2025 وكيفية حجز مقعدك بسهولة
أظهرت النماذج الجديدة أداءً جيدًا في بعض المهام التي تتطلب تحليلاً معقدًا، مثل كتابة الشيفرات البرمجية، مما يجعلها منافسًا قويًا في السوق. لكن، في نفس الوقت، تسببت الهفوات التي تقدمها على شكل معلومات مختلقة في سؤال حول مدى إمكانية الاعتماد عليها. على سبيل المثال، وفقًا للباحثين في Transluce، اخترع نموذج o3 خطوات وهمية مثل “تشغيل كود على جهاز ماك بوك برو” رغم عدم توفر تلك الإمكانية تقنيًا. كما كشف كيان كتانفوروش من جامعة ستانفورد أن النماذج الجديدة تتفوق في الكفاءة، لكنها تعاني من توليد روابط غير موجودة، ما يؤثر سلبًا على الموثوقية.
حلول مقترحة وتقنيات مستقبلية
مقال مقترح «فرصة ذهبية» مواعيد قطارات القاهرة الإسكندرية اليوم 9 يوليو 2025 هل ما زالت التذاكر متوفرة
إحدى الحلول التي يمكن أن تحد من مشكلة الهلاوس هي تمكين النماذج من الوصول إلى الإنترنت، حيث أظهر نموذج GPT-4o، بفضل ميزة البحث عبر الشبكة، دقة وصلت إلى 90% في اختبارات عديدة. ومع ذلك، يبقى من الضروري تطوير تقنيات إضافية لتحسين الأداء دون التضحية بالدقة، حيث أن الارتفاع المستمر في قدرات التحليل والمنطق قد يؤدي إلى تزايد معدلات الهلاوس. وفقًا لما صرح به نيكو فيليكس، أحد متحدثي OpenAI، فإن الشركة تعمل بجدية على تحسين موثوقية النماذج وجعلها أكثر دقة في جميع السياقات.
العنوان | القيمة |
---|---|
نموذج o3 | معدل هلاوس 33% |
نموذج o4-mini | معدل هلاوس 48% |
دقة مع البحث | 90% |
تُظهر هذه النماذج إمكانات مثيرة للإعجاب، لكنها تحتاج إلى تحسينات كبيرة لتكون موثوقة في جميع المجالات. تحسين الذكاء الاصطناعي يُعد خطوة حيوية نحو تحقيق استخدام أوسع وأكثر فائدة في المستقبل.
سعر الذهب اليوم الأربعاء 7 مايو 2025 في مصر يشهد تغيرات جديدة
تحسن ملحوظ ليلاً.. توقعات الطقس ليوم الأحد 22 يونيو 2025
«فوز تاريخي» منتخب المكسيك يتوج بلقب الكأس الذهبية بعد مواجهة أمريكا المشوقة
«استقرار ملحوظ».. سعر الريال السعودي مقابل الجنيه المصري اليوم 26 أبريل 2025
«فرحة العيد» تهنئة عيد الأضحى 2025: رسائل تعزز التواصل والمحبة
تعرّف على سعر الذهب اليوم في مصر السبت 21 يونيو 2025
«فرصة مذهلة» العطلة الربيعية 2025 بالمغرب للاستمتاع بجو خلاب ومعية الأحباء
ظهرت الآن نتائج السادس الابتدائي 2025 الدور الأول في العراق مع الرابط الرسمي للاستعلام