كشفت دراسة حديثة أجراها باحثون من كلية الطب بجامعة هارفارد وجامعةستانفورد، أن نموذج الذكاء الاصطناعي “شات جي بي تي o1“ من شركة “أوبن إيه آي”(OpenAI) قد يتفوق على الأطباء في تشخيص الحالات الطبية المعقدة.
وخضع النموذج خلال الدراسة لسلسلة شاملة من اختبارات التشخيص الطبي،وأظهرت النتائج أنه حقق قفزات نوعية مقارنة بالإصدارات السابقة، فقد تمكن نموذج“بريفيو-01“ (o1-preview) من تشخيص 78.3% من الحالات التي حللت بدقة.
وفي مقارنة مباشرة شملت 70 حالة محددة، ارتفعت دقة النظام إلى 88.6%، متفوقابفارق كبير على نظام “جي بي تي-4“ (GPT-4) السابق الذي سجل نسبة قدرها72.9%. وأثبت النظام كفاءته العالية في مجال الاستدلال (التفكير) الطبي، إذ حصلعلى درجات عالية في 78 من أصل 80 حالة وفق مقياس “آر–آي دي إي إيه” (R-IDEA)المستخدم لتقييم جودة الاستدلال.
وأشار الباحثون إلى احتمال تضمن بيانات التدريب الخاصة بالنموذج بعض الحالاتالمستخدمة في الدراسة، لكن أداء النموذج ظل مرتفعا عند اختباره على حالات جديدةلم يسبق أن تعامل معها، مع انخفاض طفيف في الأداء.
وأوضح الباحثون أن إجابات النموذج التفصيلية قد أسهمت في رفع تقييمه، مؤكدين أنالدراسة اقتصرت على أدائه منفردا من دون دراسة كيفية تعاونه مع الأطباء.
ويظهر نموذج “بريفيو-01“ تفوقا في مهام التفكير النقدي، مثل التشخيص وتقديمالتوصيات العلاجية، لكنه يواجه صعوبات في المهام التجريدية، كتقدير الاحتمالات.
وكانت شركة “أوبن إيه آي” قد أعلنت حديثا إطلاق الإصدار الكامل النهائي “أو 1“ (o1)،بالإضافة إلى الإصدار الجديد “أو 3“ الذي أظهر تحسينات كبيرة في التفكير التحليلي.