وجدت دراسة أن برنامج الدردشة ChatGPT تفوق على الأطباء عند تقييم تاريخ الحالات الطبية، حتى عندما كان هؤلاء الأطباء يستخدمون روبوت الدردشة.

في إحدى التجارب، كان أداء الأطباء الذين تم إعطاؤهم برنامج ChatGPT لتشخيص المرض أفضل قليلاً من الأطباء الذين لم يستخدموه. لكن برنامج الدردشة وحده تفوق على جميع الأطباء. 

وحسب صحيفة "نيويورك تايمز" الأميركية فقد كان الدكتور آدم رودمان، الخبير في الطب الباطني في مركز بيث إسرائيل ديكونيس الطبي في بوسطن، يتوقع بثقة أن روبوتات الدردشة المصممة لاستخدام الذكاء الاصطناعي ستساعد الأطباء في تشخيص الأمراض، لكن ثبت أنه كان مخطئاً.

وكشفت دراسة ساعد الدكتور رودمان في تصميمها، أن أداء الأطباء الذين تم إعطاؤهم برنامج ChatGPT-4  إلى جانب الموارد التقليدية؛ كان أفضل قليلاً من الأطباء الذين لم يكن لديهم إمكانية الوصول إلى الروبوت، فيما تفوق برنامج ChatGPT وحده على الأطباء، ما جعل رودمان يعرب عن صدمته من النتائج.

الذكاء الاصطناعي وتشخيص الأمراض

حصل برنامج الدردشة الآلي من شركة OpenAI على متوسط ​​درجات بلغ 90% عند تشخيص حالة طبية من تقرير حالة وشرح أسبابها.

وحصل الأطباء الذين تم اختيارهم عشوائياً لاستخدام برنامج الدردشة الآلي على متوسط ​​درجات بلغ 76%، أما أولئك الذين تم اختيارهم عشوائياً لعدم استخدامه فقد حصلوا على متوسط ​​درجات بلغ 74%.

كشفت الدراسة عن اقتناع الأطباء الثابت أحياناً بالتشخيص الذي توصلوا إليه، حتى عندما يقترح برنامج الدردشة الآلي تشخيصاً أفضل.

وأوضحت الدراسة أنه في حين يتعرض الأطباء لأدوات الذكاء الاصطناعي في عملهم، فإن قِلة من الناس يعرفون كيفية استغلال قدرات برامج الدردشة الآلي، ونتيجة لذلك، فشلوا في الاستفادة من قدرة أنظمة الذكاء الاصطناعي على حل المشكلات التشخيصية المعقدة وتقديم تفسيرات لتشخيصاتهم.