تشهد سوق الذكاء الاصطناعي طفرة كبيرة في مستوى الاستدلال والإدراك لدى النماذج الذكية، بعد كشف "ديب سيك" DeepSeek عن نموذجها R1 الشهر الماضي، حيث أعلنت شركتا "تينسنت" Tencent، و"بايت دانس" ByteDance عن نماذجها المنافسة.

يأتي نموذج Tencent للاستدلال Hunyuan T1، لينافس نموذج DeepSeek-R1 من حيث الأداء والتكلفة، حيث يعتمد النموذج الجديد على التعلم المعزز واسع النطاق LSRL، وهو الأسلوب نفسه الذي استخدمته DeepSeek في نموذجها.

اختبرت Tencent نموذجها على متن روبوت الدردشة Yuanbao التابع للشركة، والذي حقق بدوره نتائج متميزة، إذ سجل 87.2 نقطة في اختبار Massive Multitask Language Understanding (MMLU) Pro، وهو مقياس يُستخدم لتقييم مدى معرفة النماذج اللغوية، متفوقاً على نتيجة 84 نقطة لدى نموذج DeepSeek-R1، لكنه لا يزال أقل من أداء نموذج o1، الذي أطلقته OpenAI في ديسمبر الماضي، وسجل 89.3 نقطة.

في اختبارات أخرى، سجل Hunyuan T1 نتائج مرتفعة، حيث حصل على 78.2 نقطة في اختبار AIME 2024 للرياضيات، مما يجعله قريباً من أداء DeepSeek-R1 الذي حقق 79.8 نقطة، وأيضاً نموذج o1 الذي سجل 79.2 نقطة.

وفي اختبار C-Eval الخاص بتقييم قدرات اللغة الصينية، تميّز النموذج بتحقيق 91.8 نقطة، وهو المستوى نفسه لـDeepSeek-R1، لكنه تفوق على نموذج o1 الذي سجل 87.8 نقطة.