مالكة تيك توك وTencent تنافسان DeepSeek بنماذج جديدة

تشهد سوق الذكاء الاصطناعي طفرة كبيرة في مستوى الاستدلال والإدراك لدى النماذج الذكية، بعد كشف "ديب سيك" DeepSeek عن نموذجها R1 الشهر الماضي، حيث أعلنت شركتا "تينسنت" Tencent، و"بايت دانس" ByteDance عن نماذجها المنافسة.

يأتي نموذج Tencent للاستدلال Hunyuan T1، لينافس نموذج DeepSeek-R1 من حيث الأداء والتكلفة، حيث يعتمد النموذج الجديد على التعلم المعزز واسع النطاق LSRL، وهو الأسلوب نفسه الذي استخدمته DeepSeek في نموذجها.

اختبرت Tencent نموذجها على متن روبوت الدردشة Yuanbao التابع للشركة، والذي حقق بدوره نتائج متميزة، إذ سجل 87.2 نقطة في اختبار Massive Multitask Language Understanding (MMLU) Pro، وهو مقياس يُستخدم لتقييم مدى معرفة النماذج اللغوية، متفوقاً على نتيجة 84 نقطة لدى نموذج DeepSeek-R1، لكنه لا يزال أقل من أداء نموذج o1، الذي أطلقته OpenAI في ديسمبر الماضي، وسجل 89.3 نقطة.

في اختبارات أخرى، سجل Hunyuan T1 نتائج مرتفعة، حيث حصل على 78.2 نقطة في اختبار AIME 2024 للرياضيات، مما يجعله قريباً من أداء DeepSeek-R1 الذي حقق 79.8 نقطة، وأيضاً نموذج o1 الذي سجل 79.2 نقطة.

وفي اختبار C-Eval الخاص بتقييم قدرات اللغة الصينية، تميّز النموذج بتحقيق 91.8 نقطة، وهو المستوى نفسه لـDeepSeek-R1، لكنه تفوق على نموذج o1 الذي سجل 87.8 نقطة.

ومن حيث التسعير، يتبع Hunyuan T1 نهجاً مماثلاً لـDeepSeek-R1، حيث تبلغ تكلفة إدخال البيانات 1 يوان صيني لكل مليون رمز، وهو المعدل نفسه الذي تتبعه DeepSeek-R1 خلال النهار، لكنه أقل من التسعيرة المخفضة خلال الليل، والتي تبلغ 0.25 يوان لكل مليون رمز.

أما تكلفة الحصول على مخرجات بيانية، فتبلغ 4 يوانات لكل مليون رمز، مما يجعله أقل من السعر النهاري لـDeepSeek-R1 الذي يصل إلى 16 يوان لكل مليون رمز، ولكن كليهما لديه السعر نفسه خلال الاستخدام الليلي.

أداء قوي بأسلوب هجين

من الناحية التقنية، أكدت Tencent أن Hunyuan T1 هو أول نموذج في الصناعة يعتمد على هيكلية هجينة تجمع بين Transformer، التي طورتها جوجل، وMamba، التي تم تطويرها من قِبَل جامعتي كارنيجي ميلون وبرينستون.

ووفقاً للشركة، يساهم هذا النهج الهجين في تقليل تكاليف التدريب والاستخدام، حيث يعمل على خفض استهلاك الذاكرة مقارنة بالنماذج التي تعتمد على Transformer فقط، مما يعزز من كفاءة المعالجة، ويوفر تكاليف التشغيل.

نموذج DAPO

في تطور آخر لمنافسة DeepSeek، كشفت شركة "بايت دانس"، المالكة لتطبيق "تيك توك"، عن نظام ذكاء اصطناعي جديد يُحسّن من قدرات نماذج الاستدلال، يُعرف باسم تقنية DAPO، وهو اختصار لـDecoupled Clip and Dynamic Sampling Policy Optimisation.

وتعتمد هذه الخوارزمية على التعلم المعزز القابل للتوسع، وهي مصممة لمساعدة النماذج اللغوية الكبيرة على تطوير مهاراتها على الإدراك والتفكير المعقد من خلال تحسين آليات التحقق الذاتي من المعلومات المدخلة والتكرار التلقائي لتنقيح تلك المعلومات، للخروج بأفضل مستوى إدراك للمطلوب منها، قبل تقديم المعلومات المطلوبة للإجابة عن استفسارات المستخدم.

وطُورت هذه التقنية بالتعاون مع معهد بحوث صناعة الذكاء الاصطناعي في جامعة تسينجهوا، ونُشرت تفاصيلها في ورقة بحثية حديثة.

وأظهرت نتائج الاختبار أن DAPO تفوقت على تقنية Group Relative Policy Optimisation (GRPO)، التي تستخدمها DeepSeek في تدريب نماذجها.

وفي اختبار AIME 2024 للرياضيات، عندما تم تطبيق DAPO على نموذج Qwen2.5-32B، الذي طورته شركة "علي بابا" Alibaba، سجلت الخوارزمية 50 نقطة، مقارنةً بـ47 نقطة حققتها DeepSeek-R1 عند استخدام النموذج نفسه.

ومن بين الميزات الرئيسية التي قدمتها تقنية DAPO، تقليل عدد خطوات التدريب بنسبة 50%، ما يجعلها أكثر كفاءة وأقل استهلاكاً للقوة الحوسبية، ويسهم ذلك في التعزيز من إمكانية استخدامها على نطاق أوسع، حيث يمكن للنماذج التي تعتمد على هذه الخوارزمية تقديم أداء أعلى بتكلفة تدريب أقل.

ولقي هذا الابتكار استحساناً واسعاً داخل الأوساط الأكاديمية والصناعية، إذ قال المهندس في Google DeepMind فيليب شميد، إن هذه الخوارزمية تُعتبر "أفضل من نهج GRPO المستخدم في DeepSeek"، ما يعكس مدى تأثيرها المحتمل في تحسين أداء نماذج الذكاء الاصطناعي.

وتشير هذه التطورات إلى التنافس الشديد بين شركات التكنولوجيا الصينية في مجال الذكاء الاصطناعي، حيث تتخذ كل من Tencent، وByteDance خطوات جريئة لمنافسة الشركات الرائدة عالمياً مثل DeepSeek، وذلك من خلال تقديم نماذج جديدة بأسعار تنافسية وتحسين أداء التعلم المعزز، تواصل الشركات الصينية تعزيز حضورها في هذا القطاع المتنامي بسرعة.

وتهدف هذه الشركات إلى تقليل التكاليف التشغيلية وتعزيز كفاءة نماذجها، مما يمنحها ميزة تنافسية كبيرة.

كما أن التطورات المستمرة في البنية التحتية والتكنولوجيا المستخدمة في هذه النماذج تعزز من مكانة الصين كمنافس رئيسي في سوق الذكاء الاصطناعي العالمي، التي تهيمن عليها حالياً شركات مثل OpenAI، وجوجل، وDeepMind.

العلامات:

مالكة تيك توك وTencent تنافسان DeepSeek بنماذج جديدة

أداء قوي بأسلوب هجين

نموذج DAPO

وثيقة: ميتا درست فصل إنستجرام تحسباً لتحقيق محتمل بشأن ...

تقرير: OpenAI تعمل على إنشاء منصة على غرار "إكس"