نتائج البحث عن "EVAL"
07:22

سيتم قياس الإصدار التالي من نموذج Yuntian Tianshu مقابل GPT4.0 لزيادة تحسين القدرات متعددة الوسائط

قال Yuntian Lifei مؤخرا في استطلاع مؤسسي أن نموذج الشركة الكبير الذي تم تطويره ذاتيا على مستوى 100 مليار - نموذج Yuntianshu الكبير قد أكمل تحديثات إصدار 2 ، وتم تحسين قدراته الشاملة بشكل أكبر ، ليصل إلى المستوى المتقدم في الصناعة بشكل عام الإجابة على الأسئلة ، وفهم اللغة ، والتفكير الرياضي ، وتوليد النص ، ولعب الأدوار ، وما إلى ذلك ؛ في قائمة النماذج الصينية الكبيرة C-Eval في أوائل سبتمبر من هذا العام ، احتل نموذج Yuntiantianshu الكبير المرتبة الأولى في القائمة ؛ الإصدار التالي من نموذج Yuntiantianshu الكبير سيقارن مع GPT4.0 لزيادة تحسين القدرات متعددة الوسائط.
المزيد
  • 1
03:31

النماذج "جديدة كل يوم": الأداء الشامل لـ SenseTime "SenseChat 2.0" وفقًا لمعايير التقييم المتعددة يتجاوز أداء ChatGPT

أعلنت SenseTime مؤخرًا عن نتائج نموذج اللغة الصينية المطور ذاتيًا "SenseChat 2.0" على ثلاثة معايير موثوقة لتقييم نماذج اللغة الكبيرة: MMLU، وAGIEval، وC-Eval. وفقًا لنتائج التقييم، تفوق "Discuss SenseChat 2.0" على ChatGPT في مجموعات الاختبار الثلاثة، مما حقق تقدمًا مهمًا في البحث عن نماذج اللغات الكبيرة في بلدي.
المزيد
تحميل المزيد