Llama 2 Chat 70B เหนือกว่า ChatGPT (3.5) ในการประเมินโมเดล

xguru · 2023-07-31T10:17:01+09:00

อ้างอิงจาก AlpacaEval Leaderboard ซึ่งเป็นเกณฑ์สำหรับประเมินโมเดลภาษาแบบ Instruction-Following โดยอัตโนมัติ GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37% AlpacaEval ดำเนินการประเมินอัตโนมัติโดยใช้ชุดประเมินของ AlpacaFarm และเปรียบเทียบกับคำตอบที่ GPT-4 ตอบไว้

(tatsu-lab.github.io)

10 คะแนน โดย xguru 2023-07-31 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

อ้างอิงจาก AlpacaEval Leaderboard ซึ่งเป็นเกณฑ์สำหรับประเมินโมเดลภาษาแบบ Instruction-Following โดยอัตโนมัติ
GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37%
AlpacaEval ดำเนินการประเมินอัตโนมัติโดยใช้ชุดประเมินของ AlpacaFarm และเปรียบเทียบกับคำตอบที่ GPT-4 ตอบไว้

Llama 2 Chat 70B เหนือกว่า ChatGPT (3.5) ในการประเมินโมเดล

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น