6 คะแนน โดย xguru 2023-05-11 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ความท้าทายแบบโอเพนคอมมูนิตี้ครั้งแรกของโลกที่ผู้ใช้เป็นผู้ประเมินเมื่ออัปโหลดโมเดล
  • ซีซัน 1 ตอนที่ 1 เริ่มในวันที่ 10 มิถุนายน และมีเงินรางวัล $250k ตลอด 12 สัปดาห์
  • รูปแบบการแข่งขัน
    • เปิดซอร์ส Chai Reward Model (GPT-2) ที่ฝึกโดยตรงจากสัญญาณที่ผู้ใช้สร้างขึ้น 170 ล้านรายการ
    • สามารถใช้โมเดลนี้สำหรับการประเมินแบบออฟไลน์ หรือผนวกรวมเป็นส่วนหนึ่งของไปป์ไลน์ RLHF ได้
    • เนื่องจากการฝึก language model มีค่าใช้จ่ายสูง จึงมีแผนทดลองใช้โมเดลพื้นฐานหลายแบบเพื่อให้ทุกคนเข้าร่วมการแข่งขันได้
    • สำหรับโมเดลที่อัปโหลด จะตรวจสอบว่าสามารถนำไปเผยแพร่ได้หรือไม่ด้วย AI Safety Classifier ภายใน และเปิดให้ใช้งานสำหรับการทดสอบ A/B กับผู้ใช้
    • มีผู้ใช้จริงมากกว่าประมาณ 1 ล้านคนเป็นผู้ประเมิน

1 ความคิดเห็น

 
xguru 2023-05-11

ภาพลามะที่เหมือนซูเปอร์ไซย่าผสานร่างกันนั้นน่าประทับใจมาก