- ความท้าทายแบบโอเพนคอมมูนิตี้ครั้งแรกของโลกที่ผู้ใช้เป็นผู้ประเมินเมื่ออัปโหลดโมเดล
- ซีซัน 1 ตอนที่ 1 เริ่มในวันที่ 10 มิถุนายน และมีเงินรางวัล $250k ตลอด 12 สัปดาห์
- รูปแบบการแข่งขัน
- เปิดซอร์ส Chai Reward Model (GPT-2) ที่ฝึกโดยตรงจากสัญญาณที่ผู้ใช้สร้างขึ้น 170 ล้านรายการ
- สามารถใช้โมเดลนี้สำหรับการประเมินแบบออฟไลน์ หรือผนวกรวมเป็นส่วนหนึ่งของไปป์ไลน์ RLHF ได้
- เนื่องจากการฝึก language model มีค่าใช้จ่ายสูง จึงมีแผนทดลองใช้โมเดลพื้นฐานหลายแบบเพื่อให้ทุกคนเข้าร่วมการแข่งขันได้
- สำหรับโมเดลที่อัปโหลด จะตรวจสอบว่าสามารถนำไปเผยแพร่ได้หรือไม่ด้วย AI Safety Classifier ภายใน และเปิดให้ใช้งานสำหรับการทดสอบ A/B กับผู้ใช้
- มีผู้ใช้จริงมากกว่าประมาณ 1 ล้านคนเป็นผู้ประเมิน
1 ความคิดเห็น
ภาพลามะที่เหมือนซูเปอร์ไซย่าผสานร่างกันนั้นน่าประทับใจมาก