Guanaco - การแข่งขันปรับจูน LLM มูลค่า $1M (130 ล้านวอน)

xguru · 2023-05-11T10:03:02+09:00

ความท้าทายแบบโอเพนคอมมูนิตี้ครั้งแรกของโลกที่ผู้ใช้เป็นผู้ประเมินเมื่ออัปโหลดโมเดล ซีซัน 1 ตอนที่ 1 เริ่มในวันที่ 10 มิถุนายน และมีเงินรางวัล $250k ตลอด 12 สัปดาห์ รูปแบบการแข่งขัน เปิดซอร์ส Chai Reward Model (GPT-2) ที่ฝึกโดยตรงจากสัญญาณที่ผู้ใช้สร้างขึ้น 170 ล้านรายการ สามารถใช้โมเดลนี้สำหรับการประเมินแบบออฟไลน์ หรือผนวกรวมเป็นส่วนหนึ่งของไปป์ไลน์ RLHF ได้ เนื่องจากการฝึก language model มีค่าใช้จ่ายสูง จึงมีแผนทดลองใช้โมเดลพื้นฐานหลายแบบเพื่อให้ทุกคนเข้าร่วมการแข่งขันได้ สำหรับโมเดลที่อัปโหลด จะตรวจสอบว่าสามารถนำไปเผยแพร่ได้หรือไม่ด้วย AI Safety Classifier ภายใน และเปิดให้ใช้งานสำหรับการทดสอบ A/B กับผู้ใช้ มีผู้ใช้จริงมากกว่าประมาณ 1 ล้านคนเป็นผู้ประเมิน

(chai-research.com)

6 คะแนน โดย xguru 2023-05-11 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ความท้าทายแบบโอเพนคอมมูนิตี้ครั้งแรกของโลกที่ผู้ใช้เป็นผู้ประเมินเมื่ออัปโหลดโมเดล
ซีซัน 1 ตอนที่ 1 เริ่มในวันที่ 10 มิถุนายน และมีเงินรางวัล $250k ตลอด 12 สัปดาห์
รูปแบบการแข่งขัน
- เปิดซอร์ส Chai Reward Model (GPT-2) ที่ฝึกโดยตรงจากสัญญาณที่ผู้ใช้สร้างขึ้น 170 ล้านรายการ
- สามารถใช้โมเดลนี้สำหรับการประเมินแบบออฟไลน์ หรือผนวกรวมเป็นส่วนหนึ่งของไปป์ไลน์ RLHF ได้
- เนื่องจากการฝึก language model มีค่าใช้จ่ายสูง จึงมีแผนทดลองใช้โมเดลพื้นฐานหลายแบบเพื่อให้ทุกคนเข้าร่วมการแข่งขันได้
- สำหรับโมเดลที่อัปโหลด จะตรวจสอบว่าสามารถนำไปเผยแพร่ได้หรือไม่ด้วย AI Safety Classifier ภายใน และเปิดให้ใช้งานสำหรับการทดสอบ A/B กับผู้ใช้
- มีผู้ใช้จริงมากกว่าประมาณ 1 ล้านคนเป็นผู้ประเมิน

1 ความคิดเห็น

xguru 2023-05-11

ภาพลามะที่เหมือนซูเปอร์ไซย่าผสานร่างกันนั้นน่าประทับใจมาก

Guanaco - การแข่งขันปรับจูน LLM มูลค่า $1M (130 ล้านวอน)

บทความที่เกี่ยวข้อง

1 ความคิดเห็น