-
Sky-T1
-
ฝึกโมเดล O1 Preview ด้วยเงิน 450 ดอลลาร์
- โมเดลอย่าง O1 และ Gemini 2.0 แสดงให้เห็นถึงความสามารถในการให้เหตุผลที่ยอดเยี่ยมในการแก้ปัญหาที่ซับซ้อน โดยอาศัยกระบวนการคิดภายในที่ยาวนาน
- อย่างไรก็ตาม การเข้าถึงรายละเอียดทางเทคนิคและค่าน้ำหนักของโมเดลยังทำไม่ได้ จึงกลายเป็นอุปสรรคต่อการมีส่วนร่วมของวงการวิชาการและชุมชนโอเพนซอร์ส
- เพื่อตอบสนองต่อเรื่องนี้ จึงมีความพยายามที่น่าสนใจหลายโครงการในการฝึกโมเดลให้เหตุผลแบบเปิดค่าน้ำหนักในสายคณิตศาสตร์ เช่น Still-2 และ Journey
- ทีม NovaSky จาก UC Berkeley กำลังสำรวจเทคนิคหลากหลายรูปแบบเพื่อพัฒนาความสามารถด้านการให้เหตุผลของทั้งโมเดลฐานและโมเดลที่ปรับจูนตามคำสั่ง
- งานวิจัยนี้บรรลุประสิทธิภาพด้านการให้เหตุผลที่แข่งขันได้ในทั้งคณิตศาสตร์และการเขียนโค้ดภายในโมเดลเดียวกัน
-
ผู้มีส่วนร่วม
- Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica
ยังไม่มีความคิดเห็น