• Sky-T1

  • ฝึกโมเดล O1 Preview ด้วยเงิน 450 ดอลลาร์

    • โมเดลอย่าง O1 และ Gemini 2.0 แสดงให้เห็นถึงความสามารถในการให้เหตุผลที่ยอดเยี่ยมในการแก้ปัญหาที่ซับซ้อน โดยอาศัยกระบวนการคิดภายในที่ยาวนาน
    • อย่างไรก็ตาม การเข้าถึงรายละเอียดทางเทคนิคและค่าน้ำหนักของโมเดลยังทำไม่ได้ จึงกลายเป็นอุปสรรคต่อการมีส่วนร่วมของวงการวิชาการและชุมชนโอเพนซอร์ส
    • เพื่อตอบสนองต่อเรื่องนี้ จึงมีความพยายามที่น่าสนใจหลายโครงการในการฝึกโมเดลให้เหตุผลแบบเปิดค่าน้ำหนักในสายคณิตศาสตร์ เช่น Still-2 และ Journey
    • ทีม NovaSky จาก UC Berkeley กำลังสำรวจเทคนิคหลากหลายรูปแบบเพื่อพัฒนาความสามารถด้านการให้เหตุผลของทั้งโมเดลฐานและโมเดลที่ปรับจูนตามคำสั่ง
    • งานวิจัยนี้บรรลุประสิทธิภาพด้านการให้เหตุผลที่แข่งขันได้ในทั้งคณิตศาสตร์และการเขียนโค้ดภายในโมเดลเดียวกัน
  • ผู้มีส่วนร่วม

    • Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น