9 คะแนน โดย xguru 2022-12-10 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เปิดตัวแบบเงียบ ๆ ผ่านคอมมิตบน GitHub
  • ผ่านการฝึกด้วยจำนวน Epochs* มากขึ้นพร้อมการทำ normalization และแสดงประสิทธิภาพที่ดีขึ้นเมื่อเทียบกับโมเดลก่อนหน้า
  • ใช้สถาปัตยกรรมเดิมเหมือนเดิม
  • เมื่อเรียก load_model("large") จะโหลดโมเดล "large-v2"
  • มีกำหนดเผยแพร่งานวิจัยที่เกี่ยวข้องกับโมเดลนี้ในเร็ว ๆ นี้
  • Epoch : ข้อมูลทั้งหมดที่อยู่ในชุดข้อมูลฝึกจะผ่านโมเดลครบหนึ่งครั้ง (Forward Pass/Backward Pass) กล่าวคือเป็นหน่วยของการฝึกกับชุดข้อมูลทั้งหมดหนึ่งรอบ