- โมเดลภาษาขนาดใหญ่โอเพนซอร์สที่ใช้งานได้ทั้งเพื่อการวิจัยและเชิงพาณิชย์
- ฝึกด้วยข้อมูลโทเคน 2 ล้านล้านโทเคน ซึ่งมากกว่า Llama 1 อยู่ 40%
- ความยาวคอนเท็กซ์เพิ่มเป็น 2 เท่า: 4096
- มีโมเดล 3 ขนาด: 7B, 13B, 70B
- ให้ประสิทธิภาพเหนือกว่าโมเดลภาษาโอเพนซอร์สอื่น ๆ ในหลายเบนช์มาร์ก เช่น การให้เหตุผล การเขียนโค้ด ความชำนาญ และการทดสอบความรู้ (MPT, Falcon, Llama-1)
- ฝึกจากแหล่งข้อมูลที่เปิดเผยสาธารณะ และ Llama-2-chat ที่ผ่านการปรับจูนก็ใช้ชุดคำสั่งที่เปิดเผยและคำอธิบายประกอบจากมนุษย์มากกว่าหนึ่งล้านรายการด้วย
- ใช้ Reinforcement Learning from Human Feedback (RLHF) รวมถึง Rejection Sampling และ Proximal policy optimization (PPO)
- สิ่งที่รวมอยู่ในการดาวน์โหลด
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News