Yi - LLM สองภาษารุ่นถัดไปแบบโอเพนซอร์ส
(github.com/01-ai)- โมเดลภาษาขนาดใหญ่แบบโอเพนซอร์สรุ่นถัดไปที่ฝึกตั้งแต่ต้นโดยนักพัฒนา
- ถูกพัฒนาโดยตั้งเป้าเป็นโมเดลสองภาษา และฝึกด้วยคอร์ปัสหลายภาษา 3T จึงแสดงประสิทธิภาพที่แข็งแกร่งในด้านความเข้าใจภาษา การให้เหตุผลเชิงสามัญสำนึก และความสามารถในการอ่านจับใจความ
- มีพื้นฐานจากโมเดลภาษาที่ผ่านการพรีเทรนขนาด 6B และ 34B และขยายไปเป็นโมเดลแชตบอต โมเดลคอนเท็กซ์ยาว 200K โมเดลอัปสเกลเชิงลึก และโมเดลวิชัน-ภาษา
- โมเดล Yi-34B-Chat
- อยู่อันดับ 2 บนลีดเดอร์บอร์ด AlpacaEval รองจาก GPT-4 Turbo และเหนือกว่า LLM อื่น ๆ
- เหนือกว่าโมเดลโอเพนซอร์สเดิมทั้งในภาษาอังกฤษและภาษาจีน และคว้าอันดับ 1 ในหลายเบนช์มาร์ก
- ใช้สถาปัตยกรรมโมเดลเดียวกับ Llama แต่ไม่ใช่โมเดลที่แตกแขนงมาจาก Llama และไม่ได้ใช้ค่าน้ำหนักของ Llama
- มีให้เลือกหลายขนาด และสามารถปรับจูนโมเดลอย่างละเอียดให้ตรงกับความต้องการเฉพาะได้
- โมเดลแชต
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- โมเดลฐาน
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- โมเดลแชต
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News