nano-llama31 - เวอร์ชัน Llama 3.1 สไตล์ nanoGPT

xguru · 2024-08-08T10:02:02+09:00

เวอร์ชัน Llama 3.1 สไตล์ nanoGPT ที่ Andrej karpathy พัฒนา อิมพลีเมนต์สถาปัตยกรรม Llama 3.1 แบบมินิมอลที่ไม่มี dependency ทำให้สามารถฝึก, fine-tune และทำ inference ได้อย่างง่ายมาก มี dependency น้อยกว่าและโค้ดขนาดเล็กกว่าอิมพลีเมนต์ของ Meta และ HuggingFace ปัจจุบันมุ่งเน้นไปที่โมเดลพื้นฐาน 8B ของ Llama 3.1 WIP: ยังอยู่ระหว่างการพัฒนาและยังไม่เสร็จสมบูรณ์

(github.com/karpathy)

9 คะแนน โดย xguru 2024-08-08 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

เวอร์ชัน Llama 3.1 สไตล์ nanoGPT ที่ Andrej karpathy พัฒนา
อิมพลีเมนต์สถาปัตยกรรม Llama 3.1 แบบมินิมอลที่ไม่มี dependency ทำให้สามารถฝึก, fine-tune และทำ inference ได้อย่างง่ายมาก
- มี dependency น้อยกว่าและโค้ดขนาดเล็กกว่าอิมพลีเมนต์ของ Meta และ HuggingFace
ปัจจุบันมุ่งเน้นไปที่โมเดลพื้นฐาน 8B ของ Llama 3.1
WIP: ยังอยู่ระหว่างการพัฒนาและยังไม่เสร็จสมบูรณ์

nano-llama31 - เวอร์ชัน Llama 3.1 สไตล์ nanoGPT

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น