Llama2.c: โค้ดอนุมาน Llama 2 ที่เขียนด้วย C ล้วน

(github.com/karpathy)

13 คะแนน โดย ninebow 2023-07-24 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

บทความนี้เป็นคำอธิบายที่สร้างขึ้นอัตโนมัติโดยใช้ GPT-4 จึงอาจมีเนื้อหาที่ไม่ถูกต้องอยู่บ้าง :smile:
หากพบเนื้อหาที่ไม่ถูกต้อง รบกวนแจ้งในคอมเมนต์ด้วย! :bowing_man:

แนะนำ

Llama2.c คือ Inference Llama 2 ที่เขียนด้วย C ล้วน พัฒนาโดย Andrej Karpathy โปรเจ็กต์นี้เป็นไลบรารีน้ำหนักเบาสำหรับการอนุมานของโมเดลแมชชีนเลิร์นนิง และเนื่องจากเขียนด้วยภาษา C จึงสามารถใช้งานได้บนหลากหลายแพลตฟอร์ม ไลบรารีนี้ถูกออกแบบมาให้ทำงานได้รวดเร็วบน CPU โดยเฉพาะกับโมเดลขนาดเล็ก

สรุป

ไลบรารีนี้เป็นไลบรารีน้ำหนักเบาสำหรับการอนุมานของโมเดลแมชชีนเลิร์นนิง และเนื่องจากเขียนด้วยภาษา C จึงสามารถใช้งานได้บนหลากหลายแพลตฟอร์ม ไลบรารีนี้ถูกออกแบบมาให้ทำงานได้รวดเร็วบน CPU โดยเฉพาะกับโมเดลขนาดเล็ก ไลบรารีนี้ถูกออกแบบมาให้ทำงานได้รวดเร็วบน CPU โดยเฉพาะกับโมเดลขนาดเล็ก

โปรเจ็กต์นี้มีตัวเลือกการปรับแต่งประสิทธิภาพหลายแบบ ซึ่งช่วยให้ผู้ใช้รันโค้ดได้เร็วขึ้นตามระบบของตน เช่น สามารถใช้ตัวเลือกคอมไพล์อย่าง -O3, -Ofast, -ffast-math, -funsafe-math-optimizations, -march=native ได้ ตัวเลือกเหล่านี้ครอบคลุมการปรับแต่งอย่างการเวกเตอร์ไรซ์ การคลายลูป และการทำนายการแตกแขนง โดยบางตัวเลือกอาจไม่เป็นไปตามข้อกำหนดของ C/IEEE

โปรเจ็กต์นี้ยังอยู่ระหว่างการพัฒนา และยังมีปัญหาหลายอย่างที่ต้องแก้ไข เช่น เหตุผลที่โค้ด sampling ในภาษา C มีช่องว่างนำหน้าเมื่อรัน ./run, การรองรับ multi-query สำหรับโมเดลขนาดเล็ก และการรองรับการอนุมานที่เกินความยาวลำดับสูงสุด

อ้างอิง

ตัวเลือกการปรับแต่งประสิทธิภาพของ GCC: สามารถดูรายละเอียดเพิ่มเติมเกี่ยวกับตัวเลือกการปรับแต่งประสิทธิภาพต่าง ๆ ของ GCC ได้
คณิตศาสตร์จำนวนจุดลอยตัวของ GCC: สามารถดูข้อมูลเพิ่มเติมเกี่ยวกับตัวเลือก -ffast-math และ -funsafe-math-optimizations ได้
GitHub ของ Andrej Karpathy: สามารถดูโปรเจ็กต์อื่น ๆ ของ Andrej Karpathy ได้
ไลเซนส์ของ Llama2.c: สามารถตรวจสอบไลเซนส์ MIT ของโปรเจ็กต์นี้ได้
รายชื่อผู้มีส่วนร่วมของ Llama2.c: สามารถดูผู้ที่มีส่วนร่วมในโปรเจ็กต์นี้ได้

ที่มา

https://github.com/karpathy/llama2.c

1 ความคิดเห็น

ninebow 2023-07-24

อ่านเพิ่มเติม

(⚠️โฆษณา⚠️) อ่านเนื้อหาเดียวกันได้ในชุมชน PyTorch ภาษาเกาหลี