nanoGPT - โอเพนซอร์สสำหรับฝึก/ปรับจูน GPT ขนาดกลางได้เร็วที่สุด
(github.com/karpathy)- โค้ดที่ Andrej Karpathy อดีตหัวหน้าฝ่าย AI ของ Tesla เขียน minGPT ขึ้นใหม่
- มีเป้าหมายให้เป็นโค้ดที่อ่านง่ายและเรียบง่าย
train.pyราว 300 บรรทัดmodel.pyราว 300 บรรทัด
- กำลังทำงานเพื่อสร้าง GPT-2 ขึ้นมาใหม่บนชุดข้อมูล OpenWebText
ยังไม่มีความคิดเห็น