- ใน HN ความสนใจต่อการปรับแต่งอย่างละเอียดของโอเพนซอร์ส LLM เพิ่มขึ้นอย่างมาก (เช่น โพสต์ของ Anyscale)
- แชร์ประสบการณ์หลายปีเกี่ยวกับการปรับแต่งโมเดล ข้อสังเกตเชิงลึก และโค้ดที่นำไปใช้ได้จริง
- มีชุดโน้ตบุ๊กที่ครอบคลุมการติดป้ายกำกับข้อมูล การปรับแต่งอย่างละเอียด การรัน inference อย่างมีประสิทธิภาพ และการประเมินต้นทุน/ประสิทธิภาพ
- ฝึกโมเดล 7B ที่ให้ฉลากตรงกับ GPT-4 ได้ 95% บนชุดทดสอบ
- การปรับแต่งอย่างละเอียดคืออะไร? เป็นรูปแบบของการ prompting ที่ทรงพลังกว่าการเขียนคำสั่งเป็นข้อความ
- ฝึกโมเดลเดิมด้วยคู่ตัวอย่างอินพุต/เอาต์พุตเพื่อให้เรียนรู้สำหรับโมเดลที่ผ่านการปรับแต่งอย่างละเอียด
- ข้อดีและข้อเสียของ prompting และการปรับแต่งอย่างละเอียด
- ข้อได้เปรียบสำคัญของการปรับแต่งอย่างละเอียด: มีประสิทธิภาพมากกว่ามากในการกำหนดพฤติกรรมของโมเดล จึงทำงานได้เพียงพอแม้ใช้โมเดลที่เล็กกว่ามาก
- โมเดล Llama 7B ที่ผ่านการปรับแต่งอย่างละเอียดมีต้นทุนต่อโทเคนถูกกว่า GPT-3.5 ถึง 50 เท่า และให้ผลลัพธ์เทียบเท่าหรือดีกว่าในหลายกรณีการใช้งาน
- ตัวอย่าง: การจัดหมวดหมู่สูตรอาหาร 2M รายการด้วย GPT-4 มีค่าใช้จ่าย $23k แต่โมเดลที่เราปรับแต่งอย่างละเอียดให้ประสิทธิภาพใกล้เคียง GPT-4 และใช้เงินเพียง $19 ในการรันทั้งชุดข้อมูล
- กำลังพัฒนาผลิตภัณฑ์โอเพนซอร์สชื่อ OpenPipe
- ผลิตภัณฑ์ OpenPipe ช่วยให้วิศวกรนำการปรับแต่งอย่างละเอียดไปใช้ได้ง่ายที่สุดเท่าที่จะเป็นไปได้
- โพสต์นี้จัดทำขึ้นเพื่อแบ่งปันสิ่งที่ได้เรียนรู้เกี่ยวกับการปรับแต่งอย่างละเอียด
1 ความคิดเห็น
ความคิดเห็นบน Hacker News