Alpaca: โมเดลโอเพนซอร์สแบบ Instruction-Following ที่ทรงพลังระดับ GPT-3.5
(crfm.stanford.edu)- Stanford CRFM นำ LLaMA 7B ของ Meta มาปรับจูนด้วยข้อมูล Instruction-Following จำนวน 52K ชุด
- ทำงานได้คล้ายกับ GPT-3.5 ของ OpenAI (
text-davinci-003) แต่มีขนาดเล็กและต้นทุนต่ำกว่ามาก - เปิดเผยทั้งสูตรการฝึกและข้อมูล และมีแผนจะปล่อยน้ำหนักโมเดลในภายหลัง
- เปิดเผยเพื่อวัตถุประสงค์ด้านการวิจัยเท่านั้น และห้ามใช้งานเชิงพาณิชย์
- การปรับจูนใช้เวลา 3 ชั่วโมงบน A100 80GB จำนวน 8 ตัว และสามารถทำได้บนคลาวด์ด้วยค่าใช้จ่ายต่ำกว่าประมาณ 100 ดอลลาร์
1 ความคิดเห็น
Repo : https://github.com/tatsu-lab/stanford_alpaca
เว็บเดโม : https://crfm.stanford.edu/alpaca/
การเปิดตัวของ LLaMA กำลังสร้าง ช่วงเวลาแห่ง Stable Diffusion ขึ้นมาจริง ๆ และทุกอย่างก็กำลังเปลี่ยนแปลงอย่างรวดเร็วมาก