Alpaca: โมเดลโอเพนซอร์สแบบ Instruction-Following ที่ทรงพลังระดับ GPT-3.5

xguru · 2023-03-14T11:21:01+09:00

Stanford CRFM นำ LLaMA 7B ของ Meta มาปรับจูนด้วยข้อมูล Instruction-Following จำนวน 52K ชุด ทำงานได้คล้ายกับ GPT-3.5 ของ OpenAI (text-davinci-003) แต่มีขนาดเล็กและต้นทุนต่ำกว่ามาก เปิดเผยทั้งสูตรการฝึกและข้อมูล และมีแผนจะปล่อยน้ำหนักโมเดลในภายหลัง เปิดเผยเพื่อวัตถุประสงค์ด้านการวิจัยเท่านั้น และห้ามใช้งานเชิงพาณิชย์ การปรับจูนใช้เวลา 3 ชั่วโมงบน A100 80GB จำนวน 8 ตัว และสามารถทำได้บนคลาวด์ด้วยค่าใช้จ่ายต่ำกว่าประมาณ 100 ดอลลาร์

(crfm.stanford.edu)

19 คะแนน โดย xguru 2023-03-14 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Stanford CRFM นำ LLaMA 7B ของ Meta มาปรับจูนด้วยข้อมูล Instruction-Following จำนวน 52K ชุด
ทำงานได้คล้ายกับ GPT-3.5 ของ OpenAI (text-davinci-003) แต่มีขนาดเล็กและต้นทุนต่ำกว่ามาก
เปิดเผยทั้งสูตรการฝึกและข้อมูล และมีแผนจะปล่อยน้ำหนักโมเดลในภายหลัง
เปิดเผยเพื่อวัตถุประสงค์ด้านการวิจัยเท่านั้น และห้ามใช้งานเชิงพาณิชย์
การปรับจูนใช้เวลา 3 ชั่วโมงบน A100 80GB จำนวน 8 ตัว และสามารถทำได้บนคลาวด์ด้วยค่าใช้จ่ายต่ำกว่าประมาณ 100 ดอลลาร์

1 ความคิดเห็น

xguru 2023-03-14

Repo : https://github.com/tatsu-lab/stanford_alpaca
เว็บเดโม : https://crfm.stanford.edu/alpaca/

การเปิดตัวของ LLaMA กำลังสร้าง ช่วงเวลาแห่ง Stable Diffusion ขึ้นมาจริง ๆ และทุกอย่างก็กำลังเปลี่ยนแปลงอย่างรวดเร็วมาก

Alpaca: โมเดลโอเพนซอร์สแบบ Instruction-Following ที่ทรงพลังระดับ GPT-3.5

บทความที่เกี่ยวข้อง

1 ความคิดเห็น