19 คะแนน โดย xguru 2023-03-14 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Stanford CRFM นำ LLaMA 7B ของ Meta มาปรับจูนด้วยข้อมูล Instruction-Following จำนวน 52K ชุด
  • ทำงานได้คล้ายกับ GPT-3.5 ของ OpenAI (text-davinci-003) แต่มีขนาดเล็กและต้นทุนต่ำกว่ามาก
  • เปิดเผยทั้งสูตรการฝึกและข้อมูล และมีแผนจะปล่อยน้ำหนักโมเดลในภายหลัง
  • เปิดเผยเพื่อวัตถุประสงค์ด้านการวิจัยเท่านั้น และห้ามใช้งานเชิงพาณิชย์
  • การปรับจูนใช้เวลา 3 ชั่วโมงบน A100 80GB จำนวน 8 ตัว และสามารถทำได้บนคลาวด์ด้วยค่าใช้จ่ายต่ำกว่าประมาณ 100 ดอลลาร์

1 ความคิดเห็น

 
xguru 2023-03-14

Repo : https://github.com/tatsu-lab/stanford_alpaca
เว็บเดโม : https://crfm.stanford.edu/alpaca/

การเปิดตัวของ LLaMA กำลังสร้าง ช่วงเวลาแห่ง Stable Diffusion ขึ้นมาจริง ๆ และทุกอย่างก็กำลังเปลี่ยนแปลงอย่างรวดเร็วมาก