19 คะแนน โดย kuroneko 2023-05-04 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • Replit เปิดตัว LLM สำหรับสร้างโค้ดรุ่นใหม่เป็นโอเพนซอร์สที่สามารถนำไปใช้เชิงพาณิชย์ได้
  • มีพารามิเตอร์ 2.7B จึงมีขนาดเบาและทำงานได้รวดเร็ว และฝึกเสร็จภายใน 10 วัน
  • ประสิทธิภาพดีขึ้น 40% เมื่อเทียบกับโมเดลระดับเดียวกัน และโมเดลที่ผ่านการ fine-tune มีประสิทธิภาพดีกว่า Codex
  • ฝึกด้วยชุดข้อมูล The Stack และสามารถสร้างโค้ดได้มากกว่า 20 ภาษา
  • สามารถทดลองเดโมได้ทันทีบน Hugging Face

2 ความคิดเห็น

 
kuroneko 2023-05-04

ช่วงนี้รู้สึกว่า LLM โอเพนซอร์สที่สามารถนำไปใช้เชิงพาณิชย์ได้มีเพิ่มขึ้นมากเลยนะครับ/ค่ะ สงสัยว่าเป็นเพราะได้รับแรงกระตุ้นจาก LLaMA หรือเปล่า...

แล้วก็ชอบตรงที่ประสิทธิภาพดีขึ้นมากเมื่อเทียบกับขนาดโมเดลครับ/ค่ะ
ระดับนี้น่าจะถึงขั้นที่สามารถรันแบบโลคัลบนคอมพิวเตอร์สำหรับพัฒนาทั่วไปที่ไม่มี GPU ได้แล้วหรือเปล่า