GPT4All - แชตบอตที่ฝึกด้วยชุดคำสั่ง 800k บนพื้นฐาน LLaMA
(github.com/nomic-ai)- โมเดลภาษาขนาดใหญ่สไตล์ผู้ช่วย
- เปิดเผยทั้งหมดทั้งข้อมูลที่รวบรวม กระบวนการรวบรวมข้อมูล โค้ดสำหรับการฝึก และค่าน้ำหนักของโมเดลสุดท้าย
- ฝึกด้วยข้อมูล 800k (โค้ด/สตอรี่/บทสนทนา) ที่สร้างโดย GPT 3.5 Turbo
- ใช้ LAION OIG, คำถามเขียนโค้ดจาก Stack Overflow และ instruction tuning ของ Big-Science/P3 เป็นชุดข้อมูลพื้นฐาน
- อ้างอิง Stanford Alpaca เป็นต้น และอัปโหลดข้อมูลขึ้น ATLAS เพื่อคัดสรรและทำความสะอาดข้อมูล
ยังไม่มีความคิดเห็น