DeepSpeed Chat - เฟรมเวิร์กสำหรับฝึกโมเดลแบบ ChatGPT โดยใช้ RLHF
(github.com/microsoft)- เฟรมเวิร์กระบบแบบเปิดที่รวดเร็ว ราคาประหยัด และขยายขนาดได้
- สามารถสร้างโมเดลสไตล์ ChatGPT คุณภาพสูงได้ทุกขนาดผ่าน End-to-End RLHF (Reinforcement Learning Human Feedback)
- ด้วย 1 คลิก สามารถฝึก สร้าง และให้บริการโมเดล ChatGPT ขนาด 1.3B พารามิเตอร์ได้ภายใน 1.36 ชั่วโมง โดยใช้ NVIDIA A6000 GPU เพียงตัวเดียวที่มีหน่วยความจำ 48GB
- Databricks Dolly, CarperAI-TRLX, Huggingface-PEFT กำลังใช้งานอยู่
1 ความคิดเห็น
DeepSpeed - ไลบรารีปรับแต่งการเรียนรู้เชิงลึกที่ MS เปิดตัว
Databricks เปิดซอร์ส Dolly 2.0 ที่คล้ายกับ ChatGPT