- สร้างแอปสำรวจเส้นทางอาชีพที่ขับเคลื่อนด้วย AI แต่เมื่อเติบโตอย่างรวดเร็ว ค่าใช้จ่ายของ GPT-4 ก็เริ่มสูงเกิน $100 ต่อวัน
- วิธีที่ใช้เพื่อลดค่าใช้จ่าย AI ลงได้ถึง 99% พร้อมลด latency และรักษาคุณภาพไว้
- ใช้โมเดลที่ทรงพลังที่สุด (GPT-4) สร้างผลลัพธ์ก่อน แล้วนำผลลัพธ์นั้นมาใช้ fine-tune โมเดลที่เล็กกว่า
- จัดเก็บคำขอ/คำตอบของ AI ให้สามารถ export ได้ง่าย โดยใช้ Helicone AI แค่สลับ OpenAI API เดิม ระบบก็จะบันทึกคำขอ AI ลงในตารางให้
- เมื่อเก็บคู่คำขอ/คำตอบได้ประมาณ 100~500 คู่ ก็ export ออกมาแล้วคัดชุดข้อมูลให้มีคุณภาพดี
- ใช้ชุดข้อมูลนี้ fine-tune Mixtral 8x7B ผ่านบริการโฮสต์อย่าง Together/Anyscale
- แทนที่ GPT-4 ด้วยโมเดลที่ fine-tune ใหม่
4 ความคิดเห็น
งั้นนี่หมายความว่าละเมิดทั้งข้อกำหนดการใช้งานของ GPT-4 และไลเซนส์ของ Mixtral เลยเหรอครับ...? @_@
น่าจะประมาณนั้นครับ/ค่ะ เพราะมันไม่ใช่สิ่งที่มองเห็นได้ชัดเจน หลายคนเลยน่าจะคิดแบบนั้นกัน
ก็พอมีแบบใช้กันเงียบ ๆ หรือไม่ก็เปิดเผยไว้เพื่อการวิจัยอยู่บ้าง
แต่การออกมาประชาสัมพันธ์ตรง ๆ ว่า เราใช้สิ่งนี้! แบบนี้นี่... ก็น่าแปลกใจอยู่นิดหน่อยนะ
จะไม่โดนว่าเอาเหรอ...?
ความเห็นจาก Hacker News