BloombergGPT - โมเดลภาษาขนาดใหญ่สำหรับการเงิน

xguru · 2023-04-03T09:38:07+09:00

โมเดลภาษาที่มีพารามิเตอร์ 50 พันล้าน (50B) ซึ่งฝึกด้วยข้อมูลทางการเงินขนาดมหาศาล สร้างชุดข้อมูลขนาด 363 พันล้านโทเค็นโดยอิงจากแหล่งข้อมูลของ Bloomberg และเสริมด้วยชุดข้อมูลทั่วไปอีก 345 พันล้านโทเค็น ไม่มีประสิทธิภาพลดลงในการทดสอบมาตรฐานของ LLM ทั่วไป และในงานด้านการเงินแสดงประสิทธิภาพที่เหนือกว่าโมเดลเดิมอย่างมาก อธิบายตัวเลือกด้านการสร้างแบบจำลอง กระบวนการฝึก และวิธีวิทยาการประเมินผลด้วย ขั้นถัดไปมีแผนจะเผยแพร่บันทึกการฝึก (chronicle) ที่อธิบายประสบการณ์การเทรน BloombergGPT อย่างละเอียด

(arxiv.org)

13 คะแนน โดย xguru 2023-04-03 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

โมเดลภาษาที่มีพารามิเตอร์ 50 พันล้าน (50B) ซึ่งฝึกด้วยข้อมูลทางการเงินขนาดมหาศาล
สร้างชุดข้อมูลขนาด 363 พันล้านโทเค็นโดยอิงจากแหล่งข้อมูลของ Bloomberg และเสริมด้วยชุดข้อมูลทั่วไปอีก 345 พันล้านโทเค็น
ไม่มีประสิทธิภาพลดลงในการทดสอบมาตรฐานของ LLM ทั่วไป และในงานด้านการเงินแสดงประสิทธิภาพที่เหนือกว่าโมเดลเดิมอย่างมาก
อธิบายตัวเลือกด้านการสร้างแบบจำลอง กระบวนการฝึก และวิธีวิทยาการประเมินผลด้วย
ขั้นถัดไปมีแผนจะเผยแพร่บันทึกการฝึก (chronicle) ที่อธิบายประสบการณ์การเทรน BloombergGPT อย่างละเอียด

BloombergGPT - โมเดลภาษาขนาดใหญ่สำหรับการเงิน

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น