LLM เอเจนต์ขนาด 7B พารามิเตอร์ที่ปรับแต่งเฉพาะสำหรับการวิเคราะห์ข่าวตลาดหุ้นเกาหลีและวิจัยการลงทุน
(huggingface.co)ขอเปิดตัว VELA โมเดลภาษาที่ปรับแต่งเฉพาะสำหรับตลาดหุ้นเกาหลี (KOSPI+KOSDAQ)
ปรับจูนต่อจาก Qwen2.5-7B-Instruct ด้วยกระบวนการ SFT + DPO pipeline
เหตุผลที่สร้าง
LLM ด้านการเงินที่มีอยู่เดิมมักเกิดอาการหลอนกับคำศัพท์ของตลาดเกาหลีอย่างรุนแรง หรือมีปัญหา language leak ที่สลับไปใช้ภาษาจีน/อังกฤษระหว่างการตอบ
VELA ได้แก้ไขสองปัญหานี้โดยเน้นปรับด้วย DPO
ข้อมูลการฝึก
- SFT: 36,713 ตัวอย่าง / 2,135 หลักทรัพย์ (การจัดหมวดข่าว, สัญญาณการขึ้นลงแรง, รายงานจากบริษัทหลักทรัพย์, tool calling, การวิเคราะห์ sector/macro ฯลฯ)
- DPO: 24,779 คู่ (ลบปัญหา leak เป็นภาษาจีน·อังกฤษ, จัดรูปแบบให้สอดคล้องกับ Reasoning Trace)
รูปแบบผลลัพธ์
- Reasoning Trace – กระบวนการคิดเป็นขั้นตอนในรูปแบบ JSON (search → analyze → confidence)
- Synthesis Report – รายงานวิจัย 7 ส่วน (สรุป, ตัวชี้วัด, กระแสเงินทุน, ผลกระทบจากข่าว, ความเสี่ยง, มุมมองการลงทุน)
ประสิทธิภาพ (อ้างอิง RTX 3060 12GB)
| ฟอร์แมต | ความเร็ว | ขนาด | Chinese Leak |
|---|---|---|---|
| Q4_K_M | 36 tok/s | 4.4GB | 0/5 CLEAN |
| Q8_0 | 25 tok/s | 7.6GB | 0/5 CLEAN |
ข้อควรระวัง: ในการใช้งานจริงควรป้อนแหล่งข่าวและข้อมูลที่เชื่อถือได้ให้โมเดลอย่างเหมาะสม หากไม่มีแหล่งอ้างอิงที่ถูกต้อง อาจเกิดอาการหลอนได้ ออกแบบมาให้ใช้งานร่วมกับ https://github.com/unohee/vela-framework
อินเทอร์เฟซที่รองรับ
llama-cpp-python / Ollama / vLLM / Transformers / MLX
ไลเซนส์: Apache 2.0
🤗 https://huggingface.co/intrect/VELA
ราคาตลาดแบบเรียลไทม์ถูกป้อนผ่าน API ภายนอก และ VELA ถูกออกแบบให้เป็นเลเยอร์สำหรับการอนุมานที่อยู่ด้านบน
มีวัตถุประสงค์เพื่อให้ข้อมูล ไม่ใช่คำแนะนำด้านการลงทุน
3 ความคิดเห็น
ยอดเยี่ยมมากครับ ^^
เจ๋งมาก! แค่ 7B ก็เสถียรแล้วเหรอ?
เมื่อเทียบกับขนาดของโมเดลแล้ว งานพื้นฐานต่าง ๆ ทำได้ดีกว่าโมเดล base อย่างชัดเจนครับ น่าจะต้องลงเบนช์มาร์กมาด้วยเหมือนกัน!