8 คะแนน โดย unohee 2026-03-31 | 3 ความคิดเห็น | แชร์ทาง WhatsApp

ขอเปิดตัว VELA โมเดลภาษาที่ปรับแต่งเฉพาะสำหรับตลาดหุ้นเกาหลี (KOSPI+KOSDAQ)

ปรับจูนต่อจาก Qwen2.5-7B-Instruct ด้วยกระบวนการ SFT + DPO pipeline

เหตุผลที่สร้าง
LLM ด้านการเงินที่มีอยู่เดิมมักเกิดอาการหลอนกับคำศัพท์ของตลาดเกาหลีอย่างรุนแรง หรือมีปัญหา language leak ที่สลับไปใช้ภาษาจีน/อังกฤษระหว่างการตอบ
VELA ได้แก้ไขสองปัญหานี้โดยเน้นปรับด้วย DPO

ข้อมูลการฝึก

  • SFT: 36,713 ตัวอย่าง / 2,135 หลักทรัพย์ (การจัดหมวดข่าว, สัญญาณการขึ้นลงแรง, รายงานจากบริษัทหลักทรัพย์, tool calling, การวิเคราะห์ sector/macro ฯลฯ)
  • DPO: 24,779 คู่ (ลบปัญหา leak เป็นภาษาจีน·อังกฤษ, จัดรูปแบบให้สอดคล้องกับ Reasoning Trace)

รูปแบบผลลัพธ์

  1. Reasoning Trace – กระบวนการคิดเป็นขั้นตอนในรูปแบบ JSON (search → analyze → confidence)
  2. Synthesis Report – รายงานวิจัย 7 ส่วน (สรุป, ตัวชี้วัด, กระแสเงินทุน, ผลกระทบจากข่าว, ความเสี่ยง, มุมมองการลงทุน)

ประสิทธิภาพ (อ้างอิง RTX 3060 12GB)

ฟอร์แมต ความเร็ว ขนาด Chinese Leak
Q4_K_M 36 tok/s 4.4GB 0/5 CLEAN
Q8_0 25 tok/s 7.6GB 0/5 CLEAN

ข้อควรระวัง: ในการใช้งานจริงควรป้อนแหล่งข่าวและข้อมูลที่เชื่อถือได้ให้โมเดลอย่างเหมาะสม หากไม่มีแหล่งอ้างอิงที่ถูกต้อง อาจเกิดอาการหลอนได้ ออกแบบมาให้ใช้งานร่วมกับ https://github.com/unohee/vela-framework

อินเทอร์เฟซที่รองรับ
llama-cpp-python / Ollama / vLLM / Transformers / MLX

ไลเซนส์: Apache 2.0

🤗 https://huggingface.co/intrect/VELA

ราคาตลาดแบบเรียลไทม์ถูกป้อนผ่าน API ภายนอก และ VELA ถูกออกแบบให้เป็นเลเยอร์สำหรับการอนุมานที่อยู่ด้านบน
มีวัตถุประสงค์เพื่อให้ข้อมูล ไม่ใช่คำแนะนำด้านการลงทุน

3 ความคิดเห็น

 
310writer 2026-04-06

ยอดเยี่ยมมากครับ ^^

 
ahiou 2026-04-01

เจ๋งมาก! แค่ 7B ก็เสถียรแล้วเหรอ?

 
unohee 2026-04-01

เมื่อเทียบกับขนาดของโมเดลแล้ว งานพื้นฐานต่าง ๆ ทำได้ดีกว่าโมเดล base อย่างชัดเจนครับ น่าจะต้องลงเบนช์มาร์กมาด้วยเหมือนกัน!