Upstage เปิดตัว Solar Pro 2 โมเดลให้เหตุผลระดับฟรอนเทียร์

(upstage.ai)

7 คะแนน โดย GN⁺ 2025-07-14 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

Solar Pro 2 คือโมเดลภาษาระดับฟรอนเทียร์ตัวใหม่ของ Upstage ที่แม้จะมีขนาดกะทัดรัดเพียง 31B พารามิเตอร์ แต่ก็มาพร้อม ความสามารถด้านการให้เหตุผลยุคถัดไป, การใช้งานเครื่องมือที่หลากหลาย, และ ประสิทธิภาพการประมวลผลภาษาเกาหลีและหลายภาษาระดับแนวหน้าของกลุ่มเดียวกัน
ใน เบนช์มาร์กสำคัญภาษาเกาหลี (เช่น Ko-Arena-Hard-Auto, Ko-MMLU เป็นต้น) ทำผลงานได้ ทัดเทียมหรือเหนือกว่า GPT-4 และ Claude 3 พร้อมสร้างคำตอบที่สม่ำเสมอและแม่นยำใน โดเมนเฉพาะทางอย่างกฎหมาย การเงิน และการแพทย์
ใน โหมดการให้เหตุผลขั้นสูง สามารถจัดการงานหลากหลายประเภท เช่น โจทย์คณิตศาสตร์ คำถามตอบเชิงตรรกะ และการให้เหตุผลหลายขั้นตอนที่ซับซ้อน อีกทั้งยังพิสูจน์ผลงานเด่นใน การประเมินด้านโค้ดและวิศวกรรม
มี สถาปัตยกรรมแบบเอเจนต์ สำหรับการใช้งานจริง พร้อมความสามารถด้าน การเชื่อมต่อเครื่องมือ การสร้างไฟล์ และการทำงานอัตโนมัติ จึง นำไปใช้ในสภาพแวดล้อมองค์กรได้ทันที
เป็น LLM ยุคถัดไปที่ให้ความสำคัญกับการใช้งานทางธุรกิจจริง ทั้ง การติดตั้งแบบคลาวด์และออนพรेमิส การเสริมความเสถียรและการใช้งาน รวมถึงการสนับสนุนการนำไปใช้ในองค์กร

Solar Pro 2 เปิดตัวอย่างเป็นทางการ พร้อมพิสูจน์สมรรถนะระดับฟรอนเทียร์ระดับโลก

Solar Pro 2 คือ โมเดลภาษาระดับฟรอนเทียร์ยุคถัดไป ที่พัฒนาโดย Upstage ซึ่งแม้จะมีขนาดกะทัดรัดเพียง 31B พารามิเตอร์ แต่ก็มอบ การประมวลผลหลายภาษาที่ครอบคลุม, ความสามารถในการให้เหตุผลขั้นสูง, และ การใช้เครื่องมือที่ปรับให้เหมาะกับงานจริง
โดยเฉพาะในการประมวลผลภาษาเกาหลี ได้พิสูจน์ประสิทธิภาพโดดเด่นจนสามารถ แข่งขันกับ GPT-4 และ Claude 3 ได้ พร้อมแสดง ความแม่นยำและความสม่ำเสมอในโดเมนที่ยากอย่างกฎหมาย การเงิน และการแพทย์

ประสิทธิภาพการประมวลผลภาษาเกาหลีระดับแนวหน้าของกลุ่มเดียวกัน

ทำผลลัพธ์ เทียบเท่าโมเดลชั้นนำ ได้ในเบนช์มาร์กอย่าง Ko-Arena-Hard-Auto
ในงาน NLP ภาษาเกาหลีหลากหลายประเภท เช่น Ko-MMLU, Hae-Rae และ Ko-IFEval แสดง ประสิทธิภาพชั้นนำครอบคลุมทั้งความเข้าใจและการสร้างภาษา
ให้ผลลัพธ์ที่เสถียรและแม่นยำแม้ใน โดเมนเฉพาะทาง (กฎหมาย การเงิน การแพทย์ เป็นต้น)

ความสามารถด้านการให้เหตุผลที่พัฒนาไปอีกขั้น

ในช่วงเวลาที่ ความโปร่งใสและความสามารถในการอธิบายกระบวนการให้เหตุผล มีความสำคัญ Solar Pro 2 ก้าวข้ามการคาดเดาแบบง่ายไปสู่ การวิเคราะห์ การสังเคราะห์ และการคิดหลายขั้นตอน
ใน เบนช์มาร์กการให้เหตุผลทั่วไป เช่น MMLU, MMLU-Pro, HumanEval ประสิทธิภาพในงานหลายขั้นตอนภาษาเกาหลีดีขึ้นอย่างมาก
ยังโดดเด่นในงานอย่าง โจทย์คณิตศาสตร์ความยากสูง เช่น Math500, AIME และ การจัดการโจทย์พัฒนาซอฟต์แวร์ที่ซับซ้อน เช่น SWE-Bench Agentless
มอบ ประสิทธิภาพการให้เหตุผลที่ยอดเยี่ยมเมื่อเทียบกับจำนวนพารามิเตอร์

LLM แบบเอเจนต์ที่ขับเคลื่อนงานจริง

Solar Pro 2 เป็น LLM แบบเอเจนต์ที่มี ฟังก์ชันพร้อมใช้งานจริงในงานธุรกิจ เช่น การเชื่อมต่อเครื่องมือ การสร้างไฟล์ และการรันงานอัตโนมัติ
เน้นย้ำว่าไม่ใช่เพียงโมเดลที่มีขนาดใหญ่ แต่เป็น AI ที่ใช้งานได้จริงและสามารถนำเข้ากระบวนการทำงานได้อย่างเป็นรูปธรรม
ตัวอย่าง: สามารถประยุกต์ใช้กับสถานการณ์อัตโนมัติงานต่าง ๆ เช่น การสร้างรายงานแนวโน้มของคู่แข่งโดยอัตโนมัติ

2 ความคิดเห็น

idunno 2025-07-15

อยากให้แสดงออกมาเป็นตัวเลขว่าดีขึ้นมากแค่ไหน ยอดเยี่ยมแค่ไหน และแม่นยำแค่ไหนนะครับ

sanxiyn 2025-07-15

ในจังหวะที่ Claude 4 ออกมาแล้ว การเอาไปเทียบกับ Claude 3 นี่แทบจะเข้าข่ายหลอกลวงไม่ใช่เหรอ...