Qwen3.6-Plus: มุ่งสู่เอเจนต์สำหรับโลกความเป็นจริง

(qwen.ai)

7 คะแนน โดย GN⁺ 28 일 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Qwen3.6-Plus เป็นโมเดลอัปเกรดครั้งใหญ่ที่เปิดตัวต่อจาก Qwen3.5 โดยเสริมความสามารถด้าน การเขียนโค้ดแบบเอเจนต์ และ ประสิทธิภาพการให้เหตุผลแบบมัลติโมดัล อย่างมาก
รองรับ หน้าต่างบริบท 1M โทเค็น และพร้อมใช้งานได้ทันทีผ่าน Alibaba Cloud Model Studio API
ทำผลงานได้ในระดับแนวหน้าของอุตสาหกรรมใน เบนช์มาร์กด้านโค้ดดิ้ง ภาษา มัลติโมดัล และเอเจนต์ พร้อมพัฒนาความสามารถในการ จัดการโค้ดที่ซับซ้อนและทำแผนระยะยาว
ผ่านตัวเลือก preserve_thinking เพื่อคงบริบทการให้เหตุผลไว้ และรองรับการผสานรวมกับ เอเจนต์เขียนโค้ดหลากหลายแบบ เช่น OpenClaw, Claude Code และ Qwen Code
พัฒนาไปสู่ AI แบบมัลติโมดัลเชิงเอเจนต์ที่ทำได้ตั้งแต่การรับรู้ภาพไปจนถึงการตัดสินใจลงมือทำ และตั้งเป้าขยายต่อไปสู่ การโอเพนซอร์สโมเดลขนาดเล็กและซูเปอร์เอเจนต์ที่มีอิสระสูง ในอนาคต

สรุปฟีเจอร์หลักและประสิทธิภาพของ Qwen3.6-Plus

Qwen3.6-Plus เป็นเวอร์ชันอัปเกรดครั้งใหญ่ที่เปิดตัวหลังซีรีส์ Qwen3.5 โดยเป็นโมเดลที่ยกระดับทั้ง ความสามารถการเขียนโค้ดแบบเอเจนต์ และ ประสิทธิภาพการให้เหตุผลแบบมัลติโมดัล อย่างชัดเจน
พร้อมใช้งานผ่าน API ของ Alibaba Cloud Model Studio ได้ทันที และให้ หน้าต่างบริบท 1M โทเค็น มาเป็นมาตรฐาน
ปรับปรุง ความเสถียรและความน่าเชื่อถือ จากการสะท้อนเสียงตอบรับของชุมชน และมุ่งสู่ประสบการณ์ “vibe coding” ในสภาพแวดล้อมการพัฒนาจริง

การประเมินประสิทธิภาพ

ทำผลงานได้ในระดับสูงสุดของรุ่นเดียวกันใน เบนช์มาร์กด้านภาษา โค้ดดิ้ง มัลติโมดัล และเอเจนต์ ที่หลากหลาย
ในด้าน โค้ดดิ้งเอเจนต์ สามารถทำผลลัพธ์ในเบนช์มาร์กหลักอย่าง SWE-bench, Terminal-Bench และ Claw-Eval ได้ใกล้เคียงหรือเหนือกว่าโมเดลชั้นนำของอุตสาหกรรม
ในด้าน เอเจนต์ทั่วไปและการใช้เครื่องมือ ก็มีการพัฒนาโดยรวมใน TAU3-Bench, DeepPlanning และ MCPMark
ยังทำสถิติใหม่ได้ในด้าน การให้เหตุผลแบบ STEM การดึงข้อมูลจากข้อความยาวมาก และความสามารถในการปรับตัวหลายภาษา
โมเดลผสาน การให้เหตุผลเชิงตรรกะ หน่วยความจำ และการเรียกใช้เครื่องมือ เข้าด้วยกันอย่างเป็นระบบ เพื่อเสริม ความสามารถในการแก้ปัญหาโลกจริง เช่น การจัดการโค้ดที่ซับซ้อนหรือการวางแผนระยะยาว

ประสิทธิภาพด้านมัลติโมดัล

บรรลุความก้าวหน้าครั้งใหญ่ในด้านการทำความเข้าใจเอกสาร การวิเคราะห์โลกกายภาพ การให้เหตุผลกับวิดีโอ และการเขียนโค้ดจากภาพ ผ่าน การให้เหตุผลแบบมัลติโมดัลขั้นสูง
ในแง่ของ การนำไปใช้กับโลกจริง ก็แสดงประสิทธิภาพที่เสถียรในสภาพแวดล้อมธุรกิจจริง เช่น การรู้จำข้อความและวัตถุ รวมถึงการรับรู้ภาพอย่างแม่นยำ
ด้วย การผสานวิชัน-ภาษา ทำให้ก้าวข้ามประสิทธิภาพแบบงานเดี่ยว ไปสู่ AI เชิงเอเจนต์ที่เน้นเวิร์กโฟลว์
แสดงผลลัพธ์ที่แข่งขันได้กับ GPT5.2, Claude 4.5 และ Gemini-3 Pro ในเบนช์มาร์กต่าง ๆ เช่น RealWorldQA, OmniDocBench, CountBench และ VideoMME

API และการผสานรวมสำหรับนักพัฒนา

รองรับโปรโตคอลที่เข้ากันได้กับ OpenAI และ Anthropic ผ่าน Alibaba Cloud Model Studio API
เพิ่มตัวเลือก API ใหม่คือ preserve_thinking
- คงเนื้อหาการให้เหตุผลจากบทสนทนาก่อนหน้าไว้ เพื่อเพิ่ม ความสม่ำเสมอของงานเชิงเอเจนต์ และ ประสิทธิภาพการใช้โทเค็น
- ค่าเริ่มต้นคือปิดใช้งาน (false) และเมื่อเปิดจะคงบริบทการให้เหตุผลทั้งหมดไว้
สามารถใช้งาน API ได้ผ่านเอนด์พอยต์ chat.completions ที่เข้ากันได้กับ OpenAI พร้อมมีโค้ดตัวอย่างให้

การผสานรวมด้านโค้ดดิ้งและเอเจนต์

Qwen3.6-Plus สามารถผสานรวมกับ ผู้ช่วยเขียนโค้ดของบุคคลที่สาม ได้ เช่น OpenClaw, Claude Code, Qwen Code, Kilo Code, Cline และ OpenCode
เสริมความสามารถในการจัดการโปรเจ็กต์ซับซ้อนใน การพัฒนาฝั่งฟรอนต์เอนด์ เช่น ฉาก 3D เกม และการออกแบบเว็บ
การผสานรวม OpenClaw
- เป็นเอเจนต์ AI สำหรับเขียนโค้ดแบบโอเพนซอร์สที่โฮสต์เองได้ และเมื่อเชื่อมกับ Model Studio จะให้ สภาพแวดล้อมการเขียนโค้ดแบบเอเจนต์บนเทอร์มินัล
- สามารถใช้งานได้โดยเพิ่มโมเดล Qwen3.6-Plus ลงในไฟล์ตั้งค่า (openclaw.json)
- โมเดลรองรับ การเปิดใช้ reasoning, อินพุตข้อความและภาพ และ หน้าต่างบริบท 1M
การผสานรวม Qwen Code
- เป็นเอเจนต์ AI สำหรับเขียนโค้ดบนเทอร์มินัลแบบโอเพนซอร์สที่ปรับแต่งมาให้เหมาะกับซีรีส์ Qwen
- รองรับการทำความเข้าใจโค้ดเบสที่ซับซ้อน การทำงานซ้ำให้เป็นอัตโนมัติ และการดีพลอยอย่างรวดเร็ว
- หลังติดตั้งในสภาพแวดล้อม Node.js แล้วสามารถยืนยันตัวตนด้วยคำสั่ง /auth
การผสานรวม Claude Code
- สามารถใช้งาน Qwen3.6-Plus ได้ใน Claude Code CLI ผ่านความเข้ากันได้กับโปรโตคอล Anthropic API
- รันได้หลังตั้งค่าชื่่อโมเดล (qwen3.6-plus) และ API endpoint ผ่านตัวแปรสภาพแวดล้อม

วิชวลเอเจนต์และการขยายสู่มัลติโมดัล

เดินหน้าต่อเนื่องตามเส้นทางพัฒนาจาก การรับรู้ภาพ → การให้เหตุผลแบบมัลติโมดัล → การทำงานของเอเจนต์
ไม่ได้จำกัดอยู่แค่การรู้จำ แต่สามารถทำได้ถึง การวิเคราะห์ความสัมพันธ์ของข้อมูลภาพและการตัดสินใจลงมือทำ
รองรับ งานภาพเชิงปฏิบัติ เช่น การทำความเข้าใจเอกสาร การวิเคราะห์แผนภูมิ การรู้จำ UI และการระบุตำแหน่งอย่างแม่นยำ
ในด้าน การทำความเข้าใจวิดีโอ สามารถจัดการข้อมูลเชิงเวลาและความสัมพันธ์ระหว่างเฟรม เพื่อ วิเคราะห์คอนเทนต์แบบไดนามิก
ในสถานการณ์ของ GUI agent สามารถรับรู้สถานะหน้าจอและทำ การวางแผนและการดำเนินการหลายขั้นตอน

แผนในอนาคต

Qwen3.6-Plus เป็นเวอร์ชันที่สร้างความก้าวหน้าจริงทั้งใน การเขียนโค้ดแบบเอเจนต์ และ AI มัลติโมดัล พร้อมเสริมรากฐานให้กับอีโคซิสเต็มนักพัฒนา
เตรียมเปิดเผย ซีรีส์ Qwen3.6 ทั้งหมด และ โอเพนซอร์สโมเดลขนาดเล็ก ในเร็ว ๆ นี้
ในระยะยาวมีเป้าหมายพัฒนาไปสู่ ซูเปอร์เอเจนต์ที่มีอิสระสูง ซึ่งสามารถทำ งานระยะยาวที่ซับซ้อนในระดับรีโพซิทอรี ได้

1 ความคิดเห็น

GN⁺ 28 일 전

ความเห็นจาก Hacker News

โมเดลนี้ ให้ใช้แบบโฮสต์เท่านั้น จึงไม่ใช่ open weight
ก่อนหน้านี้พวกเขาสร้างชื่อเสียงที่ดีจากโมเดลเปิด แต่ตอนนี้การจะเปลี่ยนภาพลักษณ์ให้ถูกมองว่าเป็น คู่แข่งของ Claude หรือ ChatGPT นั้นทำได้ยาก
ที่จริงการปล่อยโมเดลเล็กให้ใช้ฟรีไม่ใช่ความใจกว้าง แต่เป็น กลยุทธ์โฆษณา
อีกทั้งการเทียบกับ 4.5 แทนที่จะเป็น Opus 4.6 ก็ดูเหมือนตั้งใจทำให้เข้าใจผิด
ถึงจะยังไม่ใช่ระดับ SOTA แต่ตลาดของโมเดลราคาถูกก็มีขนาดใหญ่พอสมควร
เพียงแต่ตลาดแบบนี้มี ความภักดีต่อแบรนด์ ต่ำ พอมีโมเดลที่ดีกว่านิดหน่อยก็พร้อมย้ายทันที
- พวกเขาบอกว่าจะปล่อย “โมเดลตัวแปรขนาดเล็ก” ภายหลัง แต่ยังไม่มีรายละเอียดที่ชัดเจน
  และก็ไม่แน่ชัดว่าจะมี ตัวแปรระดับ 300B แบบ Qwen 3.5 หรือไม่ บล็อกทางการ ก็ไม่ได้พูดถึง
- อ้อ แบบนี้นี่เองถึงมีข่าวว่า สมาชิกทีม Qwen ย้ายออก กันช่วงหลัง
- ช่วงนี้กลับยิ่งสงสัยเรื่อง ความสามารถในการทำกำไร ของโมเดลพวกนี้
  ในเมื่อโมเดลเปิดมีเพิ่มขึ้นเรื่อย ๆ และรันได้แม้บนฮาร์ดแวร์ราคาถูก บริษัท AI จะ รักษามาร์จิน กันอย่างไร
- เอาจริง ๆ รู้สึกว่า Opus 4.5 ดีกว่า 4.6
  4.6 เหมือนเป็นแค่ อัปเดตเพื่อลดต้นทุน แล้วปรับ benchmark ให้ดูดีขึ้นเท่านั้น
- พอใช้หลายโมเดลในโปรดักชัน จะพบว่า “บุคลิก (personality)” ของโมเดลสำคัญมาก
  เช่น ทำตามคำสั่งได้ดี ไม่เปลืองโทเค็น และไม่หลุดออกจากสคริปต์
  โมเดลจีนแข่งได้ดีในด้านนี้ และให้คุณภาพใกล้เคียงกันใน ราคาที่ถูกลง 70~90%
ฉันเข้าใจได้ที่ Qwen เอาไปเทียบกับ Opus 4.5 หรือ Gemini Pro 3.0
แต่จะเรียกสิ่งนั้นว่า หลอกลวง เลยก็ดูเกินไป
โมเดล AI ออกรุ่นใหม่กันทุกไตรมาส ไม่ใช่ว่าทุกคนจะลืมไปแล้วว่ารุ่นก่อนหน้าทำได้แค่ไหน
ฉันเคยใช้ GLM-5 กับ Kimi K2.5 แล้วก็ถือว่าดีทีเดียว ถ้า Qwen รุ่นนี้อยู่ระดับนั้นก็น่าประทับใจ
Qwen 3.5-plus กับ 3-Max ก็เป็น โมเดลปิด อยู่แล้ว ดังนั้นนี่ไม่ใช่ครั้งแรก
แม้จะเสียดายที่เป็นโมเดลปิด แต่การแข่งขันเพื่อไปให้ถึง SOTA ก็ เป็นผลดีกับผู้บริโภค อยู่ดี
- ปัญหาไม่ได้อยู่แค่ตัวคู่เทียบ แต่คือ ความจริงใจของวิธีเปรียบเทียบ
  มันดูเหมือนเวลา Apple เปิดตัว iPhone ใหม่แล้วเอาไปเทียบกับ Android รุ่นเก่า จนทำให้ความน่าเชื่อถือลดลง
- Opus 4.5 เองก็ดีพออยู่แล้ว
  แถม Opus 4.5 คิด $25 ต่อ output token ส่วนโมเดลนี้อยู่ที่ ราว $6 หรือประมาณหนึ่งในสี่ของราคา
ได้ผลลัพธ์จาก Pelican ที่ค่อนข้างดีทีเดียว
สร้างผ่าน API ของ Alibaba Cloud Model Studio ซึ่งต้องสมัครบัญชีและผูก PayPal
แต่ตอนนี้ใช้ฟรีได้บน OpenRouter
- มีมุกว่าตอนนี้ Pelican กำลังไล่ทัน กลุ่มปั่นนำลม (drafting peloton)
- ยังมีคนแซวด้วยว่าเดี๋ยวก็คงฝึก นกกระทุงปั่นจักรยาน กันแล้ว “global benchmark” อะไรทำนองนั้น
อยากบอกคนที่คิดว่าสถาบันวิจัยจีนจะหยุดทำโอเพนซอร์สว่า
มันไม่น่าเกิดขึ้น
ลองสมัคร coding plan ของ Z.ai ดูสิ — แทบเป็นไปไม่ได้
พวกเขา เก่งด้านการตลาดไม่พอ จนแทบไม่มีทางรักษาการมีตัวตนได้นอกจากปล่อยโมเดลเปิด
การขายก็ยังต้องพึ่ง ช่องทางจัดจำหน่าย อย่าง OpenRouter หรือ OpenCode
สุดท้ายแล้วการทำโอเพนซอร์สจึงไม่ใช่ยุทธศาสตร์ระดับชาติ แต่เป็น วิธีทำการค้าอย่างเดียวที่มี
- ยังมีคนเล่นมุกว่า “งั้นก็ให้โมเดลทำการตลาดให้ตัวเองสิ?”
  ถ้ามันยังโปรโมตตัวเองไม่ได้ นั่นก็อาจเป็น สัญญาณของข้อจำกัดด้านประสิทธิภาพ
โมเดลนี้ต่างจาก Qwen ส่วนใหญ่ตรงที่ ไม่เปิดเผยน้ำหนักโมเดล และไม่เปิดจำนวนพารามิเตอร์ด้วย
แถม Opus 4.6 ก็ออกมาตั้งสองเดือนแล้ว แต่กลับไปเทียบกับ 4.5 ก็ดูน่าแปลก
- ในย่อหน้าสุดท้ายของบล็อกเขาระบุว่า “เร็ว ๆ นี้จะ ปล่อยโมเดลตัวแปรขนาดเล็กเป็นโอเพนซอร์ส”
  ที่มา
- ถ้า Opus 4.6 เพิ่งออกมาเมื่อสองเดือนก่อน ก็เป็นไปได้ว่า Qwen อาจยัง ทดสอบเทียบไม่เสร็จ
- จริง ๆ แล้วโมเดล -MAX กับ -Omni ของ Qwen ก็เป็น โมเดลปิด มาตั้งแต่แรกอยู่แล้ว
ฉันคิดว่าการเทียบกับ Opus 4.5 ไม่ได้เป็นปัญหาใหญ่ขนาดนั้น
การเทียบกับโมเดลที่ฉันคุ้นเคยกลับมีประโยชน์มากกว่าในทางปฏิบัติ
ถ้าต้องการประสิทธิภาพสูงสุดฉันก็คงใช้โมเดลอื่น แต่ถ้ากำลังหาตัวเลือก ราคาประหยัด ที่คุณภาพใกล้เคียงกัน แบบนี้ก็มีความหมายมากพอ
- ถ้าได้ประสิทธิภาพระดับ Opus 4.5 แบบฟรี ๆ ก็น่าสนใจมาก
  ต่อให้ไม่เอาไปใช้กับฟังก์ชันหลักของแอป ก็ยังเอาไปใช้กับส่วนที่สำคัญน้อยกว่าได้สบาย
- พูดตามตรง Opus 4.6 หรือ GPT 5.4 ก็แทบไม่มี ความต่างที่รู้สึกได้ จากรุ่นก่อน
  ถ้าได้ประสิทธิภาพระดับ 4.5 ใน ราคา 1/10 ฉันก็เลือกอันนั้น
ผล benchmark ด้านเอเจนต์น่าสนใจดี แต่ฉันอยากรู้ว่า Qwen3.6-Plus มี ความสามารถในการฟื้นตัวจากข้อผิดพลาด มากแค่ไหน
การทดสอบส่วนใหญ่สนใจแค่ ‘happy path’
แต่ของจริงคือพอมันพลาดในขั้นที่ 3 แล้วจะ ย้อนกลับมาแก้ได้ไหมในขั้นที่ 15
เลยอยากรู้ว่ามีใครลองทำ stress test แบบนี้ใน workflow การพัฒนาจริงหรือยัง
อยากให้ผู้ขาย AI หยุดทำการตลาดแบบ เทียบกับโมเดลรุ่นก่อนของคู่แข่ง เสียที
ไม่มีใครโดนหลอกหรอก มีแต่ทำให้ ความน่าเชื่อถือของแบรนด์ ลดลง
ตัวโมเดล Qwen เองยอดเยี่ยมอยู่แล้ว เลยเสียดายที่ชื่อเสียงต้องเสียเพราะ กลยุทธ์การเปรียบเทียบ แบบนี้
จริง ๆ แล้ว Qwen ใช้ Plus และ Max เวอร์ชันปิด มาตั้งนานแล้ว
เพราะงั้นรูปแบบการเปิดตัวครั้งนี้ก็ไม่ได้ใหม่อะไร
Qwen 3.6 Plus ดูเหมือนจะเป็นแค่ เวอร์ชันขัดเกลาของ 3.5 Plus
ลิงก์เปรียบเทียบ

Qwen3.6-Plus: มุ่งสู่เอเจนต์สำหรับโลกความเป็นจริง

สรุปฟีเจอร์หลักและประสิทธิภาพของ Qwen3.6-Plus

การประเมินประสิทธิภาพ

ประสิทธิภาพด้านมัลติโมดัล

API และการผสานรวมสำหรับนักพัฒนา

การผสานรวมด้านโค้ดดิ้งและเอเจนต์

การผสานรวม OpenClaw

การผสานรวม Qwen Code

การผสานรวม Claude Code

วิชวลเอเจนต์และการขยายสู่มัลติโมดัล

แผนในอนาคต

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความเห็นจาก Hacker News