7 คะแนน โดย GN⁺ 28 일 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Qwen3.6-Plus เป็นโมเดลอัปเกรดครั้งใหญ่ที่เปิดตัวต่อจาก Qwen3.5 โดยเสริมความสามารถด้าน การเขียนโค้ดแบบเอเจนต์ และ ประสิทธิภาพการให้เหตุผลแบบมัลติโมดัล อย่างมาก
  • รองรับ หน้าต่างบริบท 1M โทเค็น และพร้อมใช้งานได้ทันทีผ่าน Alibaba Cloud Model Studio API
  • ทำผลงานได้ในระดับแนวหน้าของอุตสาหกรรมใน เบนช์มาร์กด้านโค้ดดิ้ง ภาษา มัลติโมดัล และเอเจนต์ พร้อมพัฒนาความสามารถในการ จัดการโค้ดที่ซับซ้อนและทำแผนระยะยาว
  • ผ่านตัวเลือก preserve_thinking เพื่อคงบริบทการให้เหตุผลไว้ และรองรับการผสานรวมกับ เอเจนต์เขียนโค้ดหลากหลายแบบ เช่น OpenClaw, Claude Code และ Qwen Code
  • พัฒนาไปสู่ AI แบบมัลติโมดัลเชิงเอเจนต์ที่ทำได้ตั้งแต่การรับรู้ภาพไปจนถึงการตัดสินใจลงมือทำ และตั้งเป้าขยายต่อไปสู่ การโอเพนซอร์สโมเดลขนาดเล็กและซูเปอร์เอเจนต์ที่มีอิสระสูง ในอนาคต

สรุปฟีเจอร์หลักและประสิทธิภาพของ Qwen3.6-Plus

  • Qwen3.6-Plus เป็นเวอร์ชันอัปเกรดครั้งใหญ่ที่เปิดตัวหลังซีรีส์ Qwen3.5 โดยเป็นโมเดลที่ยกระดับทั้ง ความสามารถการเขียนโค้ดแบบเอเจนต์ และ ประสิทธิภาพการให้เหตุผลแบบมัลติโมดัล อย่างชัดเจน
  • พร้อมใช้งานผ่าน API ของ Alibaba Cloud Model Studio ได้ทันที และให้ หน้าต่างบริบท 1M โทเค็น มาเป็นมาตรฐาน
  • ปรับปรุง ความเสถียรและความน่าเชื่อถือ จากการสะท้อนเสียงตอบรับของชุมชน และมุ่งสู่ประสบการณ์ “vibe coding” ในสภาพแวดล้อมการพัฒนาจริง

การประเมินประสิทธิภาพ

  • ทำผลงานได้ในระดับสูงสุดของรุ่นเดียวกันใน เบนช์มาร์กด้านภาษา โค้ดดิ้ง มัลติโมดัล และเอเจนต์ ที่หลากหลาย
  • ในด้าน โค้ดดิ้งเอเจนต์ สามารถทำผลลัพธ์ในเบนช์มาร์กหลักอย่าง SWE-bench, Terminal-Bench และ Claw-Eval ได้ใกล้เคียงหรือเหนือกว่าโมเดลชั้นนำของอุตสาหกรรม
  • ในด้าน เอเจนต์ทั่วไปและการใช้เครื่องมือ ก็มีการพัฒนาโดยรวมใน TAU3-Bench, DeepPlanning และ MCPMark
  • ยังทำสถิติใหม่ได้ในด้าน การให้เหตุผลแบบ STEM การดึงข้อมูลจากข้อความยาวมาก และความสามารถในการปรับตัวหลายภาษา
  • โมเดลผสาน การให้เหตุผลเชิงตรรกะ หน่วยความจำ และการเรียกใช้เครื่องมือ เข้าด้วยกันอย่างเป็นระบบ เพื่อเสริม ความสามารถในการแก้ปัญหาโลกจริง เช่น การจัดการโค้ดที่ซับซ้อนหรือการวางแผนระยะยาว

ประสิทธิภาพด้านมัลติโมดัล

  • บรรลุความก้าวหน้าครั้งใหญ่ในด้านการทำความเข้าใจเอกสาร การวิเคราะห์โลกกายภาพ การให้เหตุผลกับวิดีโอ และการเขียนโค้ดจากภาพ ผ่าน การให้เหตุผลแบบมัลติโมดัลขั้นสูง
  • ในแง่ของ การนำไปใช้กับโลกจริง ก็แสดงประสิทธิภาพที่เสถียรในสภาพแวดล้อมธุรกิจจริง เช่น การรู้จำข้อความและวัตถุ รวมถึงการรับรู้ภาพอย่างแม่นยำ
  • ด้วย การผสานวิชัน-ภาษา ทำให้ก้าวข้ามประสิทธิภาพแบบงานเดี่ยว ไปสู่ AI เชิงเอเจนต์ที่เน้นเวิร์กโฟลว์
  • แสดงผลลัพธ์ที่แข่งขันได้กับ GPT5.2, Claude 4.5 และ Gemini-3 Pro ในเบนช์มาร์กต่าง ๆ เช่น RealWorldQA, OmniDocBench, CountBench และ VideoMME

API และการผสานรวมสำหรับนักพัฒนา

  • รองรับโปรโตคอลที่เข้ากันได้กับ OpenAI และ Anthropic ผ่าน Alibaba Cloud Model Studio API
  • เพิ่มตัวเลือก API ใหม่คือ preserve_thinking
    • คงเนื้อหาการให้เหตุผลจากบทสนทนาก่อนหน้าไว้ เพื่อเพิ่ม ความสม่ำเสมอของงานเชิงเอเจนต์ และ ประสิทธิภาพการใช้โทเค็น
    • ค่าเริ่มต้นคือปิดใช้งาน (false) และเมื่อเปิดจะคงบริบทการให้เหตุผลทั้งหมดไว้
  • สามารถใช้งาน API ได้ผ่านเอนด์พอยต์ chat.completions ที่เข้ากันได้กับ OpenAI พร้อมมีโค้ดตัวอย่างให้

การผสานรวมด้านโค้ดดิ้งและเอเจนต์

  • Qwen3.6-Plus สามารถผสานรวมกับ ผู้ช่วยเขียนโค้ดของบุคคลที่สาม ได้ เช่น OpenClaw, Claude Code, Qwen Code, Kilo Code, Cline และ OpenCode
  • เสริมความสามารถในการจัดการโปรเจ็กต์ซับซ้อนใน การพัฒนาฝั่งฟรอนต์เอนด์ เช่น ฉาก 3D เกม และการออกแบบเว็บ
  • การผสานรวม OpenClaw

    • เป็นเอเจนต์ AI สำหรับเขียนโค้ดแบบโอเพนซอร์สที่โฮสต์เองได้ และเมื่อเชื่อมกับ Model Studio จะให้ สภาพแวดล้อมการเขียนโค้ดแบบเอเจนต์บนเทอร์มินัล
    • สามารถใช้งานได้โดยเพิ่มโมเดล Qwen3.6-Plus ลงในไฟล์ตั้งค่า (openclaw.json)
    • โมเดลรองรับ การเปิดใช้ reasoning, อินพุตข้อความและภาพ และ หน้าต่างบริบท 1M
  • การผสานรวม Qwen Code

    • เป็นเอเจนต์ AI สำหรับเขียนโค้ดบนเทอร์มินัลแบบโอเพนซอร์สที่ปรับแต่งมาให้เหมาะกับซีรีส์ Qwen
    • รองรับการทำความเข้าใจโค้ดเบสที่ซับซ้อน การทำงานซ้ำให้เป็นอัตโนมัติ และการดีพลอยอย่างรวดเร็ว
    • หลังติดตั้งในสภาพแวดล้อม Node.js แล้วสามารถยืนยันตัวตนด้วยคำสั่ง /auth
  • การผสานรวม Claude Code

    • สามารถใช้งาน Qwen3.6-Plus ได้ใน Claude Code CLI ผ่านความเข้ากันได้กับโปรโตคอล Anthropic API
    • รันได้หลังตั้งค่าชื่่อโมเดล (qwen3.6-plus) และ API endpoint ผ่านตัวแปรสภาพแวดล้อม

วิชวลเอเจนต์และการขยายสู่มัลติโมดัล

  • เดินหน้าต่อเนื่องตามเส้นทางพัฒนาจาก การรับรู้ภาพ → การให้เหตุผลแบบมัลติโมดัล → การทำงานของเอเจนต์
  • ไม่ได้จำกัดอยู่แค่การรู้จำ แต่สามารถทำได้ถึง การวิเคราะห์ความสัมพันธ์ของข้อมูลภาพและการตัดสินใจลงมือทำ
  • รองรับ งานภาพเชิงปฏิบัติ เช่น การทำความเข้าใจเอกสาร การวิเคราะห์แผนภูมิ การรู้จำ UI และการระบุตำแหน่งอย่างแม่นยำ
  • ในด้าน การทำความเข้าใจวิดีโอ สามารถจัดการข้อมูลเชิงเวลาและความสัมพันธ์ระหว่างเฟรม เพื่อ วิเคราะห์คอนเทนต์แบบไดนามิก
  • ในสถานการณ์ของ GUI agent สามารถรับรู้สถานะหน้าจอและทำ การวางแผนและการดำเนินการหลายขั้นตอน

แผนในอนาคต

  • Qwen3.6-Plus เป็นเวอร์ชันที่สร้างความก้าวหน้าจริงทั้งใน การเขียนโค้ดแบบเอเจนต์ และ AI มัลติโมดัล พร้อมเสริมรากฐานให้กับอีโคซิสเต็มนักพัฒนา
  • เตรียมเปิดเผย ซีรีส์ Qwen3.6 ทั้งหมด และ โอเพนซอร์สโมเดลขนาดเล็ก ในเร็ว ๆ นี้
  • ในระยะยาวมีเป้าหมายพัฒนาไปสู่ ซูเปอร์เอเจนต์ที่มีอิสระสูง ซึ่งสามารถทำ งานระยะยาวที่ซับซ้อนในระดับรีโพซิทอรี ได้

1 ความคิดเห็น

 
GN⁺ 28 일 전
ความเห็นจาก Hacker News
  • โมเดลนี้ ให้ใช้แบบโฮสต์เท่านั้น จึงไม่ใช่ open weight
    ก่อนหน้านี้พวกเขาสร้างชื่อเสียงที่ดีจากโมเดลเปิด แต่ตอนนี้การจะเปลี่ยนภาพลักษณ์ให้ถูกมองว่าเป็น คู่แข่งของ Claude หรือ ChatGPT นั้นทำได้ยาก
    ที่จริงการปล่อยโมเดลเล็กให้ใช้ฟรีไม่ใช่ความใจกว้าง แต่เป็น กลยุทธ์โฆษณา
    อีกทั้งการเทียบกับ 4.5 แทนที่จะเป็น Opus 4.6 ก็ดูเหมือนตั้งใจทำให้เข้าใจผิด
    ถึงจะยังไม่ใช่ระดับ SOTA แต่ตลาดของโมเดลราคาถูกก็มีขนาดใหญ่พอสมควร
    เพียงแต่ตลาดแบบนี้มี ความภักดีต่อแบรนด์ ต่ำ พอมีโมเดลที่ดีกว่านิดหน่อยก็พร้อมย้ายทันที

    • พวกเขาบอกว่าจะปล่อย “โมเดลตัวแปรขนาดเล็ก” ภายหลัง แต่ยังไม่มีรายละเอียดที่ชัดเจน
      และก็ไม่แน่ชัดว่าจะมี ตัวแปรระดับ 300B แบบ Qwen 3.5 หรือไม่ บล็อกทางการ ก็ไม่ได้พูดถึง
    • อ้อ แบบนี้นี่เองถึงมีข่าวว่า สมาชิกทีม Qwen ย้ายออก กันช่วงหลัง
    • ช่วงนี้กลับยิ่งสงสัยเรื่อง ความสามารถในการทำกำไร ของโมเดลพวกนี้
      ในเมื่อโมเดลเปิดมีเพิ่มขึ้นเรื่อย ๆ และรันได้แม้บนฮาร์ดแวร์ราคาถูก บริษัท AI จะ รักษามาร์จิน กันอย่างไร
    • เอาจริง ๆ รู้สึกว่า Opus 4.5 ดีกว่า 4.6
      4.6 เหมือนเป็นแค่ อัปเดตเพื่อลดต้นทุน แล้วปรับ benchmark ให้ดูดีขึ้นเท่านั้น
    • พอใช้หลายโมเดลในโปรดักชัน จะพบว่า “บุคลิก (personality)” ของโมเดลสำคัญมาก
      เช่น ทำตามคำสั่งได้ดี ไม่เปลืองโทเค็น และไม่หลุดออกจากสคริปต์
      โมเดลจีนแข่งได้ดีในด้านนี้ และให้คุณภาพใกล้เคียงกันใน ราคาที่ถูกลง 70~90%
  • ฉันเข้าใจได้ที่ Qwen เอาไปเทียบกับ Opus 4.5 หรือ Gemini Pro 3.0
    แต่จะเรียกสิ่งนั้นว่า หลอกลวง เลยก็ดูเกินไป
    โมเดล AI ออกรุ่นใหม่กันทุกไตรมาส ไม่ใช่ว่าทุกคนจะลืมไปแล้วว่ารุ่นก่อนหน้าทำได้แค่ไหน
    ฉันเคยใช้ GLM-5 กับ Kimi K2.5 แล้วก็ถือว่าดีทีเดียว ถ้า Qwen รุ่นนี้อยู่ระดับนั้นก็น่าประทับใจ
    Qwen 3.5-plus กับ 3-Max ก็เป็น โมเดลปิด อยู่แล้ว ดังนั้นนี่ไม่ใช่ครั้งแรก
    แม้จะเสียดายที่เป็นโมเดลปิด แต่การแข่งขันเพื่อไปให้ถึง SOTA ก็ เป็นผลดีกับผู้บริโภค อยู่ดี

    • ปัญหาไม่ได้อยู่แค่ตัวคู่เทียบ แต่คือ ความจริงใจของวิธีเปรียบเทียบ
      มันดูเหมือนเวลา Apple เปิดตัว iPhone ใหม่แล้วเอาไปเทียบกับ Android รุ่นเก่า จนทำให้ความน่าเชื่อถือลดลง
    • Opus 4.5 เองก็ดีพออยู่แล้ว
      แถม Opus 4.5 คิด $25 ต่อ output token ส่วนโมเดลนี้อยู่ที่ ราว $6 หรือประมาณหนึ่งในสี่ของราคา
  • ได้ผลลัพธ์จาก Pelican ที่ค่อนข้างดีทีเดียว
    สร้างผ่าน API ของ Alibaba Cloud Model Studio ซึ่งต้องสมัครบัญชีและผูก PayPal
    แต่ตอนนี้ใช้ฟรีได้บน OpenRouter

    • มีมุกว่าตอนนี้ Pelican กำลังไล่ทัน กลุ่มปั่นนำลม (drafting peloton)
    • ยังมีคนแซวด้วยว่าเดี๋ยวก็คงฝึก นกกระทุงปั่นจักรยาน กันแล้ว “global benchmark” อะไรทำนองนั้น
  • อยากบอกคนที่คิดว่าสถาบันวิจัยจีนจะหยุดทำโอเพนซอร์สว่า
    มันไม่น่าเกิดขึ้น
    ลองสมัคร coding plan ของ Z.ai ดูสิ — แทบเป็นไปไม่ได้
    พวกเขา เก่งด้านการตลาดไม่พอ จนแทบไม่มีทางรักษาการมีตัวตนได้นอกจากปล่อยโมเดลเปิด
    การขายก็ยังต้องพึ่ง ช่องทางจัดจำหน่าย อย่าง OpenRouter หรือ OpenCode
    สุดท้ายแล้วการทำโอเพนซอร์สจึงไม่ใช่ยุทธศาสตร์ระดับชาติ แต่เป็น วิธีทำการค้าอย่างเดียวที่มี

    • ยังมีคนเล่นมุกว่า “งั้นก็ให้โมเดลทำการตลาดให้ตัวเองสิ?”
      ถ้ามันยังโปรโมตตัวเองไม่ได้ นั่นก็อาจเป็น สัญญาณของข้อจำกัดด้านประสิทธิภาพ
  • โมเดลนี้ต่างจาก Qwen ส่วนใหญ่ตรงที่ ไม่เปิดเผยน้ำหนักโมเดล และไม่เปิดจำนวนพารามิเตอร์ด้วย
    แถม Opus 4.6 ก็ออกมาตั้งสองเดือนแล้ว แต่กลับไปเทียบกับ 4.5 ก็ดูน่าแปลก

    • ในย่อหน้าสุดท้ายของบล็อกเขาระบุว่า “เร็ว ๆ นี้จะ ปล่อยโมเดลตัวแปรขนาดเล็กเป็นโอเพนซอร์ส
      ที่มา
    • ถ้า Opus 4.6 เพิ่งออกมาเมื่อสองเดือนก่อน ก็เป็นไปได้ว่า Qwen อาจยัง ทดสอบเทียบไม่เสร็จ
    • จริง ๆ แล้วโมเดล -MAX กับ -Omni ของ Qwen ก็เป็น โมเดลปิด มาตั้งแต่แรกอยู่แล้ว
  • ฉันคิดว่าการเทียบกับ Opus 4.5 ไม่ได้เป็นปัญหาใหญ่ขนาดนั้น
    การเทียบกับโมเดลที่ฉันคุ้นเคยกลับมีประโยชน์มากกว่าในทางปฏิบัติ
    ถ้าต้องการประสิทธิภาพสูงสุดฉันก็คงใช้โมเดลอื่น แต่ถ้ากำลังหาตัวเลือก ราคาประหยัด ที่คุณภาพใกล้เคียงกัน แบบนี้ก็มีความหมายมากพอ

    • ถ้าได้ประสิทธิภาพระดับ Opus 4.5 แบบฟรี ๆ ก็น่าสนใจมาก
      ต่อให้ไม่เอาไปใช้กับฟังก์ชันหลักของแอป ก็ยังเอาไปใช้กับส่วนที่สำคัญน้อยกว่าได้สบาย
    • พูดตามตรง Opus 4.6 หรือ GPT 5.4 ก็แทบไม่มี ความต่างที่รู้สึกได้ จากรุ่นก่อน
      ถ้าได้ประสิทธิภาพระดับ 4.5 ใน ราคา 1/10 ฉันก็เลือกอันนั้น
  • ผล benchmark ด้านเอเจนต์น่าสนใจดี แต่ฉันอยากรู้ว่า Qwen3.6-Plus มี ความสามารถในการฟื้นตัวจากข้อผิดพลาด มากแค่ไหน
    การทดสอบส่วนใหญ่สนใจแค่ ‘happy path’
    แต่ของจริงคือพอมันพลาดในขั้นที่ 3 แล้วจะ ย้อนกลับมาแก้ได้ไหมในขั้นที่ 15
    เลยอยากรู้ว่ามีใครลองทำ stress test แบบนี้ใน workflow การพัฒนาจริงหรือยัง

  • อยากให้ผู้ขาย AI หยุดทำการตลาดแบบ เทียบกับโมเดลรุ่นก่อนของคู่แข่ง เสียที
    ไม่มีใครโดนหลอกหรอก มีแต่ทำให้ ความน่าเชื่อถือของแบรนด์ ลดลง
    ตัวโมเดล Qwen เองยอดเยี่ยมอยู่แล้ว เลยเสียดายที่ชื่อเสียงต้องเสียเพราะ กลยุทธ์การเปรียบเทียบ แบบนี้

  • จริง ๆ แล้ว Qwen ใช้ Plus และ Max เวอร์ชันปิด มาตั้งนานแล้ว
    เพราะงั้นรูปแบบการเปิดตัวครั้งนี้ก็ไม่ได้ใหม่อะไร

  • Qwen 3.6 Plus ดูเหมือนจะเป็นแค่ เวอร์ชันขัดเกลาของ 3.5 Plus
    ลิงก์เปรียบเทียบ