เปิดตัว Claude Opus 4.6

(anthropic.com)

20 คะแนน โดย GN⁺ 2026-02-06 | 9 ความคิดเห็น | แชร์ทาง WhatsApp

โมเดล AI ล่าสุดของ Anthropic ที่มาพร้อม ความสามารถด้านการเขียนโค้ดและความต่อเนื่องในการทำงานระยะยาวที่ดีขึ้น พร้อมรองรับ context window ขนาด 1M โทเค็นในสถานะเบตา
ทำคะแนนได้ในระดับแนวหน้าของอุตสาหกรรมบนเบนช์มาร์กหลัก โดยเหนือกว่า GPT-5.2 ราว 144 คะแนน Elo
ประสิทธิภาพได้รับการเสริมในงานที่เน้นการใช้งานจริง เช่น การรีวิวโค้ด·ดีบัก, การจัดการโค้ดเบสขนาดใหญ่, การวิเคราะห์การเงิน·การเขียนเอกสาร
เพิ่มฟีเจอร์ควบคุมสำหรับนักพัฒนา เช่น Adaptive thinking, context compaction, การปรับ effort ทำให้การใช้งานเอเจนต์แบบรันระยะยาวทำได้ง่ายขึ้น
ในการประเมินด้านความปลอดภัยก็แสดงผลว่า มีข้อผิดพลาด·การใช้งานในทางที่ผิด·อัตราการปฏิเสธเกินจำเป็นต่ำ จึงถูกมองว่าเป็นโมเดลที่ได้ทั้งสมรรถนะสูงและความปลอดภัย

จุดปรับปรุงสำคัญของ Claude Opus 4.6

Opus 4.6 เป็นโมเดลที่มี ความสามารถในการวางแผน, ความต่อเนื่องของเอเจนต์, การควบคุมคุณภาพโค้ด ดีขึ้นเมื่อเทียบกับเวอร์ชันก่อนหน้า
- ทำงานได้เสถียรมากขึ้นบนโค้ดเบสขนาดใหญ่ พร้อมเสริมความสามารถในการตรวจจับและแก้ไขข้อผิดพลาดด้วยตนเอง
- รองรับการประมวลผลงานยาวและซับซ้อนด้วย context window ขนาด 1M โทเค็น (เบตา)
การนำไปใช้ในงานประจำวัน ก็ขยายกว้างขึ้น ครอบคลุมงานอย่างการวิเคราะห์การเงิน การวิจัย เอกสาร สเปรดชีต และการสร้างงานนำเสนอ
ในสภาพแวดล้อม Cowork สามารถทำงานหลายอย่างแบบอัตโนมัติได้ และจัดการงานที่ซับซ้อนแทนผู้ใช้

เบนช์มาร์กและการประเมินประสิทธิภาพ

ทำคะแนนสูงสุดใน Terminal-Bench 2.0 และนำหน้าทุก frontier model ใน Humanity’s Last Exam
ในการประเมิน GDPval-AA มีประสิทธิภาพสูงกว่า GPT-5.2 ประมาณ 144 คะแนน Elo และสูงกว่า Opus 4.5 อยู่ 190 คะแนน
ทำผลงานสูงสุดในแบบทดสอบ BrowseComp เช่นกัน สะท้อนความสามารถในการค้นหาข้อมูลออนไลน์ที่ดีขึ้น
ใน MRCR v2 (1M variant) ทำคะแนนได้ 76% ซึ่งเพิ่มขึ้นมากเมื่อเทียบกับ 18.5% ของ Sonnet 4.5
ความสามารถในการรักษาบริบทยาวและติดตามข้อมูลดีขึ้น ช่วยลดอาการ context rot

ประสบการณ์ใช้งานช่วงแรกและเสียงตอบรับจากพาร์ตเนอร์

ในการทดสอบวิศวกรรมภายใน พบว่า ความสามารถในการแก้ปัญหาซับซ้อนและการตัดสินใจ ดีขึ้น
- เมื่อเจอโจทย์ยาก โมเดลจะคิดเชิงลึกซ้ำหลายรอบเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น
- สำหรับงานง่าย อาจช้าลงจากการคิดมากเกินไป จึงสามารถปรับได้ผ่านพารามิเตอร์ /effort
พาร์ตเนอร์กลุ่มแรกประเมินว่า Opus 4.6 โดดเด่นในด้าน ความสามารถในการทำงานอัตโนมัติ, การจัดการคำขอที่ซับซ้อน, การสนับสนุนการทำงานร่วมกันในทีม
- มีความแม่นยำสูงในการสำรวจโค้ดเบสขนาดใหญ่ การรันงานย่อยแบบขนาน และการระบุบล็อกเกอร์
- มีความแม่นยำสูงในการวิเคราะห์เนื้อหาด้านกฎหมาย การเงิน และเทคนิค (เช่น BigLaw Bench 90.2%)
- ในการทดสอบจริงด้านการสืบสวนความปลอดภัยไซเบอร์ 38 จาก 40 กรณีให้ผลลัพธ์ดีกว่า Opus 4.5
- มีรายงานกรณีที่ย้ายโค้ดหลายล้านบรรทัดเสร็จในเวลาครึ่งหนึ่ง

การเสริมความปลอดภัยและความมั่นคง

ใน การตรวจสอบพฤติกรรมอัตโนมัติ มีสัดส่วนพฤติกรรมไม่สอดคล้อง เช่น การหลอกลวง การประจบ และการร่วมมือเพื่อการใช้งานผิดวัตถุประสงค์ อยู่ในระดับต่ำ
เป็นโมเดล Claude ที่มี อัตราการปฏิเสธเกินจำเป็น (over-refusal) ต่ำที่สุด
มีการประเมินความปลอดภัยรูปแบบใหม่ เช่น สวัสดิภาพผู้ใช้ การปฏิเสธคำขอเสี่ยง และการตรวจจับพฤติกรรมอันตรายแบบแฝง
ใช้ งานวิจัยด้านการตีความได้ของโมเดล เพื่อวิเคราะห์สาเหตุการทำงานภายในและตรวจจับปัญหาที่อาจเกิดขึ้น
จากการที่ ความสามารถด้านไซเบอร์ซีเคียวริตี้ดีขึ้น จึงมีการเพิ่ม security probe ใหม่ 6 ประเภท เพื่อเสริมการตรวจจับการนำไปใช้ในทางที่ผิด
ในการใช้งานเชิงป้องกัน โมเดลช่วยตรวจหาและแพตช์ช่องโหว่ของโอเพนซอร์ส และมีแผนบล็อกการใช้งานผิดวัตถุประสงค์แบบเรียลไทม์ในอนาคต

อัปเดตผลิตภัณฑ์และ API

ใน Claude Developer Platform มีการเพิ่มฟีเจอร์ต่อไปนี้
- Adaptive thinking: ให้โมเดลตัดสินใจเองโดยอัตโนมัติว่าควรใช้การคิดเชิงลึกตามสถานการณ์หรือไม่
- ระดับ Effort: มีให้เลือก 4 ระดับคือ low, medium, high (ค่าเริ่มต้น), max
- Context compaction (เบตา) : เมื่อบทสนทนายาวขึ้น จะสรุปและแทนที่บริบทเก่า
- รองรับ 1M token context (เบตา) และ 128k output tokens
- มีตัวเลือก US-only inference (คิดค่าบริการ 1.1 เท่า)
เพิ่มฟีเจอร์ agent teams ให้กับ Claude Code ทำให้หลายเอเจนต์สามารถร่วมงานกันแบบขนานได้
Claude in Excel ปรับปรุงความสามารถในการจัดโครงสร้างข้อมูลที่ไม่มีโครงสร้างและจัดการการเปลี่ยนแปลงหลายขั้นตอน
Claude in PowerPoint (research preview) สามารถรู้จำเทมเพลตสไลด์ ฟอนต์ และเลย์เอาต์ เพื่อคงความสอดคล้องของแบรนด์

การเข้าถึงและราคา

Opus 4.6 ใช้งานได้ทันทีผ่าน claude.ai, API และแพลตฟอร์มคลาวด์หลัก
ชื่อโมเดลบน API คือ claude-opus-4-6 โดยมีราคา $5/$25 per million tokens เท่าเดิม
พรอมป์ต์ที่เกิน 200k โทเค็นจะคิดอัตราพรีเมียม ($10/$37.50 per million tokens)

บทสรุป

Claude Opus 4.6 ถือเป็นก้าวกระโดดครั้งใหญ่ในด้าน การจัดการบริบทยาว, งานเอเจนต์อัตโนมัติ, ความสามารถการให้เหตุผลขั้นสูง
เป็นโมเดลที่เสริมทั้ง ประสิทธิภาพ·ความปลอดภัย·ความสามารถในการควบคุมสำหรับนักพัฒนา พร้อมวางมาตรฐานใหม่ให้เครื่องมือ AI สำหรับการทำงานจริง

9 ความคิดเห็น

heim2 2026-02-06

ใช้ Max อยู่ ยิ่งใช้โทเคนเยอะก็ยิ่งรู้สึกอิ่มเอม... ถ้าไม่ใช้ก็เสียดาย...

duse0001 2026-02-06

ดูเหมือนว่าจะยังไม่ปรับใช้รายละเอียดการลดราคาที่ลือกันบนอินเทอร์เน็ตนะครับ เศร้า

wegaia 2026-02-06

ดูเหมือนว่าตอนนี้ใน Reddit มีโพสต์หลั่งไหลออกมาว่าคนที่สมัครสมาชิกใช้ลิมิตหมดกันอย่างรวดเร็วราวกับความเร็วแสงเลยนะครับ
ผมก็มีงานที่ทำค้างอยู่ด้วย เลยยังใช้ 4.5 ต่อไปอยู่

xguru 2026-02-06

ดูเหมือนว่าเขาจะแจกเครดิตใช้งานเพิ่มเติมมูลค่า 50 ดอลลาร์ในช่วงเวลาจำกัดด้วยนะครับ 555

duse0001 2026-02-06

ผมคาดว่าถ้าราคา API ลดลง วงเงินใช้งานรายสัปดาห์ก็น่าจะเพิ่มขึ้นตามธรรมชาติ เลยรู้สึกเสียดายนิดหน่อยครับ ฮือ แพลน 200 ดอลลาร์มีวงเงินรายสัปดาห์ที่ไม่ได้เหลือเฟือเท่าไร..

princox 2026-02-06

โห แพงไปหน่อยนะ.. Anthropic โปรยโทเคนมาหน่อยสิ..!!

hmmhmmhm 2026-02-06

โอ้ ในที่สุด~~~~