Anthropic เปิดตัว Claude 4
(anthropic.com)Anthropic เปิดตัวซีรีส์ Claude 4 เมื่อวันที่ 23 พฤษภาคม 2025 รุ่นที่ประกาศครั้งนี้คือ Claude Opus 4 และ Claude Sonnet 4 ซึ่งเป็นโมเดลที่ปรับปรุงความสามารถด้านการเขียนโค้ดและการทำงานระยะยาวเมื่อเทียบกับเวอร์ชันก่อนหน้า โดยยังคงราคาเท่าเดิม
-
ความสามารถในการทำงานต่อเนื่อง
- ทำงานต่อเนื่อง 7 ชั่วโมง: ในการรีแฟกเตอร์โอเพนซอร์สที่ Rakuten ตรวจสอบ สามารถทำงานได้อย่างอิสระเป็นเวลา 7 ชั่วโมง
- จัดการงานซับซ้อนที่ต้องผ่านหลายพันขั้นตอนได้โดยไม่หยุดชะงัก
- ความต่อเนื่องในการทำงานก้าวข้ามข้อจำกัดของ AI agent แบบเดิมอย่างมาก
-
ระบบหน่วยความจำที่ดีขึ้น
- สร้างไฟล์หน่วยความจำอย่าง 'Navigation Guide' โดยอัตโนมัติ เพื่อเพิ่มการรับรู้บริบทของงานระยะยาว
- ใช้งานหน่วยความจำในทางปฏิบัติ เช่น เขียนคู่มือนำทางด้วยตนเองระหว่างเล่นเกม Pokémon
- พฤติกรรมการใช้ทางลัดหรือช่องโหว่ลดลง 65% เมื่อเทียบกับโมเดลก่อนหน้า
-
โมเดลการให้เหตุผลแบบไฮบริด
- โหมดตอบกลับทันที: สำหรับกรณีที่ต้องการคำตอบอย่างรวดเร็ว
- โหมดคิดแบบขยาย: ให้เหตุผลเชิงลึกได้สูงสุดถึง 64K โทเค็น
- สลับระหว่างสองโหมดโดยอัตโนมัติตามสถานการณ์
-
การใช้เครื่องมือ
- รันเครื่องมือแบบขนาน: ใช้หลายเครื่องมือพร้อมกันเพื่อเพิ่มประสิทธิภาพ
- ใช้เครื่องมือระหว่างการคิด: ใช้การค้นหาเว็บระหว่างกระบวนการให้เหตุผลเพื่อสร้างคำตอบที่แม่นยำยิ่งขึ้น
-
การปรับปรุงคุณภาพโค้ด
- การประเมินของ Block: "เป็นโมเดลแรกที่ปรับปรุงคุณภาพโค้ดระหว่างการแก้ไขและดีบัก"
- รายงานของ iGent: อัตราความผิดพลาดในการสำรวจโค้ดเบสลดจาก 20% เหลือเกือบ 0%
- Sourcegraph: คุณภาพโค้ดที่สละสลวยยิ่งขึ้นและความเข้าใจปัญหาที่ลึกกว่าเดิม
-
การผสาน Claude Code เข้ากับงานจริง
- ผสานกับ IDE โดยตรง: การเปลี่ยนแปลงโค้ดจะแสดงในเอดิเตอร์ทันที
- รองรับ GitHub PR: จัดการฟีดแบ็กจากผู้รีวิว PR อัตโนมัติ และแก้ไขข้อผิดพลาด CI
- งานเบื้องหลัง: รองรับระบบอัตโนมัติผ่าน GitHub Actions
- SDK ที่ขยายได้: นักพัฒนาสามารถสร้าง agent ของตนเองได้
-
ฟีเจอร์ใหม่ของ API
- เครื่องมือรันโค้ด
- ตัวเชื่อมต่อ MCP
- Files API
- การแคชพรอมป์ตได้นานสูงสุด 1 ชั่วโมง
-
ความปลอดภัย
- ใช้มาตรการป้องกัน ASL-3 (AI Safety Level 3)
- ความสามารถในการปฏิบัติตามคำสั่งที่ซับซ้อนดีขึ้น
- การทำงานที่มีความรับผิดชอบมากขึ้นเพื่อลดโอกาสการถูกนำไปใช้ในทางที่ผิด
2 ความคิดเห็น
มีเขียนไว้ว่าสามารถทำรีแฟกเตอร์ได้ต่อเนื่อง 7 ชั่วโมงโดยไม่หยุดนะครับ ถ้าคุณภาพใช้ได้ ก็น่าคาดหวังได้ถึงระดับงานเอาต์ซอร์สขั้นสูงที่นักพัฒนาฝากงานไว้หลังเลิกงาน แล้วมาค่อยตรวจทานในวันถัดไปได้เลย 😂
ก็จับประเด็นนี้มาใช้กัน เลยมีที่อย่าง Google ทดลองเบต้า coding agent แบบ Jules อยู่เหมือนกัน... โยนงานให้ AI แล้วมันก็ไปจัดการเองในสภาพแวดล้อมคลาวด์ ไม่ใช่บนเครื่องโลคัล แล้วค่อยมาดูผลทีหลังแล้วสั่งให้ commit, deploy อะไรต่อ