19 คะแนน โดย humblebee 2025-05-23 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

Anthropic เปิดตัวซีรีส์ Claude 4 เมื่อวันที่ 23 พฤษภาคม 2025 รุ่นที่ประกาศครั้งนี้คือ Claude Opus 4 และ Claude Sonnet 4 ซึ่งเป็นโมเดลที่ปรับปรุงความสามารถด้านการเขียนโค้ดและการทำงานระยะยาวเมื่อเทียบกับเวอร์ชันก่อนหน้า โดยยังคงราคาเท่าเดิม

  1. ความสามารถในการทำงานต่อเนื่อง

    • ทำงานต่อเนื่อง 7 ชั่วโมง: ในการรีแฟกเตอร์โอเพนซอร์สที่ Rakuten ตรวจสอบ สามารถทำงานได้อย่างอิสระเป็นเวลา 7 ชั่วโมง
    • จัดการงานซับซ้อนที่ต้องผ่านหลายพันขั้นตอนได้โดยไม่หยุดชะงัก
    • ความต่อเนื่องในการทำงานก้าวข้ามข้อจำกัดของ AI agent แบบเดิมอย่างมาก
  2. ระบบหน่วยความจำที่ดีขึ้น

    • สร้างไฟล์หน่วยความจำอย่าง 'Navigation Guide' โดยอัตโนมัติ เพื่อเพิ่มการรับรู้บริบทของงานระยะยาว
    • ใช้งานหน่วยความจำในทางปฏิบัติ เช่น เขียนคู่มือนำทางด้วยตนเองระหว่างเล่นเกม Pokémon
    • พฤติกรรมการใช้ทางลัดหรือช่องโหว่ลดลง 65% เมื่อเทียบกับโมเดลก่อนหน้า
  3. โมเดลการให้เหตุผลแบบไฮบริด

    • โหมดตอบกลับทันที: สำหรับกรณีที่ต้องการคำตอบอย่างรวดเร็ว
    • โหมดคิดแบบขยาย: ให้เหตุผลเชิงลึกได้สูงสุดถึง 64K โทเค็น
    • สลับระหว่างสองโหมดโดยอัตโนมัติตามสถานการณ์
  4. การใช้เครื่องมือ

    • รันเครื่องมือแบบขนาน: ใช้หลายเครื่องมือพร้อมกันเพื่อเพิ่มประสิทธิภาพ
    • ใช้เครื่องมือระหว่างการคิด: ใช้การค้นหาเว็บระหว่างกระบวนการให้เหตุผลเพื่อสร้างคำตอบที่แม่นยำยิ่งขึ้น
  5. การปรับปรุงคุณภาพโค้ด

    • การประเมินของ Block: "เป็นโมเดลแรกที่ปรับปรุงคุณภาพโค้ดระหว่างการแก้ไขและดีบัก"
    • รายงานของ iGent: อัตราความผิดพลาดในการสำรวจโค้ดเบสลดจาก 20% เหลือเกือบ 0%
    • Sourcegraph: คุณภาพโค้ดที่สละสลวยยิ่งขึ้นและความเข้าใจปัญหาที่ลึกกว่าเดิม
  6. การผสาน Claude Code เข้ากับงานจริง

    • ผสานกับ IDE โดยตรง: การเปลี่ยนแปลงโค้ดจะแสดงในเอดิเตอร์ทันที
    • รองรับ GitHub PR: จัดการฟีดแบ็กจากผู้รีวิว PR อัตโนมัติ และแก้ไขข้อผิดพลาด CI
    • งานเบื้องหลัง: รองรับระบบอัตโนมัติผ่าน GitHub Actions
    • SDK ที่ขยายได้: นักพัฒนาสามารถสร้าง agent ของตนเองได้
  7. ฟีเจอร์ใหม่ของ API

    • เครื่องมือรันโค้ด
    • ตัวเชื่อมต่อ MCP
    • Files API
    • การแคชพรอมป์ตได้นานสูงสุด 1 ชั่วโมง
  8. ความปลอดภัย

    • ใช้มาตรการป้องกัน ASL-3 (AI Safety Level 3)
    • ความสามารถในการปฏิบัติตามคำสั่งที่ซับซ้อนดีขึ้น
    • การทำงานที่มีความรับผิดชอบมากขึ้นเพื่อลดโอกาสการถูกนำไปใช้ในทางที่ผิด

2 ความคิดเห็น

 
humblebee 2025-05-23

มีเขียนไว้ว่าสามารถทำรีแฟกเตอร์ได้ต่อเนื่อง 7 ชั่วโมงโดยไม่หยุดนะครับ ถ้าคุณภาพใช้ได้ ก็น่าคาดหวังได้ถึงระดับงานเอาต์ซอร์สขั้นสูงที่นักพัฒนาฝากงานไว้หลังเลิกงาน แล้วมาค่อยตรวจทานในวันถัดไปได้เลย 😂

 
sinbumu 2025-05-23

ก็จับประเด็นนี้มาใช้กัน เลยมีที่อย่าง Google ทดลองเบต้า coding agent แบบ Jules อยู่เหมือนกัน... โยนงานให้ AI แล้วมันก็ไปจัดการเองในสภาพแวดล้อมคลาวด์ ไม่ใช่บนเครื่องโลคัล แล้วค่อยมาดูผลทีหลังแล้วสั่งให้ commit, deploy อะไรต่อ