Anthropic เปิดตัว Claude 3.7 Sonnet
(anthropic.com)Anthropic ได้เปิดตัว Claude 3.7 Sonnet ซึ่งเป็นโมเดลที่ชาญฉลาดที่สุดของบริษัทจนถึงปัจจุบัน โมเดลนี้เป็นโมเดลให้เหตุผลแบบไฮบริดรายแรกในตลาด โดยสามารถให้ทั้งคำตอบได้ทันทีและแสดงกระบวนการคิดแบบเป็นลำดับขั้นให้ผู้ใช้เห็นได้
คุณสมบัติหลัก:
- มีการปรับปรุงประสิทธิภาพอย่างมากในงานเขียนโค้ดและการพัฒนาเว็บฝั่งฟรอนต์เอนด์
- เปิดตัวเครื่องมือบรรทัดคำสั่งใหม่ 'Claude Code' - ช่วยให้นักพัฒนาสามารถมอบหมายงานวิศวกรรมให้ Claude จัดการได้โดยตรงจากเทอร์มินัล
- ใช้งานได้บนทุกแพลนของ Claude (Free, Pro, Team, Enterprise) รวมถึง Anthropic API, AWS Bedrock และ Google Cloud Vertex AI
- โหมด extended thinking ใช้งานได้บนทุกแพลตฟอร์ม ยกเว้นระดับฟรี
- ราคาเท่าเดิมกับโมเดลก่อนหน้า: $3 ต่อ 1 ล้าน input token และ $15 ต่อ 1 ล้าน output token (รวม thinking token)
การปรับปรุงประสิทธิภาพ:
- ทำผลงานสูงสุดบน SWE-bench Verified และ TAU-bench
- ในการทดสอบระยะแรกจาก Cursor, Cognition, Vercel, Replit และ Canva ได้พิสูจน์ความสามารถที่โดดเด่นในการจัดการโค้ดเบสที่ซับซ้อน การใช้เครื่องมือขั้นสูง การวางแผนและแก้ไขโค้ด และการอัปเดตแบบฟูลสแตก
- แสดงความสามารถในการสร้างโค้ดระดับพร้อมใช้งานจริงและลดข้อผิดพลาด
- ปรับปรุงความสามารถด้านคณิตศาสตร์ ฟิสิกส์ และการทำตามคำสั่ง
Claude Code:
- สามารถค้นหาและอ่านโค้ด แก้ไขไฟล์ เขียนและรันทดสอบ commit และ push โค้ดไปยัง GitHub และใช้งานเครื่องมือบรรทัดคำสั่งได้
- มีประโยชน์อย่างยิ่งกับการพัฒนาแบบ test-driven การดีบักปัญหาซับซ้อน และการรีแฟกเตอร์ครั้งใหญ่
- สามารถทำงานที่ปกติกินเวลามากกว่า 45 นาทีให้เสร็จได้ในครั้งเดียว ช่วยลดเวลาพัฒนาอย่างมาก
- ขณะนี้เปิดให้ใช้งานในรูปแบบ research preview แบบจำกัด
การผสานรวมกับ GitHub:
- ตอนนี้ทุกแพลนของ Claude สามารถใช้ความสามารถในการผสานรวมกับ GitHub ได้แล้ว
- อาศัยความเข้าใจที่ลึกขึ้นเกี่ยวกับโปรเจกต์ส่วนตัว โปรเจกต์งาน และโอเพนซอร์ส
- ทำหน้าที่เป็นพาร์ตเนอร์ที่ทรงพลังในการแก้บั๊ก พัฒนาฟีเจอร์ และเขียนเอกสาร
- ให้การสนับสนุนครอบคลุมโปรเจกต์สำคัญบน GitHub ของผู้ใช้
ด้านการปรับปรุงความปลอดภัย เมื่อเทียบกับโมเดลก่อนหน้า การปฏิเสธคำขอที่ไม่จำเป็นลดลง 45% และสามารถแยกแยะระหว่างคำขอที่เป็นอันตรายกับคำขอที่ไม่เป็นอันตรายได้ละเอียดอ่อนยิ่งขึ้น
5 ความคิดเห็น
Dario Amodei ซีอีโอของ Anthropic: โมเดล DeepSeek ไม่ได้ทำให้น่าทึ่งขนาดนั้น
เหมือนว่าจะถูกเพิ่มเข้าไปใน Perplexity แล้วนะครับ
แต่ดูเหมือนว่ายังใช้การให้เหตุผลไม่ได้..
ผมลองติดตั้งและใช้งาน Claude Code ดู แล้วลองถามภาพรวมของสองโปรเจ็กต์เหมือนในวิดีโอ
Total cost: $0.1151
Total cost: $0.0855
ใช้ไปราว ๆ 0.2 ดอลลาร์เลยสินะ..?
ถ้าตัวอย่างในวิดีโอเป็นงานที่ใช้เวลามากกว่า 45 นาที ก็น่าจะกลายเป็นงานที่ค่อนข้างแพงทีเดียวครับ
แพงมาก คุ้มราคาไม่ค่อยได้เลย สำหรับการใช้งานจริงรู้สึกว่า o3-mini ยังดีกว่าเสียอีก แต่ถ้าจะใช้สำหรับงานโค้ดดิ้ง เพราะขั้นตอนการให้เหตุผลสั้นและต้องแก้ปัญหาโทเคนกลาง ๆ พอมองในแง่นั้นก็น่าจะดีที่สุดแล้ว เรื่องราคาก็..
โหมดการคิดแบบขยาย (Thinking Mode - Extended)
ดูเหมือนว่าจะเลือกแนวทางที่แตกต่างจากโมเดลให้เหตุผลแบบแยกต่างหากอย่าง o1 ของ OpenAI หรือ R1 ของ DeepSeek โดยน่าจะเป็นการรวมสองโหมดไว้ภายในโมเดลเดียว
นอกจากนี้ เมื่อถามโมเดลโดยตรงถึงวันที่ตัดข้อมูลการฝึก ก็ได้รับคำตอบว่าเป็นปลายเดือนตุลาคม 2024 ~!