Anthropic เปิดตัว Claude 3.7 Sonnet

(anthropic.com)

18 คะแนน โดย humblebee 2025-02-25 | 5 ความคิดเห็น | แชร์ทาง WhatsApp

Anthropic ได้เปิดตัว Claude 3.7 Sonnet ซึ่งเป็นโมเดลที่ชาญฉลาดที่สุดของบริษัทจนถึงปัจจุบัน โมเดลนี้เป็นโมเดลให้เหตุผลแบบไฮบริดรายแรกในตลาด โดยสามารถให้ทั้งคำตอบได้ทันทีและแสดงกระบวนการคิดแบบเป็นลำดับขั้นให้ผู้ใช้เห็นได้

คุณสมบัติหลัก:

มีการปรับปรุงประสิทธิภาพอย่างมากในงานเขียนโค้ดและการพัฒนาเว็บฝั่งฟรอนต์เอนด์
เปิดตัวเครื่องมือบรรทัดคำสั่งใหม่ 'Claude Code' - ช่วยให้นักพัฒนาสามารถมอบหมายงานวิศวกรรมให้ Claude จัดการได้โดยตรงจากเทอร์มินัล
ใช้งานได้บนทุกแพลนของ Claude (Free, Pro, Team, Enterprise) รวมถึง Anthropic API, AWS Bedrock และ Google Cloud Vertex AI
โหมด extended thinking ใช้งานได้บนทุกแพลตฟอร์ม ยกเว้นระดับฟรี
ราคาเท่าเดิมกับโมเดลก่อนหน้า: $3 ต่อ 1 ล้าน input token และ $15 ต่อ 1 ล้าน output token (รวม thinking token)

การปรับปรุงประสิทธิภาพ:

ทำผลงานสูงสุดบน SWE-bench Verified และ TAU-bench
ในการทดสอบระยะแรกจาก Cursor, Cognition, Vercel, Replit และ Canva ได้พิสูจน์ความสามารถที่โดดเด่นในการจัดการโค้ดเบสที่ซับซ้อน การใช้เครื่องมือขั้นสูง การวางแผนและแก้ไขโค้ด และการอัปเดตแบบฟูลสแตก
แสดงความสามารถในการสร้างโค้ดระดับพร้อมใช้งานจริงและลดข้อผิดพลาด
ปรับปรุงความสามารถด้านคณิตศาสตร์ ฟิสิกส์ และการทำตามคำสั่ง

Claude Code:

สามารถค้นหาและอ่านโค้ด แก้ไขไฟล์ เขียนและรันทดสอบ commit และ push โค้ดไปยัง GitHub และใช้งานเครื่องมือบรรทัดคำสั่งได้
มีประโยชน์อย่างยิ่งกับการพัฒนาแบบ test-driven การดีบักปัญหาซับซ้อน และการรีแฟกเตอร์ครั้งใหญ่
สามารถทำงานที่ปกติกินเวลามากกว่า 45 นาทีให้เสร็จได้ในครั้งเดียว ช่วยลดเวลาพัฒนาอย่างมาก
ขณะนี้เปิดให้ใช้งานในรูปแบบ research preview แบบจำกัด

การผสานรวมกับ GitHub:

ตอนนี้ทุกแพลนของ Claude สามารถใช้ความสามารถในการผสานรวมกับ GitHub ได้แล้ว
อาศัยความเข้าใจที่ลึกขึ้นเกี่ยวกับโปรเจกต์ส่วนตัว โปรเจกต์งาน และโอเพนซอร์ส
ทำหน้าที่เป็นพาร์ตเนอร์ที่ทรงพลังในการแก้บั๊ก พัฒนาฟีเจอร์ และเขียนเอกสาร
ให้การสนับสนุนครอบคลุมโปรเจกต์สำคัญบน GitHub ของผู้ใช้

ด้านการปรับปรุงความปลอดภัย เมื่อเทียบกับโมเดลก่อนหน้า การปฏิเสธคำขอที่ไม่จำเป็นลดลง 45% และสามารถแยกแยะระหว่างคำขอที่เป็นอันตรายกับคำขอที่ไม่เป็นอันตรายได้ละเอียดอ่อนยิ่งขึ้น

5 ความคิดเห็น

yeorinhieut 2025-02-25

Dario Amodei ซีอีโอของ Anthropic: โมเดล DeepSeek ไม่ได้ทำให้น่าทึ่งขนาดนั้น

yeorinhieut 2025-02-25

เหมือนว่าจะถูกเพิ่มเข้าไปใน Perplexity แล้วนะครับ
แต่ดูเหมือนว่ายังใช้การให้เหตุผลไม่ได้..

bearmett 2025-02-25

ผมลองติดตั้งและใช้งาน Claude Code ดู แล้วลองถามภาพรวมของสองโปรเจ็กต์เหมือนในวิดีโอ

Total cost: $0.1151
Total cost: $0.0855

ใช้ไปราว ๆ 0.2 ดอลลาร์เลยสินะ..?

ถ้าตัวอย่างในวิดีโอเป็นงานที่ใช้เวลามากกว่า 45 นาที ก็น่าจะกลายเป็นงานที่ค่อนข้างแพงทีเดียวครับ

riskatcher 2025-02-25

แพงมาก คุ้มราคาไม่ค่อยได้เลย สำหรับการใช้งานจริงรู้สึกว่า o3-mini ยังดีกว่าเสียอีก แต่ถ้าจะใช้สำหรับงานโค้ดดิ้ง เพราะขั้นตอนการให้เหตุผลสั้นและต้องแก้ปัญหาโทเคนกลาง ๆ พอมองในแง่นั้นก็น่าจะดีที่สุดแล้ว เรื่องราคาก็..

humblebee 2025-02-25

โหมดการคิดแบบขยาย (Thinking Mode - Extended)

ความสามารถที่ทำให้โมเดลคิดได้ลึกขึ้นผ่านการไตร่ตรองตนเองก่อนตอบ
ประสิทธิภาพดีขึ้นในงานหลากหลาย เช่น คณิตศาสตร์ ฟิสิกส์ การทำตามคำสั่ง และการเขียนโค้ด
ผู้ใช้ API สามารถควบคุมเวลาที่โมเดลใช้คิดได้สูงสุดถึง 128K โทเค็น
มอบความยืดหยุ่นในการปรับสมดุลระหว่างความเร็ว (ต้นทุน) และคุณภาพของคำตอบ
เช่นเดียวกับที่มนุษย์ใช้สมองเดียวกันทั้งสำหรับการตอบสนองอย่างรวดเร็วและการคิดอย่างลึกซึ้ง จึงมีทั้งสองโหมดอยู่ในโมเดลเดียวโดยไม่ต้องมีโมเดลแยก

ดูเหมือนว่าจะเลือกแนวทางที่แตกต่างจากโมเดลให้เหตุผลแบบแยกต่างหากอย่าง o1 ของ OpenAI หรือ R1 ของ DeepSeek โดยน่าจะเป็นการรวมสองโหมดไว้ภายในโมเดลเดียว

นอกจากนี้ เมื่อถามโมเดลโดยตรงถึงวันที่ตัดข้อมูลการฝึก ก็ได้รับคำตอบว่าเป็นปลายเดือนตุลาคม 2024 ~!

Anthropic เปิดตัว Claude 3.7 Sonnet

บทความที่เกี่ยวข้อง

5 ความคิดเห็น