18 คะแนน โดย humblebee 2025-02-25 | 5 ความคิดเห็น | แชร์ทาง WhatsApp

Anthropic ได้เปิดตัว Claude 3.7 Sonnet ซึ่งเป็นโมเดลที่ชาญฉลาดที่สุดของบริษัทจนถึงปัจจุบัน โมเดลนี้เป็นโมเดลให้เหตุผลแบบไฮบริดรายแรกในตลาด โดยสามารถให้ทั้งคำตอบได้ทันทีและแสดงกระบวนการคิดแบบเป็นลำดับขั้นให้ผู้ใช้เห็นได้

คุณสมบัติหลัก:

  • มีการปรับปรุงประสิทธิภาพอย่างมากในงานเขียนโค้ดและการพัฒนาเว็บฝั่งฟรอนต์เอนด์
  • เปิดตัวเครื่องมือบรรทัดคำสั่งใหม่ 'Claude Code' - ช่วยให้นักพัฒนาสามารถมอบหมายงานวิศวกรรมให้ Claude จัดการได้โดยตรงจากเทอร์มินัล
  • ใช้งานได้บนทุกแพลนของ Claude (Free, Pro, Team, Enterprise) รวมถึง Anthropic API, AWS Bedrock และ Google Cloud Vertex AI
  • โหมด extended thinking ใช้งานได้บนทุกแพลตฟอร์ม ยกเว้นระดับฟรี
  • ราคาเท่าเดิมกับโมเดลก่อนหน้า: $3 ต่อ 1 ล้าน input token และ $15 ต่อ 1 ล้าน output token (รวม thinking token)

การปรับปรุงประสิทธิภาพ:

  • ทำผลงานสูงสุดบน SWE-bench Verified และ TAU-bench
  • ในการทดสอบระยะแรกจาก Cursor, Cognition, Vercel, Replit และ Canva ได้พิสูจน์ความสามารถที่โดดเด่นในการจัดการโค้ดเบสที่ซับซ้อน การใช้เครื่องมือขั้นสูง การวางแผนและแก้ไขโค้ด และการอัปเดตแบบฟูลสแตก
  • แสดงความสามารถในการสร้างโค้ดระดับพร้อมใช้งานจริงและลดข้อผิดพลาด
  • ปรับปรุงความสามารถด้านคณิตศาสตร์ ฟิสิกส์ และการทำตามคำสั่ง

Claude Code:

  • สามารถค้นหาและอ่านโค้ด แก้ไขไฟล์ เขียนและรันทดสอบ commit และ push โค้ดไปยัง GitHub และใช้งานเครื่องมือบรรทัดคำสั่งได้
  • มีประโยชน์อย่างยิ่งกับการพัฒนาแบบ test-driven การดีบักปัญหาซับซ้อน และการรีแฟกเตอร์ครั้งใหญ่
  • สามารถทำงานที่ปกติกินเวลามากกว่า 45 นาทีให้เสร็จได้ในครั้งเดียว ช่วยลดเวลาพัฒนาอย่างมาก
  • ขณะนี้เปิดให้ใช้งานในรูปแบบ research preview แบบจำกัด

การผสานรวมกับ GitHub:

  • ตอนนี้ทุกแพลนของ Claude สามารถใช้ความสามารถในการผสานรวมกับ GitHub ได้แล้ว
  • อาศัยความเข้าใจที่ลึกขึ้นเกี่ยวกับโปรเจกต์ส่วนตัว โปรเจกต์งาน และโอเพนซอร์ส
  • ทำหน้าที่เป็นพาร์ตเนอร์ที่ทรงพลังในการแก้บั๊ก พัฒนาฟีเจอร์ และเขียนเอกสาร
  • ให้การสนับสนุนครอบคลุมโปรเจกต์สำคัญบน GitHub ของผู้ใช้

ด้านการปรับปรุงความปลอดภัย เมื่อเทียบกับโมเดลก่อนหน้า การปฏิเสธคำขอที่ไม่จำเป็นลดลง 45% และสามารถแยกแยะระหว่างคำขอที่เป็นอันตรายกับคำขอที่ไม่เป็นอันตรายได้ละเอียดอ่อนยิ่งขึ้น

5 ความคิดเห็น

 
yeorinhieut 2025-02-25

เหมือนว่าจะถูกเพิ่มเข้าไปใน Perplexity แล้วนะครับ
แต่ดูเหมือนว่ายังใช้การให้เหตุผลไม่ได้..

 
bearmett 2025-02-25

ผมลองติดตั้งและใช้งาน Claude Code ดู แล้วลองถามภาพรวมของสองโปรเจ็กต์เหมือนในวิดีโอ

Total cost: $0.1151
Total cost: $0.0855

ใช้ไปราว ๆ 0.2 ดอลลาร์เลยสินะ..?

ถ้าตัวอย่างในวิดีโอเป็นงานที่ใช้เวลามากกว่า 45 นาที ก็น่าจะกลายเป็นงานที่ค่อนข้างแพงทีเดียวครับ

 
riskatcher 2025-02-25

แพงมาก คุ้มราคาไม่ค่อยได้เลย สำหรับการใช้งานจริงรู้สึกว่า o3-mini ยังดีกว่าเสียอีก แต่ถ้าจะใช้สำหรับงานโค้ดดิ้ง เพราะขั้นตอนการให้เหตุผลสั้นและต้องแก้ปัญหาโทเคนกลาง ๆ พอมองในแง่นั้นก็น่าจะดีที่สุดแล้ว เรื่องราคาก็..

 
humblebee 2025-02-25

โหมดการคิดแบบขยาย (Thinking Mode - Extended)

  • ความสามารถที่ทำให้โมเดลคิดได้ลึกขึ้นผ่านการไตร่ตรองตนเองก่อนตอบ
  • ประสิทธิภาพดีขึ้นในงานหลากหลาย เช่น คณิตศาสตร์ ฟิสิกส์ การทำตามคำสั่ง และการเขียนโค้ด
  • ผู้ใช้ API สามารถควบคุมเวลาที่โมเดลใช้คิดได้สูงสุดถึง 128K โทเค็น
  • มอบความยืดหยุ่นในการปรับสมดุลระหว่างความเร็ว (ต้นทุน) และคุณภาพของคำตอบ
  • เช่นเดียวกับที่มนุษย์ใช้สมองเดียวกันทั้งสำหรับการตอบสนองอย่างรวดเร็วและการคิดอย่างลึกซึ้ง จึงมีทั้งสองโหมดอยู่ในโมเดลเดียวโดยไม่ต้องมีโมเดลแยก

ดูเหมือนว่าจะเลือกแนวทางที่แตกต่างจากโมเดลให้เหตุผลแบบแยกต่างหากอย่าง o1 ของ OpenAI หรือ R1 ของ DeepSeek โดยน่าจะเป็นการรวมสองโหมดไว้ภายในโมเดลเดียว

นอกจากนี้ เมื่อถามโมเดลโดยตรงถึงวันที่ตัดข้อมูลการฝึก ก็ได้รับคำตอบว่าเป็นปลายเดือนตุลาคม 2024 ~!