การประกาศ
- มีการเปิดตัว Claude 3.7 Sonnet และ Claude Code โดย Claude 3.7 Sonnet เป็นโมเดลการให้เหตุผลแบบไฮบริดตัวแรกของตลาด ที่ให้ทั้งการตอบสนองที่รวดเร็วและการคิดเป็นลำดับขั้น ผู้ใช้ API สามารถปรับเวลาที่โมเดลใช้คิดได้อย่างละเอียด
- Claude 3.7 Sonnet แสดงประสิทธิภาพที่แข็งแกร่งเป็นพิเศษในงานเขียนโค้ดและการพัฒนาเว็บฟรอนต์เอนด์ ส่วน Claude Code เป็นเครื่องมือบรรทัดคำสั่งที่สามารถมอบหมายงานวิศวกรรมได้โดยตรงจากเทอร์มินัล และเปิดให้ใช้ในรูปแบบ research preview แบบจำกัด
- Claude 3.7 Sonnet ใช้งานได้บนทุกแพลนของ Claude รวมถึง Anthropic API, Amazon Bedrock และ Vertex AI ของ Google Cloud โดยโหมด extended thinking ใช้งานได้บนทุกแพลตฟอร์ม ยกเว้นชั้นฟรีของ Claude
Claude 3.7 Sonnet: การให้เหตุผลล้ำสมัยที่ใช้งานได้จริง
- Claude 3.7 Sonnet ถูกพัฒนาขึ้นด้วยแนวคิดที่แตกต่างจากโมเดลการให้เหตุผลแบบเดิม โดยเชื่อว่าการให้เหตุผลควรเป็นความสามารถที่บูรณาการอยู่ในตัวเดียวกัน เหมือนที่มนุษย์ใช้สมองเดียวกันทั้งสำหรับการตอบสนองที่รวดเร็วและการไตร่ตรองอย่างลึกซึ้ง
- Claude 3.7 Sonnet รวม LLM ทั่วไปและโมเดลการให้เหตุผลเข้าไว้ด้วยกัน ทำให้ผู้ใช้สามารถเลือกระหว่างการตอบแบบทั่วไปกับการคิดเชิงลึกได้ ในโหมด extended thinking ประสิทธิภาพจะดีขึ้นในด้านคณิตศาสตร์ ฟิสิกส์ การเขียนโค้ด และงานอื่น ๆ
- เมื่อใช้งาน Claude 3.7 Sonnet ผ่าน API ผู้ใช้สามารถปรับ budget สำหรับการคิดได้ ซึ่งช่วยให้ควบคุมทั้งความเร็วและคุณภาพของคำตอบได้
- Claude 3.7 Sonnet มุ่งเน้นกรณีการใช้งานทางธุรกิจจริง มากกว่าปัญหาคณิตศาสตร์และวิทยาการคอมพิวเตอร์ และจากการทดสอบเบื้องต้นพบว่าทำผลงานได้โดดเด่นในด้านความสามารถการเขียนโค้ด
Claude Code
- Claude Code เป็นเครื่องมือที่ช่วยให้นักพัฒนาค้นหาโค้ด แก้ไขไฟล์ รันการทดสอบ รวมถึง commit และ push โค้ดไปยัง GitHub ได้
- Claude Code มีประโยชน์เป็นพิเศษกับการพัฒนาแบบ test-driven development การดีบักปัญหาที่ซับซ้อน และการรีแฟกเตอร์ครั้งใหญ่ โดยจากการทดสอบเบื้องต้นช่วยลดเวลาในการพัฒนาได้อย่างมาก
- เป้าหมายของ Claude Code คือทำความเข้าใจว่านักพัฒนาใช้งาน Claude อย่างไร เพื่อนำไปใช้ปรับปรุงโมเดลในอนาคต
ทำงานกับโค้ดเบสร่วมกับ Claude
- ประสบการณ์การเขียนโค้ดบน Claude.ai ได้รับการปรับปรุง โดยการเชื่อมต่อ GitHub ใช้งานได้แล้วในทุกแพลนของ Claude ทำให้นักพัฒนาสามารถเชื่อม repository ของตนเข้ากับ Claude ได้โดยตรง
- Claude 3.7 Sonnet กลายเป็นพาร์ตเนอร์ที่ทรงพลังในการแก้บั๊ก พัฒนาฟีเจอร์ และเขียนเอกสาร ด้วยความเข้าใจเชิงลึกต่อโปรเจกต์ส่วนตัว งานองค์กร และโอเพนซอร์ส
การพัฒนาอย่างมีความรับผิดชอบ
- Claude 3.7 Sonnet ผ่านการทดสอบและประเมินผลอย่างกว้างขวางร่วมกับผู้เชี่ยวชาญภายนอก เพื่อรับประกันด้านความมั่นคงปลอดภัย ความปลอดภัย และความน่าเชื่อถือ
- มีการเผยแพร่ system card ที่ครอบคลุมผลลัพธ์ด้านความปลอดภัยใหม่ ๆ ซึ่งรวมถึงการประเมินตามนโยบาย responsible scaling ที่ห้องปฏิบัติการ AI และนักวิจัยรายอื่นสามารถนำไปประยุกต์ใช้ได้
มุ่งสู่อนาคต
- Claude 3.7 Sonnet และ Claude Code เป็นก้าวสำคัญสู่ระบบ AI ที่สามารถเสริมศักยภาพของมนุษย์ได้ โดยช่วยขยายขอบเขตความสำเร็จของมนุษย์ผ่านการให้เหตุผลเชิงลึก การทำงานแบบอัตโนมัติ และการทำงานร่วมกันอย่างมีประสิทธิภาพ
- คาดหวังให้ผู้ใช้ได้สำรวจความสามารถใหม่ ๆ และสร้างสรรค์สิ่งใหม่ พร้อมยินดีรับฟัง feedback เพื่อการปรับปรุงอย่างต่อเนื่อง
2 ความคิดเห็น
ความคิดเห็นจาก Hacker News
Claude 3.7 Sonnet ทำได้ 60.4% บนกระดานจัดอันดับหลายภาษาของ Aider
Boris จากทีม Claude Code จะมาตอบคำถามเกี่ยวกับผลิตภัณฑ์
Kagi LLM benchmark อัปเดต Sonnet 3.7 ทั้งโหมดใช้งานทั่วไปและโหมดคิด
มีฟีเจอร์สนุก ๆ ที่สามารถวิเคราะห์โปรไฟล์ HN ได้
OpenAI กำลังโฟกัสกับวิธีที่ธุรกิจจริงใช้งาน LLM
การที่ Anthropic มุ่งเน้นด้านโค้ดถือว่าสมเหตุสมผล
อัปเดต Cursor เป็นเวอร์ชันล่าสุดและเพิ่ม "claude-3.7-sonnet" เข้าไปในรายชื่อโมเดลแล้ว
ประทับใจมากกับการโต้ตอบครั้งแรกกับ Claude 3.7 Sonnet
Claude เขียนวิทยานิพนธ์ระดับปริญญาตรีใหม่ไปครึ่งหนึ่งภายใน 30 วินาที
o1 pro เคยแสดงผลงานที่น่าทึ่งอยู่หลายครั้ง
แต่ถ้าจะเอาไปเทียบกับ flash 2 ส่วนต่างราคาก็มากเกินไปหน่อย.. อยู่ระดับกึ่งกลางพอดีระหว่าง o1pro กับ o3-mini