1 คะแนน โดย GN⁺ 2025-02-25 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

การประกาศ

  • มีการเปิดตัว Claude 3.7 Sonnet และ Claude Code โดย Claude 3.7 Sonnet เป็นโมเดลการให้เหตุผลแบบไฮบริดตัวแรกของตลาด ที่ให้ทั้งการตอบสนองที่รวดเร็วและการคิดเป็นลำดับขั้น ผู้ใช้ API สามารถปรับเวลาที่โมเดลใช้คิดได้อย่างละเอียด
  • Claude 3.7 Sonnet แสดงประสิทธิภาพที่แข็งแกร่งเป็นพิเศษในงานเขียนโค้ดและการพัฒนาเว็บฟรอนต์เอนด์ ส่วน Claude Code เป็นเครื่องมือบรรทัดคำสั่งที่สามารถมอบหมายงานวิศวกรรมได้โดยตรงจากเทอร์มินัล และเปิดให้ใช้ในรูปแบบ research preview แบบจำกัด
  • Claude 3.7 Sonnet ใช้งานได้บนทุกแพลนของ Claude รวมถึง Anthropic API, Amazon Bedrock และ Vertex AI ของ Google Cloud โดยโหมด extended thinking ใช้งานได้บนทุกแพลตฟอร์ม ยกเว้นชั้นฟรีของ Claude

Claude 3.7 Sonnet: การให้เหตุผลล้ำสมัยที่ใช้งานได้จริง

  • Claude 3.7 Sonnet ถูกพัฒนาขึ้นด้วยแนวคิดที่แตกต่างจากโมเดลการให้เหตุผลแบบเดิม โดยเชื่อว่าการให้เหตุผลควรเป็นความสามารถที่บูรณาการอยู่ในตัวเดียวกัน เหมือนที่มนุษย์ใช้สมองเดียวกันทั้งสำหรับการตอบสนองที่รวดเร็วและการไตร่ตรองอย่างลึกซึ้ง
  • Claude 3.7 Sonnet รวม LLM ทั่วไปและโมเดลการให้เหตุผลเข้าไว้ด้วยกัน ทำให้ผู้ใช้สามารถเลือกระหว่างการตอบแบบทั่วไปกับการคิดเชิงลึกได้ ในโหมด extended thinking ประสิทธิภาพจะดีขึ้นในด้านคณิตศาสตร์ ฟิสิกส์ การเขียนโค้ด และงานอื่น ๆ
  • เมื่อใช้งาน Claude 3.7 Sonnet ผ่าน API ผู้ใช้สามารถปรับ budget สำหรับการคิดได้ ซึ่งช่วยให้ควบคุมทั้งความเร็วและคุณภาพของคำตอบได้
  • Claude 3.7 Sonnet มุ่งเน้นกรณีการใช้งานทางธุรกิจจริง มากกว่าปัญหาคณิตศาสตร์และวิทยาการคอมพิวเตอร์ และจากการทดสอบเบื้องต้นพบว่าทำผลงานได้โดดเด่นในด้านความสามารถการเขียนโค้ด

Claude Code

  • Claude Code เป็นเครื่องมือที่ช่วยให้นักพัฒนาค้นหาโค้ด แก้ไขไฟล์ รันการทดสอบ รวมถึง commit และ push โค้ดไปยัง GitHub ได้
  • Claude Code มีประโยชน์เป็นพิเศษกับการพัฒนาแบบ test-driven development การดีบักปัญหาที่ซับซ้อน และการรีแฟกเตอร์ครั้งใหญ่ โดยจากการทดสอบเบื้องต้นช่วยลดเวลาในการพัฒนาได้อย่างมาก
  • เป้าหมายของ Claude Code คือทำความเข้าใจว่านักพัฒนาใช้งาน Claude อย่างไร เพื่อนำไปใช้ปรับปรุงโมเดลในอนาคต

ทำงานกับโค้ดเบสร่วมกับ Claude

  • ประสบการณ์การเขียนโค้ดบน Claude.ai ได้รับการปรับปรุง โดยการเชื่อมต่อ GitHub ใช้งานได้แล้วในทุกแพลนของ Claude ทำให้นักพัฒนาสามารถเชื่อม repository ของตนเข้ากับ Claude ได้โดยตรง
  • Claude 3.7 Sonnet กลายเป็นพาร์ตเนอร์ที่ทรงพลังในการแก้บั๊ก พัฒนาฟีเจอร์ และเขียนเอกสาร ด้วยความเข้าใจเชิงลึกต่อโปรเจกต์ส่วนตัว งานองค์กร และโอเพนซอร์ส

การพัฒนาอย่างมีความรับผิดชอบ

  • Claude 3.7 Sonnet ผ่านการทดสอบและประเมินผลอย่างกว้างขวางร่วมกับผู้เชี่ยวชาญภายนอก เพื่อรับประกันด้านความมั่นคงปลอดภัย ความปลอดภัย และความน่าเชื่อถือ
  • มีการเผยแพร่ system card ที่ครอบคลุมผลลัพธ์ด้านความปลอดภัยใหม่ ๆ ซึ่งรวมถึงการประเมินตามนโยบาย responsible scaling ที่ห้องปฏิบัติการ AI และนักวิจัยรายอื่นสามารถนำไปประยุกต์ใช้ได้

มุ่งสู่อนาคต

  • Claude 3.7 Sonnet และ Claude Code เป็นก้าวสำคัญสู่ระบบ AI ที่สามารถเสริมศักยภาพของมนุษย์ได้ โดยช่วยขยายขอบเขตความสำเร็จของมนุษย์ผ่านการให้เหตุผลเชิงลึก การทำงานแบบอัตโนมัติ และการทำงานร่วมกันอย่างมีประสิทธิภาพ
  • คาดหวังให้ผู้ใช้ได้สำรวจความสามารถใหม่ ๆ และสร้างสรรค์สิ่งใหม่ พร้อมยินดีรับฟัง feedback เพื่อการปรับปรุงอย่างต่อเนื่อง

2 ความคิดเห็น

 
GN⁺ 2025-02-25
ความคิดเห็นจาก Hacker News
  • Claude 3.7 Sonnet ทำได้ 60.4% บนกระดานจัดอันดับหลายภาษาของ Aider

    • ทำคะแนนได้สูงแม้ไม่ต้องใช้โหมดคิด และทำลายสถิติของ Sonnet 3.5
    • Aider 0.75.0 รองรับ 3.7 Sonnet แล้ว
    • เร็ว ๆ นี้จะมีการรองรับโหมดคิดและผลเบนช์มาร์กออกมา
  • Boris จากทีม Claude Code จะมาตอบคำถามเกี่ยวกับผลิตภัณฑ์

  • Kagi LLM benchmark อัปเดต Sonnet 3.7 ทั้งโหมดใช้งานทั่วไปและโหมดคิด

    • ถูกประเมินว่าเป็น LLM สำหรับงานทั่วไปที่ทรงพลังเป็นอันดับสอง รองจาก Gemini 2.0 pro
    • ในโหมดคิด อยู่ในระดับใกล้เคียงกับ o1-mini และ o3-mini
    • โดยรวมให้ทั้งคุณภาพสูงและความเร็วในราคาเท่าเดิม
    • จะเปิดใช้งานใน Kagi Assistant ภายใน 24 ชั่วโมง
  • มีฟีเจอร์สนุก ๆ ที่สามารถวิเคราะห์โปรไฟล์ HN ได้

    • กำลังใช้เพื่อทดสอบอารมณ์ขันของโมเดลใหม่
  • OpenAI กำลังโฟกัสกับวิธีที่ธุรกิจจริงใช้งาน LLM

    • ตั้งเป้าเป็น "โมเดลที่ฉลาดที่สุด" แต่ในการใช้งานจริง ส่วนใหญ่ถูกใช้เพื่อช่วยการเรียน แปลงข้อมูล และเขียนโค้ด
    • ความสมดุลระหว่าง "ความฉลาด" กับ "การใช้งานได้จริง" เป็นสิ่งสำคัญ
  • การที่ Anthropic มุ่งเน้นด้านโค้ดถือว่าสมเหตุสมผล

    • น่าสงสัยว่าคู่แข่งของ Devin จะออกมาเป็นอย่างไร
  • อัปเดต Cursor เป็นเวอร์ชันล่าสุดและเพิ่ม "claude-3.7-sonnet" เข้าไปในรายชื่อโมเดลแล้ว

    • "claude-3.7-sonnet-thinking" ก็ใช้งานได้เช่นกัน
    • เร็ว ๆ นี้จะมีฟีเจอร์ควบคุมเวลาในการคิดเพิ่มเข้ามา
  • ประทับใจมากกับการโต้ตอบครั้งแรกกับ Claude 3.7 Sonnet

    • ได้รับความช่วยเหลือในการแก้ปัญหาของ CloudFlare Pages Functions
    • Claude 3.7 ระบุปัญหาได้อย่างแม่นยำและเสนอวิธีแก้
  • Claude เขียนวิทยานิพนธ์ระดับปริญญาตรีใหม่ไปครึ่งหนึ่งภายใน 30 วินาที

    • Gemini Flash 2 ทำไม่สำเร็จ
  • o1 pro เคยแสดงผลงานที่น่าทึ่งอยู่หลายครั้ง

    • ได้รับความช่วยเหลือในการรีวิวโค้ด MCU ที่ซับซ้อน
    • o1 pro เข้าใจโค้ดที่ใช้ SPI และชี้จุดปัญหาได้
    • โหมดคิดของ Claude 3.7 ไม่ได้มีประโยชน์มากนัก
    • o1 pro ช่วยแก้ปัญหา IPsec VPN ได้
    • กำลังใช้งานโดยเปรียบเทียบระหว่าง ChatGPT กับ Claude
 
riskatcher 2025-02-25

แต่ถ้าจะเอาไปเทียบกับ flash 2 ส่วนต่างราคาก็มากเกินไปหน่อย.. อยู่ระดับกึ่งกลางพอดีระหว่าง o1pro กับ o3-mini