ถ้าตอบว่าไม่ ก็เป็น Ilbe กันหมดเลยเหรอ? ฉันเป็นคนคย็องซังโดนะ?

 

ทำแค่ 2 ชั่วโมงก็จะตาบอดสีแล้วล่ะ

 

ถ้าตั้งค่าไว้ด้วยฟีเจอร์อย่าง Gems ของ Gemini สำหรับบทบาทแบบทนายฝ่ายมาร ก็น่าจะสะดวกดีนะ

 

พอดู claude code ใน SWE-Bench-Pro daily benchmark (ชุดที่คัดมา) แล้วจะเห็นอะไรที่น่าสนใจ

ในช่วง 4/10~4/20 runtime ลดลงครึ่งหนึ่ง (653s→345s), tool call ลดลงครึ่งหนึ่ง (3.3K→1.8K), โทเค็นลดลง −18% แต่ pass rate กลับเพิ่มขึ้นอีก +16pp รูปแบบที่ทั้งสี่แกนขยับไปในทิศทางที่ดีพร้อมกันแบบนี้ไม่ใช่แพตเทิร์นที่เห็นกันบ่อย

postmortem วันที่ 4/23 คืออุบัติเหตุ 3 เคสที่เกิดขึ้นระหว่างกระบวนการนั้น ซึ่งพอดูแล้วทั้งหมดเกิดจาก "พยายามลดโทเค็น/latency"

ในทางกลับกัน codex(gpt-5.4-xhigh) ตัวเลขในช่วงเดียวกันแทบไม่ขยับเลย pass rate ตรึงอยู่แถว 56%, และโทเค็น/runtime/tool call ก็ยังอยู่ที่ระดับประมาณ 2 เท่าของ claude code เหมือนเดิม

 

แม้จะไม่มีใครใช้ แต่ผมก็กำลังพัฒนาไลบรารี npm คู่ใจของตัวเองอย่างขยันขันแข็งพร้อมทำ performance optimization อยู่
สมมติฐานที่เคยคิดไว้พอลองรัน benchmark ดูแล้ว สรุปได้ว่าส่วนใหญ่ใช้ไม่ได้ทั้งหมด เลยคงต้องลองให้ตัวนี้ช่วยดึงแนวทาง optimization เพิ่มเติมออกมาดูสักหน่อย

 

แทนที่จะบอกว่าควรทำ น่าจะเป็นประมาณว่าทำไว้ก็ดีกว่า~ มากกว่านะ

 

บนเว็บ claude.ai เองก็รู้สึกว่าการใช้งานแย่ลงแบบยิบย่อยเหมือนกัน... เพื่อประหยัดโทเค็นเลยปิดเมมโมรีไปแล้วครับ

 

พอเห็นประกาศนี้แล้วกลับยิ่งรู้สึกว่าเชื่อถือ Anthropic ไม่ได้มากขึ้นไปอีก

ด้านบนมีบทความที่เกี่ยวข้องอยู่ 2 ชิ้น ซึ่งเป็นบทความที่ห่างกัน 7 เดือน ปัญหาก็ยังเป็น 3 อย่างเดิมเหมือนกัน

การวิเคราะห์หลังเหตุการณ์ของ 3 ประเด็นคุณภาพของ Claude ที่ลดลงเมื่อไม่นานมานี้ 2025-09-19
อัปเดตเกี่ยวกับรายงานคุณภาพของ Claude Code ล่าสุด 2026-04-24

 

นี่ไม่ใช่โพสต์มอร์เท็มของเหตุขัดข้อง แต่เป็นโพสต์มอร์เท็มการลดต้นทุนหรือเปล่า?

 

นี่แหละคือคำตอบที่ถูกต้อง แต่ข้อแก้ตัวมันยาวไปหน่อย 555

 

เป็นการเขียนโค้ดลอยๆ แบบฉบับมาตรฐานเลย

 

ทำไมสาเหตุของเหตุขัดข้องทั้งสามอย่างถึงเกี่ยวข้องกับการลดต้นทุนโดยตรงทั้งหมดเลยล่ะ 55555
ดูท่าว่าทรัพยากร GPU จะขาดแคลนหนักจริง ๆ จนถึงขั้นทำให้ประสิทธิภาพลดลงแบบนี้เลยนะ.....

 

บังคับให้พนักงานภายในใช้บิลด์ที่เผยแพร่จริง เพื่อลดความเหลื่อมล้ำกับบิลด์สำหรับการทดสอบภายใน
ฮ่าๆๆๆ

 

ทันทีที่แพตช์ออก โควตา 5 ชั่วโมงที่ปกติต้องใช้ 3-4 ชั่วโมงกว่าจะหมด กลับเริ่มถูกใช้จนหมดภายใน 30 นาที แต่บัญชีพนักงานไม่มีโควตา 5 ชั่วโมงแบบนั้นอยู่แล้ว หรืออย่างน้อยก็ไม่ได้ขาดแคลนจนต้องคอยเปิดดู /usage ทุกครั้งระหว่างทำงาน ก็คงเลยใช้เวลานานพอสมควรกว่าจะสังเกตเห็น

 

น่าคาดหวังครับ...หวังว่าจะกลับมาทวงตำแหน่ง SOTA อีกครั้งและทำให้เกิดการแข่งขันกันขึ้น..