alfenmage 6 일 전 | ความคิดเห็นหลัก | ใน: จำเป็นต้องมีฐานข้อมูลจริงหรือ (dbpro.app) ถ้าตอบว่าไม่ ก็เป็น Ilbe กันหมดเลยเหรอ? ฉันเป็นคนคย็องซังโดนะ? tangokorea 6 일 전 | ความคิดเห็นหลัก | ใน: โปรแกรมแก้ไขฐานสิบหกควรแสดงไบต์ด้วยการแยกสี (simonomi.dev) ทำแค่ 2 ชั่วโมงก็จะตาบอดสีแล้วล่ะ shintwl 6 일 전 | ความคิดเห็นหลัก | ใน: 7 งานนอกกรอบที่ทำได้ด้วย LLM (kdnuggets.com) ถ้าตั้งค่าไว้ด้วยฟีเจอร์อย่าง Gems ของ Gemini สำหรับบทบาทแบบทนายฝ่ายมาร ก็น่าจะสะดวกดีนะ amond 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) พอดู claude code ใน SWE-Bench-Pro daily benchmark (ชุดที่คัดมา) แล้วจะเห็นอะไรที่น่าสนใจ ในช่วง 4/10~4/20 runtime ลดลงครึ่งหนึ่ง (653s→345s), tool call ลดลงครึ่งหนึ่ง (3.3K→1.8K), โทเค็นลดลง −18% แต่ pass rate กลับเพิ่มขึ้นอีก +16pp รูปแบบที่ทั้งสี่แกนขยับไปในทิศทางที่ดีพร้อมกันแบบนี้ไม่ใช่แพตเทิร์นที่เห็นกันบ่อย postmortem วันที่ 4/23 คืออุบัติเหตุ 3 เคสที่เกิดขึ้นระหว่างกระบวนการนั้น ซึ่งพอดูแล้วทั้งหมดเกิดจาก "พยายามลดโทเค็น/latency" ในทางกลับกัน codex(gpt-5.4-xhigh) ตัวเลขในช่วงเดียวกันแทบไม่ขยับเลย pass rate ตรึงอยู่แถว 56%, และโทเค็น/runtime/tool call ก็ยังอยู่ที่ระดับประมาณ 2 เท่าของ claude code เหมือนเดิม click 6 일 전 | ความคิดเห็นหลัก | ใน: OpenAI เปิดตัว GPT-5.5: "ความฉลาดอีกระดับใหม่สำหรับงานจริง" (openai.com) แม้จะไม่มีใครใช้ แต่ผมก็กำลังพัฒนาไลบรารี npm คู่ใจของตัวเองอย่างขยันขันแข็งพร้อมทำ performance optimization อยู่ สมมติฐานที่เคยคิดไว้พอลองรัน benchmark ดูแล้ว สรุปได้ว่าส่วนใหญ่ใช้ไม่ได้ทั้งหมด เลยคงต้องลองให้ตัวนี้ช่วยดึงแนวทาง optimization เพิ่มเติมออกมาดูสักหน่อย skageektp 6 일 전 | ความคิดเห็นหลัก | ใน: โปรแกรมแก้ไขฐานสิบหกควรแสดงไบต์ด้วยการแยกสี (simonomi.dev) แทนที่จะบอกว่าควรทำ น่าจะเป็นประมาณว่าทำไว้ก็ดีกว่า~ มากกว่านะ unsure4000 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) บนเว็บ claude.ai เองก็รู้สึกว่าการใช้งานแย่ลงแบบยิบย่อยเหมือนกัน... เพื่อประหยัดโทเค็นเลยปิดเมมโมรีไปแล้วครับ xguru 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) พอเห็นประกาศนี้แล้วกลับยิ่งรู้สึกว่าเชื่อถือ Anthropic ไม่ได้มากขึ้นไปอีก ด้านบนมีบทความที่เกี่ยวข้องอยู่ 2 ชิ้น ซึ่งเป็นบทความที่ห่างกัน 7 เดือน ปัญหาก็ยังเป็น 3 อย่างเดิมเหมือนกัน การวิเคราะห์หลังเหตุการณ์ของ 3 ประเด็นคุณภาพของ Claude ที่ลดลงเมื่อไม่นานมานี้ 2025-09-19 อัปเดตเกี่ยวกับรายงานคุณภาพของ Claude Code ล่าสุด 2026-04-24 colus001 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) นี่ไม่ใช่โพสต์มอร์เท็มของเหตุขัดข้อง แต่เป็นโพสต์มอร์เท็มการลดต้นทุนหรือเปล่า? colus001 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) นี่แหละคือคำตอบที่ถูกต้อง แต่ข้อแก้ตัวมันยาวไปหน่อย 555 skageektp 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) ฉันโกรธถึงระดับ $5 เครดิตเลย!! kaydash 6 일 전 | ความคิดเห็นหลัก | ใน: OpenAI เปิดตัว GPT-5.5: "ความฉลาดอีกระดับใหม่สำหรับงานจริง" (openai.com) opus4.6 นี่.. myc0058 6 일 전 | ความคิดเห็นหลัก | ใน: จำเป็นต้องมีฐานข้อมูลจริงหรือ (dbpro.app) เป็นการเขียนโค้ดลอยๆ แบบฉบับมาตรฐานเลย crawler 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) ทำไมสาเหตุของเหตุขัดข้องทั้งสามอย่างถึงเกี่ยวข้องกับการลดต้นทุนโดยตรงทั้งหมดเลยล่ะ 55555 ดูท่าว่าทรัพยากร GPU จะขาดแคลนหนักจริง ๆ จนถึงขั้นทำให้ประสิทธิภาพลดลงแบบนี้เลยนะ..... sudoeng 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) บังคับให้พนักงานภายในใช้บิลด์ที่เผยแพร่จริง เพื่อลดความเหลื่อมล้ำกับบิลด์สำหรับการทดสอบภายใน ฮ่าๆๆๆ brainer 6 일 전 | ความคิดเห็นหลัก | ใน: OpenAI เปิดตัว GPT-5.5: "ความฉลาดอีกระดับใหม่สำหรับงานจริง" (openai.com) เลิกตามหาตำแหน่ง SOTA มานานแล้ว.. ragingwind 6 일 전 | ความคิดเห็นหลัก | ใน: GStack: แนะนำบน YouTube เกี่ยวกับเฟรมเวิร์กเอเจนต์เขียนโค้ด AI ที่สร้างโดย CEO ของ Y Combinator (youtube.com) เครื่องมือที่ใช้ในวิดีโอ https://www.conductor.build/ youknowone 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) ทันทีที่แพตช์ออก โควตา 5 ชั่วโมงที่ปกติต้องใช้ 3-4 ชั่วโมงกว่าจะหมด กลับเริ่มถูกใช้จนหมดภายใน 30 นาที แต่บัญชีพนักงานไม่มีโควตา 5 ชั่วโมงแบบนั้นอยู่แล้ว หรืออย่างน้อยก็ไม่ได้ขาดแคลนจนต้องคอยเปิดดู /usage ทุกครั้งระหว่างทำงาน ก็คงเลยใช้เวลานานพอสมควรกว่าจะสังเกตเห็น wedding 6 일 전 | ความคิดเห็นหลัก | ใน: โพสต์มอร์เทมเหตุขัดข้องของ Claude Code จาก Anthropic: 23 เมษายน 2025 (anthropic.com) พูดยืดยาวจัง.. wedding 6 일 전 | ความคิดเห็นหลัก | ใน: OpenAI เปิดตัว GPT-5.5: "ความฉลาดอีกระดับใหม่สำหรับงานจริง" (openai.com) น่าคาดหวังครับ...หวังว่าจะกลับมาทวงตำแหน่ง SOTA อีกครั้งและทำให้เกิดการแข่งขันกันขึ้น.. โหลดความคิดเห็นเพิ่มเติม
ถ้าตอบว่าไม่ ก็เป็น Ilbe กันหมดเลยเหรอ? ฉันเป็นคนคย็องซังโดนะ?
ทำแค่ 2 ชั่วโมงก็จะตาบอดสีแล้วล่ะ
ถ้าตั้งค่าไว้ด้วยฟีเจอร์อย่าง Gems ของ Gemini สำหรับบทบาทแบบทนายฝ่ายมาร ก็น่าจะสะดวกดีนะ
พอดู
claude codeใน SWE-Bench-Pro daily benchmark (ชุดที่คัดมา) แล้วจะเห็นอะไรที่น่าสนใจในช่วง 4/10~4/20 runtime ลดลงครึ่งหนึ่ง (653s→345s), tool call ลดลงครึ่งหนึ่ง (3.3K→1.8K), โทเค็นลดลง −18% แต่ pass rate กลับเพิ่มขึ้นอีก +16pp รูปแบบที่ทั้งสี่แกนขยับไปในทิศทางที่ดีพร้อมกันแบบนี้ไม่ใช่แพตเทิร์นที่เห็นกันบ่อย
postmortem วันที่ 4/23 คืออุบัติเหตุ 3 เคสที่เกิดขึ้นระหว่างกระบวนการนั้น ซึ่งพอดูแล้วทั้งหมดเกิดจาก "พยายามลดโทเค็น/latency"
ในทางกลับกัน codex(gpt-5.4-xhigh) ตัวเลขในช่วงเดียวกันแทบไม่ขยับเลย pass rate ตรึงอยู่แถว 56%, และโทเค็น/runtime/tool call ก็ยังอยู่ที่ระดับประมาณ 2 เท่าของ
claude codeเหมือนเดิมแม้จะไม่มีใครใช้ แต่ผมก็กำลังพัฒนาไลบรารี npm คู่ใจของตัวเองอย่างขยันขันแข็งพร้อมทำ performance optimization อยู่
สมมติฐานที่เคยคิดไว้พอลองรัน benchmark ดูแล้ว สรุปได้ว่าส่วนใหญ่ใช้ไม่ได้ทั้งหมด เลยคงต้องลองให้ตัวนี้ช่วยดึงแนวทาง optimization เพิ่มเติมออกมาดูสักหน่อย
แทนที่จะบอกว่าควรทำ น่าจะเป็นประมาณว่าทำไว้ก็ดีกว่า~ มากกว่านะ
บนเว็บ claude.ai เองก็รู้สึกว่าการใช้งานแย่ลงแบบยิบย่อยเหมือนกัน... เพื่อประหยัดโทเค็นเลยปิดเมมโมรีไปแล้วครับ
พอเห็นประกาศนี้แล้วกลับยิ่งรู้สึกว่าเชื่อถือ Anthropic ไม่ได้มากขึ้นไปอีก
ด้านบนมีบทความที่เกี่ยวข้องอยู่ 2 ชิ้น ซึ่งเป็นบทความที่ห่างกัน 7 เดือน ปัญหาก็ยังเป็น 3 อย่างเดิมเหมือนกัน
การวิเคราะห์หลังเหตุการณ์ของ 3 ประเด็นคุณภาพของ Claude ที่ลดลงเมื่อไม่นานมานี้ 2025-09-19
อัปเดตเกี่ยวกับรายงานคุณภาพของ Claude Code ล่าสุด 2026-04-24
นี่ไม่ใช่โพสต์มอร์เท็มของเหตุขัดข้อง แต่เป็นโพสต์มอร์เท็มการลดต้นทุนหรือเปล่า?
นี่แหละคือคำตอบที่ถูกต้อง แต่ข้อแก้ตัวมันยาวไปหน่อย 555
ฉันโกรธถึงระดับ $5 เครดิตเลย!!
opus4.6 นี่..
เป็นการเขียนโค้ดลอยๆ แบบฉบับมาตรฐานเลย
ทำไมสาเหตุของเหตุขัดข้องทั้งสามอย่างถึงเกี่ยวข้องกับการลดต้นทุนโดยตรงทั้งหมดเลยล่ะ 55555
ดูท่าว่าทรัพยากร GPU จะขาดแคลนหนักจริง ๆ จนถึงขั้นทำให้ประสิทธิภาพลดลงแบบนี้เลยนะ.....
บังคับให้พนักงานภายในใช้บิลด์ที่เผยแพร่จริง เพื่อลดความเหลื่อมล้ำกับบิลด์สำหรับการทดสอบภายใน
ฮ่าๆๆๆ
เลิกตามหาตำแหน่ง SOTA มานานแล้ว..
เครื่องมือที่ใช้ในวิดีโอ https://www.conductor.build/
ทันทีที่แพตช์ออก โควตา 5 ชั่วโมงที่ปกติต้องใช้ 3-4 ชั่วโมงกว่าจะหมด กลับเริ่มถูกใช้จนหมดภายใน 30 นาที แต่บัญชีพนักงานไม่มีโควตา 5 ชั่วโมงแบบนั้นอยู่แล้ว หรืออย่างน้อยก็ไม่ได้ขาดแคลนจนต้องคอยเปิดดู
/usageทุกครั้งระหว่างทำงาน ก็คงเลยใช้เวลานานพอสมควรกว่าจะสังเกตเห็นพูดยืดยาวจัง..
น่าคาดหวังครับ...หวังว่าจะกลับมาทวงตำแหน่ง SOTA อีกครั้งและทำให้เกิดการแข่งขันกันขึ้น..