1 คะแนน โดย GN⁺ 1 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ตลอด 3 เดือนที่ผ่านมาได้เขียนโค้ดกับ Claude/Anthropic แต่เมื่อทำงานในระดับ repo ความน่าเชื่อถือลดลงจนต้องมีเวิร์กโฟลว์สำหรับคอยตรวจสอบแยกต่างหาก
  • ในช่วง 4.7 มีอาการหลอนว่าทำเสร็จแล้วทั้งที่การพัฒนาจริงมีเพียงราว 40% และแสดงความมั่นใจเกินจริงกับส่วนที่เป็น stub/placeholder
  • แม้จะจ่ายค่า Max x20 แต่สิ่งที่เพิ่มขึ้นมากกว่าประสิทธิภาพการทำงานคือ การใช้โทเค็น และภาระในการกำกับดูแล ก่อนจะเปลี่ยนไปใช้ GPT-5.5 + Codex ในวันที่ 12 พฤษภาคม
  • Codex เข้าใจ โค้ดข้างเคียง ได้ดีกว่าโดยไม่ต้องมีพรอมป์ตที่ยืดยาว จับ regression ได้ดีขึ้น ทำให้ลูป lint/test และการรีแฟกเตอร์ครั้งใหญ่จัดการได้จริง
  • การย้ายระบบจบลงเพียงแค่ย้าย CLAUDE.md→AGENTS.md และคง hooks เดิมไว้ และสำหรับเวิร์กโฟลว์นี้ก็ยังไม่คิดจะย้อนกลับไป

กระบวนการพัฒนาที่เปลี่ยนไปหลังย้ายจาก Claude ไป Codex

  • ตลอด 3 เดือนที่ผ่านมา ผู้เขียนเขียนโค้ดกับ Claude/Anthropic เป็นหลัก และตอนที่ Opus 4.6 ออกใหม่ ๆ ก็รู้สึกว่ามันเด่นเรื่องความเข้าใจสถาปัตยกรรม การจัดการคอนเท็กซ์ขนาดใหญ่ และการทำฟีเจอร์ได้รวดเร็ว
  • แต่เมื่อเวลาผ่านไป ความน่าเชื่อถือในการทำงานระดับ repo เริ่มลดลง และจำเป็นต้องมีเวิร์กโฟลว์แยกต่างหากเพื่อคอยเฝ้าดูโมเดล
    • เอเจนต์หลายตัวสำหรับตรวจ regression ของไฟล์ข้างเคียง
    • เอเจนต์ “senior reviewer” ที่แนบมากับทุกคอมมิตสำคัญ
    • การตรวจสอบต่อเนื่องเพื่อดู implementation drift และงานที่พัฒนาไม่เสร็จ
    • ไปป์ไลน์ lint/test สำหรับจับงานที่โมเดลพูดอย่างมั่นใจว่าทำเสร็จแล้ว
  • ในช่วง 4.7 ปัญหาในเวิร์กโฟลว์ส่วนตัวยิ่งหนักขึ้น
    • เกิดอาการหลอนว่าฟีเจอร์เสร็จแล้วทั้งที่การพัฒนาจริงอยู่เพียงราว 40%
    • แสดงความมั่นใจแบบไร้หลักฐานกับส่วนที่เป็น stub/placeholder
    • มีพฤติกรรมหลีกเลี่ยง เช่น บอกว่า “ต้องใช้เซสชันแยกต่างหาก” หรือประเมินตารางเวลาสูงเกินจริง ทั้งที่เป็นการเปลี่ยนแปลงที่ทำได้จริง
  • แม้จะจ่ายค่า Max x20 แต่สิ่งที่รู้สึกชัดกว่าการเพิ่มขึ้นของประสิทธิภาพคือ การใช้โทเค็นที่มากขึ้น และภาระในการกำกับดูแลที่เพิ่มขึ้น
  • สุดท้ายจึงเปลี่ยนไปใช้ GPT-5.5 + Codex ในวันที่ 12 พฤษภาคม และการเขียนโค้ดด้วย AI ก็กลับให้ความรู้สึกผ่อนคลายมากกว่าเครียดเป็นครั้งแรกในรอบหลายเดือน

ข้อดีที่สัมผัสได้จาก GPT-5.5 + Codex

  • Codex เข้าใจ โค้ดข้างเคียง ได้ดีแม้ไม่มีพรอมป์ตที่ยืดยาว และจับ regression ได้ดีกว่า
  • ลูปฟีดแบ็ก lint/test ทำงานได้แน่นขึ้น และ การรีแฟกเตอร์ขนาดใหญ่ ก็กลายเป็นสิ่งที่จัดการได้จริง
  • การตัดสินใจด้านอินฟราฯ และการเปลี่ยนสถาปัตยกรรมต่อเนื่องไปใน ทิศทางที่สอดคล้องกัน มากกว่าจะให้ความรู้สึกแตกเป็นชิ้น ๆ และมีแนวโน้มที่จะทำงานให้เสร็จจริงมากกว่าทำเหมือนว่าเสร็จแล้ว
  • ผู้เขียนมักเลี่ยง /fast เพราะดูเหมือนจะใช้โควตารายสัปดาห์หมดเร็ว แต่แค่ high/xhigh ก็ช่วยเพิ่มประสิทธิภาพได้มากแล้ว
  • หากใส่ zip ของทั้งรีโปเข้าไปใน GPT-5.5 Pro extended thinking ก็ช่วยแก้ปัญหาที่โมเดลอื่นล้มเหลวซ้ำ ๆ ได้
  • การย้ายระบบเองก็แทบไม่มีแรงเสียดทาน
    • CLAUDE.md ถูกย้ายเป็น AGENTS.md
    • hooks ใช้งานต่อได้เหมือนเดิม
    • เวิร์กโฟลว์โดยรวมแทบไม่ต้องเปลี่ยน
  • ทั้งหมดนี้ไม่ได้หมายความว่าทุกคนต้องรีบย้ายทันที แต่สำหรับเวิร์กโฟลว์นี้ ผู้เขียนยังไม่คิดจะย้อนกลับไปในช่วงนี้

1 ความคิดเห็น

 
GN⁺ 1 시간 전
ความคิดเห็นจาก Hacker News
  • เครื่องมือ AI ไม่ใช่อะไรที่ต้องเชียร์ข้างเดียวเหมือนเลือกทีมกีฬาที่ชอบ ใช้ให้เป็นทั้งสองเจ้า หรือถ้าเป็นไปได้ก็ให้ครบทุกเจ้า แล้วเลือกอันที่เหมาะสุดในสัปดาห์นั้นก็พอ
    เดือนหน้าอาจเปลี่ยนก็ได้ ฉันใช้ค่าสมาชิกอยู่สองเจ้า แต่ก็รู้ว่าไม่ใช่ทุกคนจะทำแบบนั้นได้

    • ตอนนี้บรรยากาศมันเป็นแบบนั้นจริง ๆ แต่โดยมากฉันคิดว่ามันมาจากนิสัยของมนุษย์ที่พอมีคนเลือกอย่างอื่น ก็รู้สึกเหมือนเขากำลังบอกว่าเราคิดผิด
      เครื่องมือพวกนี้ต่างก็โอเค และบางคนก็ได้ผลลัพธ์ที่ดีกว่าจากอีกฝั่งหนึ่ง อย่างที่บอกไว้ สัปดาห์หน้าอาจเปลี่ยนไปหมดเลยก็ได้
    • ฉันเองก็ไม่ติดว่าใครจะใช้ตัวไหน ถ้ามันเหมาะกับฉันในตอนนั้นก็พอ และฉันก็ยังคงทดสอบกับลองไปเรื่อย ๆ
    • ใช่เลย โมเดลเปลี่ยนตลอด วันนี้เป็น Anthropic พรุ่งนี้เป็น OpenAI แล้วก็กลับไป Anthropic อีก สัปดาห์หน้าก็อาจเป็นผู้ท้าชิงหน้าใหม่จากจีน เดือนหน้าบางที Google อาจตั้งหลักได้ วนแบบนี้ไปเรื่อย ๆ
    • ฉันลองใช้ Codex กับ Gemini มาประมาณสัปดาห์หนึ่งแล้ว และจนถึงตอนนี้ Codex เข้ากับฉันที่สุด
      แต่ฉันก็ใช้ Gemini ด้วย เพราะไปเจอคูปองพรีเมียม 18 เดือน 15€ จาก Kinguin ดังนั้นถ้าโควตาหมด งานบางส่วนก็จะโยนไปให้ Gemini
  • Opus 4.7 ให้ความรู้สึกว่าเน้นการทำตัวให้ดูมีประโยชน์และมีประสิทธิภาพ รวมถึงเน้นการโชว์ผลงาน
    ส่วน Codex ทำงานให้เสร็จจริง ๆ

  • อยากให้แชร์ workflow เพิ่มอีกหน่อย ว่าคุณทำอะไรและทำยังไง จะได้เรียนรู้แล้วลองทำตามบ้าง
    ฉันก็สงสัยเหมือนกันว่าทำไมถึงเอาทั้ง repository ใส่เข้า GPT และใช้เทคโนโลยีกับหนังสืออะไรบ้าง
    ฝั่งฉันคือใส่พรอมป์ต์แล้วรอให้ Codex ทำเสร็จ จากนั้นก็ต้องถามซ้ำว่ามันได้ทำงานชัด ๆ รอบข้างที่เมื่อก่อนฉันทำเองหรือยัง พอมันทำแล้ว ฉันก็ไปใช้เวลากับ /review และการทดสอบแบบ manual แล้วค่อยกลับไปแตกงานเป็นชิ้นเล็ก ๆ อีกที ถ้าเป็นฟีเจอร์ใหญ่ก็ใช้ plan และใช้ส่วนขยาย VSCode ด้วย ฉันลองทั้ง 5.4 กับ 5.5 แล้ว แต่รู้สึกว่าตัวแรกเข้ากับฉันมากกว่า

  • ถ้าที่นี่จะใช้ โมเดลที่ไม่ใช่ของ OpenAI ต้องทำยังไง?

  • ปัญหาของ Claude คือ มันไม่เดินหน้าทำงานต่อเนื่องแบบ Codex Claude อาจดีกว่าก็ได้ แต่ Codex พยายามทำงานให้เสร็จจนจบ
    ส่วน Claude แค่หยุดไปเฉย ๆ และถึงจะมีความสามารถแบบนั้นก็คงแพงเกินไป เลยไม่น่าต่างกันมาก อาจพอ ๆ กันหรือดีกว่าก็ได้ แต่ตอนนี้ฉันไม่ค่อยรู้แล้วและไม่ได้ใช้มันอยู่ 4.5 ดีที่สุดตอนเพิ่งออกมาใหม่ ๆ

  • ตอนฉันรู้สึกว่า Codex เหมือนเวทมนตร์ก็เป็นแบบนั้นเหมือนกัน แต่รอจนมันพังก่อนแล้วจะรู้เอง จนถึงเมื่อ 3 วันก่อนฉันก็ยังรู้สึกแบบนั้นอยู่ แต่ตอนนี้พูดตรง ๆ ว่ามันแย่กว่า Claude แล้ว
    ฉันใช้ บัญชี Pro 5 บัญชี เปิดตลอด 24 ชั่วโมง เลยพูดได้อย่างมั่นใจว่ามันไม่เหมือนเมื่อ 1 สัปดาห์ก่อน และตอนนี้แย่ลงมากจริง ๆ

    • Altman ยอมรับว่าเมื่อวันพฤหัสบดี/ศุกร์ สถานะของ Codex เละมาก และกำลังพยายามหาว่ามีอะไรเปลี่ยนไปบ้าง
    • มีการชะลอประสิทธิภาพเพราะ ปัญหาแคช และก็มีทวีตพูดถึงเรื่องนี้ ตอนนี้ rollback แล้วและบอกว่าประสิทธิภาพกลับสู่ baseline แล้ว
    • บัญชี Pro 5 บัญชี หมายถึงบัญชี Plus ใช่ไหม?