หลังจากต่อสู้กับ Claude มาหลายเดือน Codex ก็ให้ความรู้สึกราวกับเป็นความฝันของสาย vibe coder
(reddit.com)- ตลอด 3 เดือนที่ผ่านมาได้เขียนโค้ดกับ Claude/Anthropic แต่เมื่อทำงานในระดับ repo ความน่าเชื่อถือลดลงจนต้องมีเวิร์กโฟลว์สำหรับคอยตรวจสอบแยกต่างหาก
- ในช่วง 4.7 มีอาการหลอนว่าทำเสร็จแล้วทั้งที่การพัฒนาจริงมีเพียงราว 40% และแสดงความมั่นใจเกินจริงกับส่วนที่เป็น stub/placeholder
- แม้จะจ่ายค่า Max x20 แต่สิ่งที่เพิ่มขึ้นมากกว่าประสิทธิภาพการทำงานคือ การใช้โทเค็น และภาระในการกำกับดูแล ก่อนจะเปลี่ยนไปใช้ GPT-5.5 + Codex ในวันที่ 12 พฤษภาคม
- Codex เข้าใจ โค้ดข้างเคียง ได้ดีกว่าโดยไม่ต้องมีพรอมป์ตที่ยืดยาว จับ regression ได้ดีขึ้น ทำให้ลูป lint/test และการรีแฟกเตอร์ครั้งใหญ่จัดการได้จริง
- การย้ายระบบจบลงเพียงแค่ย้าย CLAUDE.md→AGENTS.md และคง hooks เดิมไว้ และสำหรับเวิร์กโฟลว์นี้ก็ยังไม่คิดจะย้อนกลับไป
กระบวนการพัฒนาที่เปลี่ยนไปหลังย้ายจาก Claude ไป Codex
- ตลอด 3 เดือนที่ผ่านมา ผู้เขียนเขียนโค้ดกับ Claude/Anthropic เป็นหลัก และตอนที่ Opus 4.6 ออกใหม่ ๆ ก็รู้สึกว่ามันเด่นเรื่องความเข้าใจสถาปัตยกรรม การจัดการคอนเท็กซ์ขนาดใหญ่ และการทำฟีเจอร์ได้รวดเร็ว
- แต่เมื่อเวลาผ่านไป ความน่าเชื่อถือในการทำงานระดับ repo เริ่มลดลง และจำเป็นต้องมีเวิร์กโฟลว์แยกต่างหากเพื่อคอยเฝ้าดูโมเดล
- เอเจนต์หลายตัวสำหรับตรวจ regression ของไฟล์ข้างเคียง
- เอเจนต์ “senior reviewer” ที่แนบมากับทุกคอมมิตสำคัญ
- การตรวจสอบต่อเนื่องเพื่อดู implementation drift และงานที่พัฒนาไม่เสร็จ
- ไปป์ไลน์ lint/test สำหรับจับงานที่โมเดลพูดอย่างมั่นใจว่าทำเสร็จแล้ว
- ในช่วง 4.7 ปัญหาในเวิร์กโฟลว์ส่วนตัวยิ่งหนักขึ้น
- เกิดอาการหลอนว่าฟีเจอร์เสร็จแล้วทั้งที่การพัฒนาจริงอยู่เพียงราว 40%
- แสดงความมั่นใจแบบไร้หลักฐานกับส่วนที่เป็น stub/placeholder
- มีพฤติกรรมหลีกเลี่ยง เช่น บอกว่า “ต้องใช้เซสชันแยกต่างหาก” หรือประเมินตารางเวลาสูงเกินจริง ทั้งที่เป็นการเปลี่ยนแปลงที่ทำได้จริง
- แม้จะจ่ายค่า Max x20 แต่สิ่งที่รู้สึกชัดกว่าการเพิ่มขึ้นของประสิทธิภาพคือ การใช้โทเค็นที่มากขึ้น และภาระในการกำกับดูแลที่เพิ่มขึ้น
- สุดท้ายจึงเปลี่ยนไปใช้ GPT-5.5 + Codex ในวันที่ 12 พฤษภาคม และการเขียนโค้ดด้วย AI ก็กลับให้ความรู้สึกผ่อนคลายมากกว่าเครียดเป็นครั้งแรกในรอบหลายเดือน
ข้อดีที่สัมผัสได้จาก GPT-5.5 + Codex
- Codex เข้าใจ โค้ดข้างเคียง ได้ดีแม้ไม่มีพรอมป์ตที่ยืดยาว และจับ regression ได้ดีกว่า
- ลูปฟีดแบ็ก lint/test ทำงานได้แน่นขึ้น และ การรีแฟกเตอร์ขนาดใหญ่ ก็กลายเป็นสิ่งที่จัดการได้จริง
- การตัดสินใจด้านอินฟราฯ และการเปลี่ยนสถาปัตยกรรมต่อเนื่องไปใน ทิศทางที่สอดคล้องกัน มากกว่าจะให้ความรู้สึกแตกเป็นชิ้น ๆ และมีแนวโน้มที่จะทำงานให้เสร็จจริงมากกว่าทำเหมือนว่าเสร็จแล้ว
- ผู้เขียนมักเลี่ยง
/fastเพราะดูเหมือนจะใช้โควตารายสัปดาห์หมดเร็ว แต่แค่ high/xhigh ก็ช่วยเพิ่มประสิทธิภาพได้มากแล้ว - หากใส่ zip ของทั้งรีโปเข้าไปใน GPT-5.5 Pro extended thinking ก็ช่วยแก้ปัญหาที่โมเดลอื่นล้มเหลวซ้ำ ๆ ได้
- การย้ายระบบเองก็แทบไม่มีแรงเสียดทาน
- ทั้งหมดนี้ไม่ได้หมายความว่าทุกคนต้องรีบย้ายทันที แต่สำหรับเวิร์กโฟลว์นี้ ผู้เขียนยังไม่คิดจะย้อนกลับไปในช่วงนี้
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
เครื่องมือ AI ไม่ใช่อะไรที่ต้องเชียร์ข้างเดียวเหมือนเลือกทีมกีฬาที่ชอบ ใช้ให้เป็นทั้งสองเจ้า หรือถ้าเป็นไปได้ก็ให้ครบทุกเจ้า แล้วเลือกอันที่เหมาะสุดในสัปดาห์นั้นก็พอ
เดือนหน้าอาจเปลี่ยนก็ได้ ฉันใช้ค่าสมาชิกอยู่สองเจ้า แต่ก็รู้ว่าไม่ใช่ทุกคนจะทำแบบนั้นได้
เครื่องมือพวกนี้ต่างก็โอเค และบางคนก็ได้ผลลัพธ์ที่ดีกว่าจากอีกฝั่งหนึ่ง อย่างที่บอกไว้ สัปดาห์หน้าอาจเปลี่ยนไปหมดเลยก็ได้
แต่ฉันก็ใช้ Gemini ด้วย เพราะไปเจอคูปองพรีเมียม 18 เดือน 15€ จาก Kinguin ดังนั้นถ้าโควตาหมด งานบางส่วนก็จะโยนไปให้ Gemini
Opus 4.7 ให้ความรู้สึกว่าเน้นการทำตัวให้ดูมีประโยชน์และมีประสิทธิภาพ รวมถึงเน้นการโชว์ผลงาน
ส่วน Codex ทำงานให้เสร็จจริง ๆ
อยากให้แชร์ workflow เพิ่มอีกหน่อย ว่าคุณทำอะไรและทำยังไง จะได้เรียนรู้แล้วลองทำตามบ้าง
ฉันก็สงสัยเหมือนกันว่าทำไมถึงเอาทั้ง repository ใส่เข้า GPT และใช้เทคโนโลยีกับหนังสืออะไรบ้าง
ฝั่งฉันคือใส่พรอมป์ต์แล้วรอให้ Codex ทำเสร็จ จากนั้นก็ต้องถามซ้ำว่ามันได้ทำงานชัด ๆ รอบข้างที่เมื่อก่อนฉันทำเองหรือยัง พอมันทำแล้ว ฉันก็ไปใช้เวลากับ
/reviewและการทดสอบแบบ manual แล้วค่อยกลับไปแตกงานเป็นชิ้นเล็ก ๆ อีกที ถ้าเป็นฟีเจอร์ใหญ่ก็ใช้ plan และใช้ส่วนขยาย VSCode ด้วย ฉันลองทั้ง 5.4 กับ 5.5 แล้ว แต่รู้สึกว่าตัวแรกเข้ากับฉันมากกว่าถ้าที่นี่จะใช้ โมเดลที่ไม่ใช่ของ OpenAI ต้องทำยังไง?
ปัญหาของ Claude คือ มันไม่เดินหน้าทำงานต่อเนื่องแบบ Codex Claude อาจดีกว่าก็ได้ แต่ Codex พยายามทำงานให้เสร็จจนจบ
ส่วน Claude แค่หยุดไปเฉย ๆ และถึงจะมีความสามารถแบบนั้นก็คงแพงเกินไป เลยไม่น่าต่างกันมาก อาจพอ ๆ กันหรือดีกว่าก็ได้ แต่ตอนนี้ฉันไม่ค่อยรู้แล้วและไม่ได้ใช้มันอยู่ 4.5 ดีที่สุดตอนเพิ่งออกมาใหม่ ๆ
ตอนฉันรู้สึกว่า Codex เหมือนเวทมนตร์ก็เป็นแบบนั้นเหมือนกัน แต่รอจนมันพังก่อนแล้วจะรู้เอง จนถึงเมื่อ 3 วันก่อนฉันก็ยังรู้สึกแบบนั้นอยู่ แต่ตอนนี้พูดตรง ๆ ว่ามันแย่กว่า Claude แล้ว
ฉันใช้ บัญชี Pro 5 บัญชี เปิดตลอด 24 ชั่วโมง เลยพูดได้อย่างมั่นใจว่ามันไม่เหมือนเมื่อ 1 สัปดาห์ก่อน และตอนนี้แย่ลงมากจริง ๆ