9 ทักษะเอาตัวรอดในยุค Agentic Engineering
(flowkater.io)สุดสัปดาห์ของผู้ให้กำเนิด Vibe Coding
- Karpathy มอบหมายโปรเจกต์ช่วงสุดสัปดาห์ให้เอเจนต์จัดการ โดยให้แค่ IP, ชื่อผู้ใช้, รหัสผ่าน และเป้าหมาย แล้วผ่านไป 30 นาทีก็เสร็จทั้งหมด
- วิธีทำงานแบบไม่เขียนโค้ดเองตลอด 99% ของเวลา แต่คอยสั่งและกำกับเอเจนต์แทน — "Agentic Engineering"
- แต่แม้นักพัฒนา 60% จะใช้ AI อยู่แล้ว สัดส่วนการมอบหมายงานแบบเต็มรูปแบบกลับอยู่เพียง 0-20% เท่านั้น — พาราด็อกซ์ของการมอบหมายงาน "Do you trust your agents?" คนส่วนใหญ่ยังตอบว่า "ไม่"
① ความสามารถในการแยกย่อย (Decomposition)
- ถ้าบอกว่า "ช่วยสร้างฟีเจอร์สมัครสมาชิกให้หน่อย" ก็จะมีอะไรบางอย่างออกมาจริง แต่ปัญหาคือมีโอกาสสูงที่มันจะไม่ใช่สิ่งที่เราต้องการ
- เคยโยนแค่ PRD ของหน้าจอ AddPlan ให้เอเจนต์ทำ ปรากฏว่าต้องคุยแก้ไปมาเป็นสิบรอบ เสียเวลาไปครึ่งวัน
- ใช้บทสนทนาแบบโสกราตีกับ AI เพื่อสัมภาษณ์ 5 นาที → จัดระเบียบ edge case ล่วงหน้า → ลดเหลือแก้เพียง 2-3 รอบ
- ต้องมีเวลาคิดก่อนลงมือพัฒนา, 5 นาทีนั้นช่วยประหยัดเวลาได้ 4 ชั่วโมง
② การออกแบบคอนเท็กซ์ (Context Architecture)
- การเขียน AGENTS.md ให้ดีก็สำคัญ แต่ถ้าสถาปัตยกรรมโค้ดถูกออกแบบมาดีตั้งแต่ต้น ความเร็วที่เอเจนต์จะเข้าใจคอนเท็กซ์ก็ต่างกันอย่างสิ้นเชิง
- จากเดิมที่เอเจนต์หลงทางใน flat directory พอจัดโครงสร้างใหม่เป็นไดเรกทอรีตามหน่วย Feature ก็เห็นผลดีขึ้นทันที
- Armin Ronacher: "เครื่องมือต้องถูกออกแบบให้รับมือกับกรณีที่ LLM chaos monkey ใช้มันผิดแบบสุดทางได้"
③ นิยามของความเสร็จ (Definition of Done)
- เคยปล่อยให้โปรเจกต์ CLI รันข้ามคืน แต่กลับจบใน 1 ชั่วโมง — ตั้งค่าแค่ type definition ส่วน business logic ยังกลวงเปล่า
- พอลองครั้งที่สอง เอเจนต์กลับเขียนเทสต์ใหม่ให้เข้าทางตัวเอง
- คำว่า "เสร็จ" ของเอเจนต์ ไม่เหมือนคำว่า "เสร็จ" ของเรา
- ระบบ DoD 7 ขั้นของ Elvis (PR→CI→code review 3 คน→Telegram) แม้จะสุดโต่ง แต่ก็ชี้ให้เห็นทิศทาง
④ การกู้คืนจากความล้มเหลว (Failure Recovery Loop)
- ใน redistribution engine มีพารามิเตอร์ตัวเดียวกันแต่แต่ละฟังก์ชันใช้คนละ semantic → แก้ A แล้ว B พัง วนลูปไม่จบ
- การลองใหม่ด้วยพรอมป์ต์เดิม ก็เหมือนเอาหัวชนกำแพงในมุมเดิมซ้ำๆ
- ถ้าจำแนกความล้มเหลวเป็น 3 แบบ (คอนเท็กซ์ไม่พอ, ทิศทางผิด, โครงสร้างขัดกัน) วิธีแก้ก็จะชัดขึ้น
- guardrail แบบ "Must NOT Have" ช่วยตัดลูปไม่รู้จบได้
⑤ การสังเกตการณ์ได้ (Observability)
- เคยมอบหมาย liquidglass ให้เอเจนต์ทำ แล้วคิดว่า "มันแปลกๆ... ปล่อยไว้ก่อนแล้วกัน" ซึ่งกลายเป็นการตัดสินใจที่แพงที่สุด
- สุดท้ายมี 20 ไฟล์พันกันจน rollback ไม่ได้
- หลังจากนั้นจึงใช้กลยุทธ์ tracer bullet + blueprint — กับเทคโนโลยีที่เพิ่งใช้ครั้งแรก เราวาด blueprint ล่วงหน้าไม่ได้อยู่แล้ว แต่ tracer bullet ช่วยร่างภาพให้ได้อย่างรวดเร็ว
- observability สร้างความเชื่อใจ และความเชื่อใจก็ทำให้การมอบหมายงานเป็นไปได้
⑥ การออกแบบหน่วยความจำ (Memory Architecture)
- ถ้าทำงานต่อเนื่อง 3 วัน ทุกเช้าจะเสียเวลา 15 นาทีไปกับการอธิบายบริบทใหม่
- ใช้ Claude Code hooks เพื่อดึง memory อัตโนมัติเมื่อจบเซสชัน → เซสชันถัดไปกู้บริบทกลับมาได้ใน 5 วินาที
- ทีมของ Boris Cherny เช็กอิน
CLAUDE.mdไว้ใน git เพื่อแชร์กันทั้งทีม - โครงสร้างที่ไม่ใช่การส่งต่อความจำของแต่ละคน แต่เป็นการส่งต่อความจำของทั้งทีมให้เอเจนต์
⑦ การจัดการแบบขนาน (Parallel Orchestration)
- Boris Cherny รันเซสชันแบบขนานพร้อมกัน 10-15 เซสชัน
- ประสบการณ์สมัยเป็น CTO ที่ต้องบริหาร 6 squads คล้ายกับการจัดการเอเจนต์แบบขนานอย่างน่าประหลาด
- ไม่ใช่ ADHD แต่คือ multitasking แบบมีเจตนา = การบริหารจัดการ
- มนุษย์จะถามกลับ แต่เอเจนต์ไม่ถามและจะเดินหน้าตามดุลยพินิจของตัวเอง — ยิ่งต้องออกแบบล่วงหน้าให้ดี
⑧ การออกแบบชั้นนามธรรม (Abstraction Layering)
- Level 0 (เขียนโค้ดเอง) → Level 1 (สั่งเอเจนต์) → Level 2 (orchestrator) → Level 3 (meta design)
- เคยเปลี่ยนรูทีนประจำวันที่ใช้เวลา 20 นาทีให้กลายเป็นสกิล แล้วลดเวลาลงเหลือ 2 นาที
- Compounding Engineering — โปรเจกต์ไม่ใช่เกมวิ่งถึงเส้นชัย แต่เป็นเกมแบบดอกเบี้ยทบต้น เซสชันก่อนหน้าจะส่งผลทบต้นไปยังเซสชันถัดไป
⑨ รสนิยม (Taste)
- ดีไซน์ที่ AI ทำได้มักอยู่ระดับ 60-70 คะแนน แต่พอใส่ดีไซน์ของ Ellie เข้าไป ก็จะเกิดความรู้สึกว่า "อ๋อ แบบนี้แหละ ใช่เลย"
- โพสต์สรุปข้อมูลที่ AI ช่วยทำ ได้ไลก์ 0 แต่โพสต์อวดสั้นๆ ที่เขียนแบบฉับพลันกลับมียอดดู 30,000
- KinglyCrow: "No Skill, No Taste" — LLM ทำให้กำแพงการเข้าถึงสกิลต่ำลง แต่กำแพงจริงอย่าง taste กลับยิ่งถูกขยายให้เห็นชัด
- Chris Lattner: "ยิ่งการลงมือทำถูกทำให้เป็นอัตโนมัติ ความสำคัญของการออกแบบ การตัดสินใจ และรสนิยมก็ยิ่งสูงขึ้น"
- ในยุคที่ 80% กลายเป็นของล้น ความแตกต่างจะมาจากอีก 20% ที่เหลือ
ส่งท้าย
- สิ่งที่จบไปคือการพิมพ์ ไม่ใช่งานวิศวกรรม
- ทั้ง 9 ข้อนี้คือสิ่งที่วิศวกรที่ดีมีอยู่แล้วตั้งแต่ก่อนยุค AI
- พลังทดของการออกแบบที่ดีเพิ่มขึ้นก็จริง แต่ความเสียหายจากการออกแบบที่แย่ก็ใหญ่ขึ้นเช่นกัน
- ตัวเอกของโชว์นี้ไม่ใช่ AI แต่คือวิศวกรที่ใช้ AI ได้อย่างเชี่ยวชาญ
3 ความคิดเห็น
ถ้ารักษา SSoT ให้ดี ก็ช่วยลดอาการหลอนได้เยอะเลย แถมยังประหยัดโทเคนด้วย
"สิ่งที่จบไปแล้วคือการพิมพ์ ไม่ใช่วิศวกรรม"
เห็นด้วยครับ 555
ขอบคุณครับ เดิมทีผมแอบกังวลเพราะมี
coworkที่แค่เปิดพีซีทิ้งไว้ก็ทำหน้าที่เป็นเซิร์ฟเวอร์ได้แล้ว แต่ตอนนี้ก็โล่งใจขึ้นหน่อย และพอจะนึกภาพออกแล้วว่าจากนี้ไป จะเปลี่ยนไปอย่างไร 555