- วิดีโอเว็บบินาร์ความยาว 58 นาทีของคอร์ส Codex สำหรับนักพัฒนาที่ OpenAI เผยแพร่เองโดยตรง
- Codex คือแพลตฟอร์ม coding agent ที่ก้าวข้ามการเติมโค้ดอัตโนมัติหรือ pair programming ไปสู่การให้วิศวกร มอบหมายงานขนาดใหญ่ให้เอเจนต์ ได้
- ใช้แบ็กเอนด์เดียวกันบน อินเทอร์เฟซที่หลากหลาย เช่น แอป Codex, CLI และส่วนขยาย IDE พร้อมรันหลายงานพร้อมกันแบบขนานได้
- ครอบคลุม วงจรการพัฒนาซอฟต์แวร์ (SDLC) ทั้งหมด ตั้งแต่การวางแผน(Plan), ออกแบบ(Design), สร้าง(Build), ทดสอบ(Test), รีวิว(Review), ทำเอกสาร(Document) ไปจนถึงดีพลอยและบำรุงรักษา(Deploy & Maintenance)
- ผ่านไฟล์ agents.md สามารถกำหนดแนวทางการทำงานของเอเจนต์ในระดับรีโพซิทอรีได้ และแพ็กเกจเวิร์กโฟลว์ที่ทำซ้ำเป็นประจำด้วย Skills และ Automations เพื่อรันอัตโนมัติได้
- รองรับการทำงานต่อเนื่อง 25 ชั่วโมงและการคงบริบทระยะยาวผ่าน server-side compaction 13~14 ครั้ง พร้อมรับประกันความปลอดภัยด้วยแซนด์บ็อกซ์ระดับ OS
วิวัฒนาการของ AI Coding: จากการเติมโค้ดสู่การมอบหมายให้อัตโนมัติ
- ตลอดหลายปีที่ผ่านมา AI coding พัฒนาจาก การเติมโค้ด (เพิ่มความเร็วในการพิมพ์ราว 10%) → pair programming (วางแผนข้ามไฟล์, รันทดสอบ, แก้ไขรีโพ)
- ทั้งสองแนวทางมุ่งสร้าง “ผู้ร่วมงานที่ดีขึ้น” แต่ Codex เริ่มพัฒนาเมื่อราว 1 ปีก่อนโดยมีเป้าหมายสร้าง เอเจนต์ที่สามารถมอบหมายงานให้ได้
- ในเดือนธันวาคม 2025 โมเดล GT 5.2 Codex ได้แก้ข้อจำกัดสำคัญของ “การมอบหมายงานให้เอเจนต์อย่างแท้จริง” ด้วยความสามารถทำงานต่อเนื่องยาวนานและมี steerability สูง
- หลังจากนั้นประสิทธิภาพก็ดีขึ้นอย่างต่อเนื่องด้วย GT 5.3 ที่เร็วและมีประสิทธิภาพมากขึ้น และ GT 5.4 รุ่นล่าสุด
- จุดพัฒนาหลักคือการสำรวจโค้ดเบสองค์กรขนาดใหญ่ได้อย่างเสถียร และรักษาการจัดแนวกับเจตนาของผู้ใช้ได้เป็นเวลานาน
อินเทอร์เฟซที่ใช้ Codex ได้
- Codex ใช้เอเจนต์ตัวเดียวกันได้บนหลายพื้นผิว เช่น CLI, ส่วนขยาย IDE, แอป Codex และทั้งหมดใช้แบ็กเอนด์เดียวกัน
- แอป Codex เป็นอินเทอร์เฟซที่มองเห็นงานแบบขนานได้ชัดที่สุด เหมาะกับการรันหลายเอเจนต์พร้อมกันและตรวจดูผลลัพธ์
- กรณีของ Peter Steinberger (ผู้ก่อตั้ง OpenClaw): เปลี่ยนจากการจัดการหน้าต่าง CLI มากกว่า 10 หน้าต่างมาเป็นแอป Codex ทำให้บริหาร เอเจนต์แบบขนาน ได้มีประสิทธิภาพขึ้น
- รองรับทั้ง macOS และ Windows ดาวน์โหลดได้จาก openai.com/codex และบน Windows ก็มีใน Microsoft Store
- บน CLI ให้ล็อกอินครั้งแรกด้วยคำสั่ง
codex login แล้วเริ่มเซสชันด้วยคำสั่ง codex
UI และการตั้งค่าของแอป Codex
- เลือกโมเดลได้ (เช่น GPT 5.4) และปรับ ระดับความพยายามในการให้เหตุผล (reasoning effort) ได้: low, medium, high, extra high
- ค่าเริ่มต้นคือ medium ซึ่งสมดุลระหว่างความเร็วกับความลึกในการให้เหตุผลดีที่สุด
- คำถามง่ายเหมาะกับ low ส่วนงานที่ต้องคิดลึกนานเหมาะกับ high หรือ extra high
- ปรับความเร็วการตอบสนองได้ด้วยสวิตช์ Speed mode (fast/standard)
- นอกจากงานบนเครื่อง ยังมีโหมด Git worktree และตัวเลือกเริ่ม คลาวด์คอนเทนเนอร์ ระยะไกล
- การตั้งค่าสิทธิ์: เลือกได้ระหว่างสิทธิ์พื้นฐาน (อ่าน/แก้ไฟล์ในโปรเจกต์, ขออนุมัติเมื่อมีคำสั่งเสี่ยง) กับสิทธิ์เต็ม (เข้าถึงไฟล์ทั้งเครื่อง, เข้าถึงเครือข่าย, รันได้โดยไม่ต้องขออนุมัติ)
- แนะนำให้ผู้ใช้ใหม่เริ่มจากสิทธิ์พื้นฐาน
- สามารถเพิ่มและสลับโปรเจกต์ (โฟลเดอร์) ได้จากแถบด้านซ้าย
การใช้ Codex ในทุกขั้นของ SDLC
- OpenAI ออกคู่มือ “Building an AI Native Engineering Team” ซึ่งสรุปวิธีที่ coding agent ช่วยเร่ง SDLC ทั้ง 7 ขั้นตอน (วางแผน, ออกแบบ, สร้าง, ทดสอบ, รีวิว, ทำเอกสาร, ดีพลอย/บำรุงรักษา)
- โดยเฉพาะ ขั้นทดสอบและรีวิว มีความสำคัญมากขึ้นเมื่อความสามารถในการสร้างโค้ดดีขึ้น
- Codex ได้รับการประเมินว่ายอดเยี่ยมเป็นพิเศษในด้านการให้เหตุผลบนโค้ดเบสที่ซับซ้อนและการเขียนโค้ดระดับโปรดักชัน
ขั้นวางแผน (Plan)
- เปิดใช้ Plan mode ด้วย
/plan หรือ Shift+Tab เพื่อให้ Codex วางแผนก่อนลงมือทำ
- ในเดโม เมื่อขอให้วางแผนแอป companion สำหรับ iOS ด้วย SwiftUI, Codex จะสำรวจโค้ดเบสก่อนแล้วเสนอ คำถามติดตาม เช่น วิธีการยืนยันตัวตน หรือขอบเขตของรีลีสแรก
- สามารถรับตัวเลือกที่แนะนำหรือพิมพ์เพิ่มเองเพื่อปรับทิศทางเอเจนต์ได้
- โครงสร้างแผนจะระบุสมมติฐาน (assumptions) ไว้ชัดเจน เพื่อให้ผู้ใช้ตรวจสอบและแก้ไขได้
ขั้นออกแบบ (Design) — การเชื่อมต่อ MCP
- ผ่าน MCP (Model Context Protocol) สามารถเชื่อมคอนเท็กซ์จากเครื่องมือภายนอกอย่าง Figma, Linear เข้ากับ Codex ได้โดยตรง
- รองรับในทุกอินเทอร์เฟซ ทั้ง CLI, ส่วนขยาย IDE และแอป Codex
- เมื่อเชื่อม Figma MCP หากวางลิงก์ดีไซน์ลงไป Codex จะดึงคอนเท็กซ์ดีไซน์มาแปลงเป็นโค้ด
- หากยังไม่ได้ตั้งค่า MCP, Codex จะแสดงคำแนะนำการติดตั้งให้อัตโนมัติ
- การเชื่อมกับแอป ChatGPT ก็ใช้งานได้ใน Codex ผ่านอินทิเกรชันที่บุคคลภายนอกสร้างไว้
- ทำให้วิศวกร โฟกัสกับลอจิกหลัก ได้มากขึ้น และนักออกแบบก็มีเวลาไปสำรวจแนวคิดดีไซน์เพิ่มขึ้น
ขั้นสร้าง (Build)
- เป็นขั้นที่ coding agent ส่งผลกระทบมากที่สุดใน SDLC
- ในเดโมมีการรันงานแบบขนาน เช่น แก้ความไม่มีประสิทธิภาพของ N+1 query พร้อมเพิ่ม regression test, ตรวจสอบเส้นทาง API ที่ขาดการยืนยันตัวตน, และ ย้ายจาก NextAuth v4 ไป Auth.js v5
- ผลลัพธ์จากการสร้างโค้ดตามดีไซน์ Figma: เปลี่ยน 10 ไฟล์, เขียนโค้ด 320 บรรทัด, ไม่ต้องลงมือเขียน CSS เอง
- ฟีเจอร์ Worktree สร้างสำเนาของโปรเจกต์ในเครื่องอัตโนมัติเพื่อป้องกันการชนกันระหว่างงานแบบขนาน โดยไม่ต้องคัดลอกรีโพแยก
- Codex จะรัน คำสั่งตรวจสอบ·บิลด์·ลินต์ อย่าง
npx tsc, npm test ที่กำหนดไว้ใน agents.md โดยอัตโนมัติ เพื่อตรวจว่าทำตามคอนเวนชันของทีม
- ตัวบิลด์ไม่ใช่คอขวดอีกต่อไป และในสภาพแวดล้อมองค์กร สิ่งสำคัญคือการตรวจว่าโค้ดสอดคล้องกับกฎของทีมหรือไม่
- เปิดเทอร์มินัลในแอปได้โดยตรงด้วย Command+J
- แม้แต่แอป iOS ก็สามารถรัน
xcode build ได้ในแอป Codex โดย ไม่ต้องเปิด Xcode โดยตรง
คำสั่ง Slash
- รองรับ คำสั่ง slash ใน CLI, ส่วนขยาย IDE และแอป Codex ทั้งหมด: plan mode, การอ้างถึงไฟล์, ตรวจสถานะเซสชัน, เปลี่ยนสิทธิ์ ฯลฯ
- ใช้คำสั่ง
/experimental เพื่อสลับเปิดปิดฟีเจอร์ทดลองได้
- รวมถึงฟีเจอร์สร้าง multi-agent (sub-agents)
- CLI จะได้ฟีเจอร์ใหม่ก่อนอินเทอร์เฟซอื่นเล็กน้อย
- การตั้งค่าที่เปิดจากอินเทอร์เฟซใดอินเทอร์เฟซหนึ่งจะ สะท้อนไปยังทุกอินเทอร์เฟซ เพราะใช้แบ็กเอนด์เดียวกัน
ขั้นรีวิว (Review)
- ใช้คำสั่ง
/review เพื่อรัน code review เทียบกับ base branch หรือกับการเปลี่ยนแปลงในเครื่องที่ยังไม่ได้ commit
- เอเจนต์ Codex ถูกฝึกมาให้เชี่ยวชาญการระบุบั๊กระดับ P0/P1 จึงให้ฟีดแบ็กสัญญาณสูงและมี noise ต่ำ
- ช่วยให้ พบปัญหาได้ตั้งแต่ในเครื่อง ก่อน PR จะไปถึง pipeline ของ CI/CD
- อินทิเกรชัน GitHub Cloud แบบเนทีฟ: Codex สามารถทำ code review ให้ PR ได้ทั้งแบบ proactive และ reactive โดยอัตโนมัติ
- มีการยกตัวอย่างว่าจับปัญหา P1 ที่คนมักมองข้ามได้ เช่น การตรวจ regex rule
- สำหรับ SCM อื่นอย่าง GitLab, Bitbucket สามารถสร้างการเชื่อมต่อเองได้ผ่าน Codex SDK
- หากเพิ่มคอมเมนต์รีวิวโค้ดในแผง diff โดยตรง ข้อมูลนั้นจะถูกสะท้อนเป็นคอนเท็กซ์ของบทสนทนาครั้งถัดไปโดยอัตโนมัติ
Skills — การแพ็กเกจเวิร์กโฟลว์ที่นำกลับมาใช้ซ้ำได้
- Skill คือมาตรฐานเปิดสำหรับแพ็กเกจคำสั่งเวิร์กโฟลว์ที่นำกลับมาใช้ซ้ำได้ให้ Codex รัน
- ในเชิงโครงสร้างคือหนึ่งโฟลเดอร์ โดยไฟล์ที่จำเป็นคือ skill.md (เมทาดาทา + คำสั่งสำหรับเอเจนต์)
- สามารถเพิ่มสคริปต์รัน, เอกสาร, เทมเพลต ได้ตามต้องการ
- สามารถฝัง MCP ไว้ภายใน skill เพื่อเชื่อมกับเครื่องมือภายนอกได้เช่นกัน
- ตัวอย่างในเดโม: จัดการคอมเมนต์ PR, แก้อัตโนมัติเมื่อ BuildKite build ล้มเหลว, ตรวจหา dead code
- Skill Creator (system skill): หากสั่งระหว่างบทสนทนา เช่น “create a skill to find dead code paths” จะ scaffold skill.md ให้โดยอัตโนมัติ
- Skill Installer (system skill): ติดตั้ง skill ที่สร้างแล้วเข้าไดเรกทอรี skill ของ Codex บนเครื่องได้ทันที
- หากแปลงเวิร์กโฟลว์ที่ต้องทำซ้ำหลังบทสนทนายาวให้เป็น skill ครั้งต่อไปก็จะ เรียกใช้เวิร์กโฟลว์ทั้งหมดได้ในครั้งเดียว
- ตัวอย่าง GitHub Issue Plan PR skill: ใช้พรอมป์ต์เดียวทำได้ตั้งแต่ triage issue บน GitHub → วางแผน → แก้ไข → ทำเอกสาร → สร้าง draft PR ครบทุกขั้นของ SDLC ในครั้งเดียว
ขั้นทำเอกสาร (Documentation)
- เป็นหนึ่งในด้านการใช้งาน Codex ที่ ถูกประเมินค่าต่ำเกินไป
- รองรับการสร้าง system diagram, อัปเดตเอกสารอัตโนมัติเมื่อมีการพัฒนาฟีเจอร์ เป็นต้น
- มีเดโมการเชื่อมกับ Linear MCP เพื่อบันทึกการแก้ไขของ ticket, ผล regression test และรายการตรวจสอบความถูกต้องลงในบอร์ด Linear โดยอัตโนมัติ
ขั้นดีพลอยและบำรุงรักษา (Deploy & Maintenance)
- ในแอป Codex สามารถ Commit, Push, สร้าง PR ได้โดยตรงผ่านการคลิกปุ่ม (บนพื้นฐาน Git)
- หากวาง stack trace ลงไป Codex จะให้เหตุผลกับทั้งโค้ดเบสเพื่อหาสาเหตุของปัญหา
- Triage Page skill: ใส่ incident ID แล้วให้จัดการได้ครบจบในที่เดียว ตั้งแต่เก็บรายละเอียด, ยืนยัน incident, ตรวจ metric·log ไปจนถึง ออกแพตช์
- เปลี่ยนการรับมือ pager duty จากการไล่วิเคราะห์ log ด้วยมือ ไปสู่การมอบหมายให้เอเจนต์
- PR Babysitter skill: เฝ้าติดตามความคืบหน้าของ pipeline CI/CD ของ PR อย่างต่อเนื่อง และหากมีปัญหาก็แก้อัตโนมัติจน merge สำเร็จแบบอัตโนมัติ
- OpenAI ใช้งานจริงในสภาพแวดล้อม monorepo ขนาดใหญ่
- ดาวน์โหลดได้จากรีโพซิทอรี skill แบบโอเพนซอร์ส
Automations — การรันอัตโนมัติตามตารางเวลา
- เมื่อคุ้นกับการใช้ skill แล้ว สามารถใช้ฟีเจอร์ Automations เพื่อตั้งให้รันงานอัตโนมัติตามเวลาที่กำหนดได้
- การทำ automation ของ Sentry skill: ทุกวันพฤหัสบดี (หรือทุกวัน) ค้นหา issue ในรีโพซิทอรีที่กำหนด แล้วเสนอวิธีแก้หรือแก้ให้อัตโนมัติ
- automation “What is everyone up to?”: ทุกวันเวลา 9 โมงเช้า สรุปสถานะกิจกรรมของสมาชิกทีมในรีโพซิทอรี
- แม้ไม่ต้องป้อนพรอมป์ต์เอง Codex ก็ยังทำงานต่อเนื่องอยู่เบื้องหลังได้
หลักการทำงานของเอเจนต์ Codex
- เอเจนต์ Codex ทำงานแบบ ลูป: ผู้ใช้ให้เป้าหมายชัดเจนและทิศทางเริ่มต้น → เอเจนต์ให้เหตุผล, เรียกใช้เครื่องมือ, อ่านไฟล์, ค้นหารีโพซิทอรี, เขียนโค้ด, รันคำสั่งซ้ำไปเรื่อย ๆ
- ผลลัพธ์จากแต่ละเครื่องมือจะถูกป้อนกลับเข้าสู่การเรียกโมเดลครั้งถัดไป ทำให้ ค่อย ๆ สร้างความเข้าใจและความคืบหน้า
- คอนเท็กซ์ (context) เป็นตัวแปรสำคัญที่กำหนดประสิทธิภาพของเอเจนต์: ต้องป้อนข้อมูลในปริมาณที่เหมาะสมเพื่อชี้นำไปยังทิศทางที่ถูกต้อง
- การแซนด์บ็อกซ์ระดับ OS: ไม่ใช่ข้อจำกัดแบบเบาระดับ harness แต่เป็นการ ควบคุมการเข้าถึงเครือข่ายและไฟล์ในระดับระบบปฏิบัติการ
- ออกแบบมาเพื่อรับมือกับความเป็นไปได้ที่โมเดลที่เก่งขึ้นจะหลบเลี่ยงการป้องกันแบบเบาได้
- รองรับแซนด์บ็อกซ์บนทุกระบบ (Mac, Windows) โดยฝั่ง Windows ใช้ Native Windows Sandbox ที่ปลอดภัยกว่า WSL
- ในไฟล์ config TOML สามารถตั้งค่า approval mode (จุดที่ต้องอนุมัติ) และ sandbox mode (ขอบเขตการเข้าถึง) ได้ละเอียด
- ค่าเริ่มต้นคือ “on request” คือรันตามปกติและจะหยุดชั่วคราวเมื่อจำเป็นต้องยกระดับสิทธิ์
Compaction — การจัดการเธรดยาวนาน
- เมื่อบทสนทนาเข้าใกล้ ข้อจำกัดของคอนเท็กซ์ ของโมเดล Codex จะทำ compaction เพื่อบีบอัดส่วนต้นของบทสนทนา
- compaction ทำงานแบบ server-side โดยอิง raw chain of thought จึงเก็บสาระสำคัญของงานได้ดีกว่าการทำฝั่งไคลเอนต์
- ตัวอย่างจริง: ระหว่าง การทำงานต่อเนื่อง 25 ชั่วโมง มีการ compaction 13~14 ครั้งและยังคงรักษาคอนเท็กซ์ไว้ได้สำเร็จ
แนวทางพรอมป์ต์ที่ดีสำหรับการมอบหมายงานอย่างมีประสิทธิภาพ
- ใช้ พรอมป์ต์ที่สั้นที่สุดเท่าที่จำเป็น แต่ระบุเป้าหมาย, ข้อจำกัด และเกณฑ์ของคำว่า “เสร็จแล้ว” ให้ชัด
- ฝังเงื่อนไขการตรวจสอบไว้ในพรอมป์ต์: ระบุเกณฑ์ความสำเร็จและคำสั่งทดสอบ·บิลด์ที่ต้องรัน
- ใช้ พรอมป์ต์ปลายเปิด: ถาม Codex ถึงไอเดียปรับปรุงประสิทธิภาพ หรือพื้นที่ที่ test coverage ยังไม่พอ เพื่อใช้เป็นคู่คิด
agents.md — ไฟล์กำหนดพฤติกรรมของเอเจนต์
- เป็น ฟอร์แมตเปิด คล้าย Rules ของ Cursor หรือการตั้งค่าของ Windsurf ไม่ใช่ของเฉพาะ OpenAI
- ถูกโหลดอัตโนมัติในทุกเซสชันของ Codex ช่วยให้ได้ ผลลัพธ์ที่สม่ำเสมอ
- โครงสร้างลำดับความสำคัญ 3 ระดับ:
- ระดับ global (
~/.codex/agents.md): ค่าพื้นฐานส่วนตัว (ไม่ขึ้นกับทีม)
- รากของรีโพซิทอรี (
agents.md): คอนเวนชันของทั้งรีโพ
- ซับไดเรกทอรี (
agents.md): คำสั่งละเอียดตามไมโครเซอร์วิส/โฟลเดอร์ย่อย
- Codex จะ เชื่อม (concatenate) agents.md ตามเส้นทาง จากรากโปรเจกต์ถึงไดเรกทอรีปัจจุบัน โดยไฟล์ที่เฉพาะเจาะจงกว่าจะมีความสำคัญกว่า
- สิ่งที่ควรใส่: ภาพรวมรีโพซิทอรี, คำสั่งสำหรับรัน, ความคาดหวังด้านการทดสอบ, ตำแหน่งของโมดูลสำคัญ, แนวทาง commit/PR
- ใช้คำสั่ง
/init (CLI) เพื่อสร้าง agents.md แรกให้อัตโนมัติได้ ช่วยแก้ปัญหา cold start
- แนะนำให้กระชับไม่เกิน 100 บรรทัด (อ้างอิง agents.md ของ monorepo ภายใน OpenAI)
- หากเนื้อหายาว ให้แยกเป็น ไฟล์ Markdown ตามงาน (เช่น planning.md, code-review.md, architecture.md) แล้วอ้างอิงจาก agents.md
- มีการแนะนำ แพตเทิร์นอัตโนมัติ ที่ให้ Codex วิเคราะห์ local session log (มีการบอกตำแหน่งจัดเก็บ) เพื่อเสนอแนวทางปรับปรุง agents.md รายสัปดาห์โดยอัตโนมัติ
- อีกวิธีคือขอให้ Codex ทำ retrospective ของบทสนทนา แล้วสะท้อน gotcha หรือข้อควรทราบกลับเข้า agents.md โดยอัตโนมัติ
สรุป — 3 แนวทางปฏิบัติสำคัญในการเริ่มใช้ Codex
- สร้าง agents.md และตั้งค่าปรับแต่งเอง
- มอบหมายงานจริงให้ Codex และเชื่อมต่อกับ เครื่องมือ (MCP) ที่ใช้ประจำวัน
- อย่าใช้แค่ในขั้น build แต่ให้รัน Codex ตลอด ลูปการพัฒนาทั้งหมด ตั้งแต่ออกแบบจนถึงดีพลอยและบำรุงรักษา อย่างต่อเนื่อง
3 ความคิดเห็น
OpenAI Academy ก็เปิดมาเกือบ 1 ปีแล้ว ตอนนี้มีคอร์สดี ๆ สะสมอยู่ค่อนข้างมากเลยครับ
(แต่ก็น่าเสียดายหน่อยที่มีแค่ซับอังกฤษแบบสร้างอัตโนมัติ)
เสียดายจัง ถ้ามีซับภาษาไทยก็คงดี..
มีใครเคยฟังอันนี้ไหมครับ?
คุ้มพอที่จะลงทุนเวลา 1 ชั่วโมงไหม?
ยุค AI แบบคลิกเดียวจบ เวลาก็ยิ่งมีค่าน่ะครับ 555