- โอเพนซอร์สซอฟต์แวร์แฟกทอรี ที่ขับเคลื่อนด้วย AI ซึ่ง Garry Tan ซีอีโอของ YC สร้างและใช้งานเอง ออกแบบมาให้คนคนเดียวทำงานได้เหมือนทีม 20 คน
- ประกอบด้วยสแลชคอมมานด์ที่ครอบคลุมทั้งสปรินต์ตามลำดับ Think → Plan → Build → Review → Test → Ship → Reflect และแต่ละสกิลจะส่งต่อคอนเท็กซ์ไปยังสกิลถัดไปโดยอัตโนมัติ
- เริ่มต้นด้วย
/office-hours เพื่อทดสอบสมมติฐานของผลิตภัณฑ์ จากนั้นยืนยันสถาปัตยกรรมด้วย /plan-ceo-review · /plan-eng-review แล้วใช้ /review · /qa · /ship เพื่อทำงานอัตโนมัติตั้งแต่แก้บั๊กไปจนถึงสร้าง PR
- แต่ละคำสั่งทำงานเสมือนเป็น ผู้เชี่ยวชาญตามบทบาท : รีวิวแบบ CEO, การออกแบบโดยผู้จัดการฝ่ายวิศวกรรม, การตรวจแบบโดยดีไซเนอร์, หัวหน้า QA, วิศวกรรีลีส เป็นต้น
- ผู้ใช้เป้าหมาย
- Founder·CEO — ผู้ก่อตั้งสายเทคนิคที่ยังต้องการดีพลอยโค้ดด้วยตัวเอง
- ผู้เริ่มต้นใช้ Claude Code — ผู้ใช้ที่ต้องการเวิร์กโฟลว์แบบมีโครงสร้างตามบทบาท แทนการเริ่มจากพรอมป์ต์เปล่า
- Tech Lead·Staff Engineer — วิศวกรอาวุโสที่ต้องการรีวิวเข้มงวด QA และรีลีสอัตโนมัติในทุก PR
- สกิล ซึ่งเป็นแกนหลักของสปรินต์
/office-hours — ตรวจสอบสมมติฐานผลิตภัณฑ์ด้วยคำถามบังคับ 6 ข้อในรูปแบบ YC office hours สร้างเอกสารดีไซน์และส่งต่อให้สกิลย่อยอัตโนมัติ
/plan-ceo-review — นิยามปัญหาใหม่และสำรวจ 'ผลิตภัณฑ์ระดับ 10 ดาว'; มี 4 โหมดคือ Expansion·Selective Expansion·Hold Scope·Reduction
/plan-eng-review — กำหนดสถาปัตยกรรม, data flow, แผนภาพ ASCII, edge case, test matrix และข้อกังวลด้านความปลอดภัย
/plan-design-review — ให้คะแนนแต่ละมิติของดีไซน์ตั้งแต่ 0~10 และอธิบายเกณฑ์ของระดับ 10 พร้อมฟีเจอร์ตรวจจับ AI Slop และมีการโต้ตอบ AskUserQuestion 1 ครั้งต่อการตัดสินใจด้านดีไซน์แต่ละครั้ง
/design-consultation — สร้าง design system แบบครบถ้วนตั้งแต่ต้น และสร้าง mockup ผลิตภัณฑ์ที่สมจริง
/review — ตรวจจับบั๊กที่ผ่าน CI แต่พังในโปรดักชัน, แก้ปัญหาที่ชัดเจนอัตโนมัติ และติดธงช่องว่างด้านความสมบูรณ์
/investigate — กฎเหล็ก: ไม่มีการแก้ไขหากยังไม่สืบสวน; ติดตาม data flow, ตรวจสอบสมมติฐาน และหยุดหลังล้มเหลว 3 ครั้ง
/design-review — ตรวจสอบแบบเดียวกับ /plan-design-review แล้วแก้ปัญหาที่พบโดยตรง พร้อมแนบภาพหน้าจอก่อน/หลังการแก้ไข
/qa — ทดสอบแอปด้วยเบราว์เซอร์จริง, ค้นหาและแก้บั๊ก, และสร้าง regression test อัตโนมัติสำหรับแต่ละการแก้ไข
/qa-only — ใช้วิธีการเดียวกับ /qa แต่สร้างเฉพาะรายงานบั๊กโดยไม่แก้โค้ด
/cso — ตรวจสอบ threat model ตาม OWASP Top 10 + STRIDE; มีกฎตัด false positive 17 ข้อ, gate ความเชื่อมั่นอย่างน้อย 8/10 และแนบสถานการณ์ exploit ที่เป็นรูปธรรมสำหรับแต่ละประเด็นที่พบ
/ship — ซิงก์กับ main, รันเทสต์, ตรวจ coverage, push และสร้าง PR; หากไม่มี test framework จะบูตสแตรปให้อัตโนมัติ
/land-and-deploy — ทำ PR merge → รอ CI·ดีพลอย → ตรวจสอบสถานะโปรดักชันให้เสร็จในคำสั่งเดียว
/canary — ลูปมอนิเตอร์ console error, performance regression และ page outage หลังดีพลอย
/benchmark — วัด baseline ของ page load time, Core Web Vitals และขนาดทรัพยากร พร้อมเปรียบเทียบก่อน/หลังในแต่ละ PR
/document-release — อัปเดตเอกสารทั้งหมดของโปรเจกต์ให้สอดคล้องกับสิ่งที่ดีพลอยแล้ว และตรวจจับ README ที่ล้าสมัยอัตโนมัติ
/retro — retrospective รายสัปดาห์; วิเคราะห์รายบุคคล, บันทึกความต่อเนื่องของการดีพลอย, แนวโน้มสุขภาพของเทสต์ และใช้ /retro global เพื่อทำ retrospective รวมทั้งโปรเจกต์และเครื่องมือ AI (Claude Code, Codex, Gemini)
/browse — Chromium เบราว์เซอร์จริง, คลิกจริง, ภาพหน้าจอจริง, ใช้เวลาราว 100ms ต่อคำสั่ง
/setup-browser-cookies — นำเข้าคุกกี้จาก Chrome·Arc·Brave·Edge เข้าสู่เซสชันแบบ headless เพื่อทดสอบหน้าที่ต้องยืนยันตัวตน
/autoplan — รันรีวิว CEO → ดีไซน์ → วิศวกรรมแบบอัตโนมัติตามลำดับ และแสดงให้ผู้ใช้เห็นเฉพาะจุดที่ต้องตัดสินใจตามความชอบ
- พาวเวอร์ทูล
/codex — รีวิวโค้ดแบบอิสระด้วย OpenAI Codex CLI; มี 3 โหมดคือ รีวิว (pass/fail gate)·adversarial challenge·open consultation และเมื่อรันทั้ง /review กับ /codex จะได้การวิเคราะห์แบบข้ามโมเดล
/careful — เตือนก่อนรันคำสั่งทำลายล้าง เช่น rm -rf, DROP TABLE, force push โดยเปิดใช้งานด้วยการพิมพ์ "be careful"
/freeze — จำกัดการแก้ไขไฟล์ให้อยู่ในไดเรกทอรีที่กำหนด เพื่อป้องกันการเปลี่ยนแปลงนอกขอบเขตระหว่างดีบัก
/guard — รวม /careful + /freeze เป็นการตั้งค่าความปลอดภัยสูงสุดสำหรับงานโปรดักชัน
/unfreeze — ยกเลิกขอบเขตของ /freeze
/setup-deploy — การตั้งค่าครั้งเดียวสำหรับ /land-and-deploy โดยตรวจจับแพลตฟอร์ม, URL โปรดักชัน และคำสั่งดีพลอยอัตโนมัติ
/gstack-upgrade — อัปเกรด gstack เป็นเวอร์ชันล่าสุด ตรวจจับทั้งการติดตั้งแบบ global และ vendored แล้วซิงก์ให้ตรงกัน
- สปรินต์แบบขนาน : ผ่าน Conductor สามารถรันหลาย Claude Code session พร้อมกันใน workspace ที่แยกจากกันได้
- ตัวอย่าง: เซสชันหนึ่งทำ
/office-hours, อีกเซสชันทำ /review, เซสชันที่สามพัฒนาฟีเจอร์ และเซสชันที่สี่ทำ /qa ไปพร้อมกัน
— ผู้ก่อตั้ง, วิศวกรลีด และ PM สามารถฟอร์ก โรงงานพัฒนา AI นี้ไปทดลองและขยายต่อได้ด้วยตัวเอง
- นอกจาก Claude Code แล้ว ยังทำงานได้กับเอเจนต์ทุกตัวที่รองรับมาตรฐาน SKILL.md เช่น Codex, Gemini CLI, Cursor
- ไลเซนส์ MIT
4 ความคิดเห็น
ว้าว!! Garry Tan รีทวีต GeekNews แล้วนะ
https://x.com/garrytan/status/2035898375934300353
ใช้เวลานานมากกว่าจะถึง Office Hour เลยลองไปดู แล้วพบว่าแค่ skill นี้อันเดียว ความยาวของ markdown ก็ไม่ธรรมดาเลย
ดูเหมือนว่ามันกำลังพัฒนาไปในทิศทางที่คนทำธุรกิจคนเดียวจะนำไปใช้ประโยชน์ได้ดีขึ้นเรื่อย ๆ นะ
office-hours สนุกดีนะครับ ส่วนผมมีแบบ hands-on ครับ