gstack - ทีมวิศวกรรมเสมือนที่สร้างด้วย Claude Code
(github.com/garrytan)- โอเพนซอร์สซอฟต์แวร์แฟกทอรี ที่ขับเคลื่อนด้วย AI ซึ่ง Garry Tan ซีอีโอของ YC สร้างและใช้งานเอง ออกแบบมาให้คนคนเดียวทำงานได้เหมือนทีม 20 คน
- ประกอบด้วยสแลชคอมมานด์ที่ครอบคลุมทั้งสปรินต์ตามลำดับ Think → Plan → Build → Review → Test → Ship → Reflect และแต่ละสกิลจะส่งต่อคอนเท็กซ์ไปยังสกิลถัดไปโดยอัตโนมัติ
- เริ่มต้นด้วย
/office-hoursเพื่อทดสอบสมมติฐานของผลิตภัณฑ์ จากนั้นยืนยันสถาปัตยกรรมด้วย/plan-ceo-review·/plan-eng-reviewแล้วใช้/review·/qa·/shipเพื่อทำงานอัตโนมัติตั้งแต่แก้บั๊กไปจนถึงสร้าง PR - แต่ละคำสั่งทำงานเสมือนเป็น ผู้เชี่ยวชาญตามบทบาท : รีวิวแบบ CEO, การออกแบบโดยผู้จัดการฝ่ายวิศวกรรม, การตรวจแบบโดยดีไซเนอร์, หัวหน้า QA, วิศวกรรีลีส เป็นต้น
- ผู้ใช้เป้าหมาย
- Founder·CEO — ผู้ก่อตั้งสายเทคนิคที่ยังต้องการดีพลอยโค้ดด้วยตัวเอง
- ผู้เริ่มต้นใช้ Claude Code — ผู้ใช้ที่ต้องการเวิร์กโฟลว์แบบมีโครงสร้างตามบทบาท แทนการเริ่มจากพรอมป์ต์เปล่า
- Tech Lead·Staff Engineer — วิศวกรอาวุโสที่ต้องการรีวิวเข้มงวด QA และรีลีสอัตโนมัติในทุก PR
- สกิล ซึ่งเป็นแกนหลักของสปรินต์
/office-hours— ตรวจสอบสมมติฐานผลิตภัณฑ์ด้วยคำถามบังคับ 6 ข้อในรูปแบบ YC office hours สร้างเอกสารดีไซน์และส่งต่อให้สกิลย่อยอัตโนมัติ/plan-ceo-review— นิยามปัญหาใหม่และสำรวจ 'ผลิตภัณฑ์ระดับ 10 ดาว'; มี 4 โหมดคือ Expansion·Selective Expansion·Hold Scope·Reduction/plan-eng-review— กำหนดสถาปัตยกรรม, data flow, แผนภาพ ASCII, edge case, test matrix และข้อกังวลด้านความปลอดภัย/plan-design-review— ให้คะแนนแต่ละมิติของดีไซน์ตั้งแต่ 0~10 และอธิบายเกณฑ์ของระดับ 10 พร้อมฟีเจอร์ตรวจจับ AI Slop และมีการโต้ตอบ AskUserQuestion 1 ครั้งต่อการตัดสินใจด้านดีไซน์แต่ละครั้ง/design-consultation— สร้าง design system แบบครบถ้วนตั้งแต่ต้น และสร้าง mockup ผลิตภัณฑ์ที่สมจริง/review— ตรวจจับบั๊กที่ผ่าน CI แต่พังในโปรดักชัน, แก้ปัญหาที่ชัดเจนอัตโนมัติ และติดธงช่องว่างด้านความสมบูรณ์/investigate— กฎเหล็ก: ไม่มีการแก้ไขหากยังไม่สืบสวน; ติดตาม data flow, ตรวจสอบสมมติฐาน และหยุดหลังล้มเหลว 3 ครั้ง/design-review— ตรวจสอบแบบเดียวกับ/plan-design-reviewแล้วแก้ปัญหาที่พบโดยตรง พร้อมแนบภาพหน้าจอก่อน/หลังการแก้ไข/qa— ทดสอบแอปด้วยเบราว์เซอร์จริง, ค้นหาและแก้บั๊ก, และสร้าง regression test อัตโนมัติสำหรับแต่ละการแก้ไข/qa-only— ใช้วิธีการเดียวกับ/qaแต่สร้างเฉพาะรายงานบั๊กโดยไม่แก้โค้ด/cso— ตรวจสอบ threat model ตาม OWASP Top 10 + STRIDE; มีกฎตัด false positive 17 ข้อ, gate ความเชื่อมั่นอย่างน้อย 8/10 และแนบสถานการณ์ exploit ที่เป็นรูปธรรมสำหรับแต่ละประเด็นที่พบ/ship— ซิงก์กับ main, รันเทสต์, ตรวจ coverage, push และสร้าง PR; หากไม่มี test framework จะบูตสแตรปให้อัตโนมัติ/land-and-deploy— ทำ PR merge → รอ CI·ดีพลอย → ตรวจสอบสถานะโปรดักชันให้เสร็จในคำสั่งเดียว/canary— ลูปมอนิเตอร์ console error, performance regression และ page outage หลังดีพลอย/benchmark— วัด baseline ของ page load time, Core Web Vitals และขนาดทรัพยากร พร้อมเปรียบเทียบก่อน/หลังในแต่ละ PR/document-release— อัปเดตเอกสารทั้งหมดของโปรเจกต์ให้สอดคล้องกับสิ่งที่ดีพลอยแล้ว และตรวจจับ README ที่ล้าสมัยอัตโนมัติ/retro— retrospective รายสัปดาห์; วิเคราะห์รายบุคคล, บันทึกความต่อเนื่องของการดีพลอย, แนวโน้มสุขภาพของเทสต์ และใช้/retro globalเพื่อทำ retrospective รวมทั้งโปรเจกต์และเครื่องมือ AI (Claude Code, Codex, Gemini)/browse— Chromium เบราว์เซอร์จริง, คลิกจริง, ภาพหน้าจอจริง, ใช้เวลาราว 100ms ต่อคำสั่ง/setup-browser-cookies— นำเข้าคุกกี้จาก Chrome·Arc·Brave·Edge เข้าสู่เซสชันแบบ headless เพื่อทดสอบหน้าที่ต้องยืนยันตัวตน/autoplan— รันรีวิว CEO → ดีไซน์ → วิศวกรรมแบบอัตโนมัติตามลำดับ และแสดงให้ผู้ใช้เห็นเฉพาะจุดที่ต้องตัดสินใจตามความชอบ
- พาวเวอร์ทูล
/codex— รีวิวโค้ดแบบอิสระด้วย OpenAI Codex CLI; มี 3 โหมดคือ รีวิว (pass/fail gate)·adversarial challenge·open consultation และเมื่อรันทั้ง/reviewกับ/codexจะได้การวิเคราะห์แบบข้ามโมเดล/careful— เตือนก่อนรันคำสั่งทำลายล้าง เช่นrm -rf,DROP TABLE, force push โดยเปิดใช้งานด้วยการพิมพ์ "be careful"/freeze— จำกัดการแก้ไขไฟล์ให้อยู่ในไดเรกทอรีที่กำหนด เพื่อป้องกันการเปลี่ยนแปลงนอกขอบเขตระหว่างดีบัก/guard— รวม/careful+/freezeเป็นการตั้งค่าความปลอดภัยสูงสุดสำหรับงานโปรดักชัน/unfreeze— ยกเลิกขอบเขตของ/freeze/setup-deploy— การตั้งค่าครั้งเดียวสำหรับ/land-and-deployโดยตรวจจับแพลตฟอร์ม, URL โปรดักชัน และคำสั่งดีพลอยอัตโนมัติ/gstack-upgrade— อัปเกรด gstack เป็นเวอร์ชันล่าสุด ตรวจจับทั้งการติดตั้งแบบ global และ vendored แล้วซิงก์ให้ตรงกัน
- สปรินต์แบบขนาน : ผ่าน Conductor สามารถรันหลาย Claude Code session พร้อมกันใน workspace ที่แยกจากกันได้
- ตัวอย่าง: เซสชันหนึ่งทำ
/office-hours, อีกเซสชันทำ/review, เซสชันที่สามพัฒนาฟีเจอร์ และเซสชันที่สี่ทำ/qaไปพร้อมกัน
— ผู้ก่อตั้ง, วิศวกรลีด และ PM สามารถฟอร์ก โรงงานพัฒนา AI นี้ไปทดลองและขยายต่อได้ด้วยตัวเอง
- ตัวอย่าง: เซสชันหนึ่งทำ
- นอกจาก Claude Code แล้ว ยังทำงานได้กับเอเจนต์ทุกตัวที่รองรับมาตรฐาน SKILL.md เช่น Codex, Gemini CLI, Cursor
- ไลเซนส์ MIT
4 ความคิดเห็น
ว้าว!! Garry Tan รีทวีต GeekNews แล้วนะ
https://x.com/garrytan/status/2035898375934300353
ใช้เวลานานมากกว่าจะถึง Office Hour เลยลองไปดู แล้วพบว่าแค่ skill นี้อันเดียว ความยาวของ markdown ก็ไม่ธรรมดาเลย
ดูเหมือนว่ามันกำลังพัฒนาไปในทิศทางที่คนทำธุรกิจคนเดียวจะนำไปใช้ประโยชน์ได้ดีขึ้นเรื่อย ๆ นะ
office-hours สนุกดีนะครับ ส่วนผมมีแบบ hands-on ครับ