เคล็ดลับและเทคนิคการทำ Agentic Coding ด้วย Gemini CLI

(github.com/addyosmani)

26 คะแนน โดย GN⁺ 2025-11-28 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Gemini CLI คือผู้ช่วย AI แบบโอเพนซอร์สจาก Google ที่ให้ใช้งานโมเดล Gemini ได้โดยตรงจากเทอร์มินัล และเป็น เครื่องมือบรรทัดคำสั่งแบบโต้ตอบ ที่สามารถเขียนโค้ด ดีบัก และทำงานอัตโนมัติผ่านคำสั่งภาษาธรรมชาติ
มี เคล็ดลับระดับผู้เชี่ยวชาญ ราว 30 ข้อ ครอบคลุมความสามารถขั้นสูง เช่น การจัดการคอนเท็กซ์แบบต่อเนื่องด้วย GEMINI.md, คำสั่งแบบกำหนดเอง, การขยายผ่านเซิร์ฟเวอร์ MCP, ฟีเจอร์หน่วยความจำ, และการกู้คืนเช็กพอยต์
มี ฟีเจอร์เพิ่มประสิทธิภาพเวิร์กโฟลว์นักพัฒนา เช่น การอ้างอิงไฟล์·รูปภาพด้วย @, โหมด YOLO (อนุมัติอัตโนมัติ), การทำงานแบบ headless, การทำงานหลายไดเรกทอรี และการเชื่อมต่อกับ IDE (VS Code)
รวมฟีเจอร์ใหม่ที่เน้น ระบบอัตโนมัติ·การสังเกตการณ์·การขยายระบบ เช่น GitHub Action, ส่วนขยาย (Extensions), เทเลเมทรี และ token caching
Gemini CLI กำลังพัฒนาจาก AI chat ธรรมดาไปเป็น แพลตฟอร์มพัฒนาแบบ agentic ที่ควบคุมสภาพแวดล้อมการพัฒนาได้แบบบูรณาการ

ภาพรวมของ Gemini CLI

Gemini CLI คือ อินเทอร์เฟซบรรทัดคำสั่งที่ขับเคลื่อนด้วย AI สำหรับใช้งานโมเดล Google Gemini ได้โดยตรงจากเทอร์มินัล
- พัฒนาด้วย Node.js/TypeScript และทำงานได้บนทุกระบบปฏิบัติการหลัก
- เมื่อป้อนคำสั่งเป็นภาษาธรรมชาติ จะสามารถทำงานหลายขั้นตอน เช่น สร้างโค้ด ดีบัก และตั้งค่าระบบ
ติดตั้งได้ด้วย npm install -g @google/gemini-cli หรือ npx @google/gemini-cli
รองรับการยืนยันตัวตนผ่าน การล็อกอินด้วยบัญชี Google (ฟรี) หรือ API key (แบบชำระเงิน/องค์กร)
- บัญชีฟรีส่งคำขอได้ประมาณ 60 ครั้งต่อนาที และ 1,000 ครั้งต่อวัน
- เมื่อใช้ API key จะมีการคุ้มครองข้อมูลที่เข้มงวดขึ้นและใช้นโยบายการเก็บ log
เริ่มใช้งานพื้นฐานด้วยคำสั่ง gemini และรองรับคำสั่ง / (ควบคุมเซสชัน) กับ ! (สั่งเชลล์)
- โดยค่าเริ่มต้นจะเปิดใช้ โหมดความปลอดภัย ที่ขอการยืนยันจากผู้ใช้ (Y/n) เมื่อต้องมีการเปลี่ยนแปลงระบบ

Tip 1 — จัดการคอนเท็กซ์แบบต่อเนื่องด้วย `GEMINI.md`

เก็บคำแนะนำหรือข้อมูลพื้นหลังรายโปรเจกต์ไว้ในไฟล์ GEMINI.md เพื่อให้ AI ตอบกลับด้วยคอนเท็กซ์เดิมอย่างสม่ำเสมอ
- เช่น สไตล์การเขียนโค้ด สถาปัตยกรรม กฎของฟังก์ชัน
รวมไฟล์แบบลำดับชั้นจาก global (~/.gemini/GEMINI.md) และรายโปรเจกต์ .gemini/GEMINI.md
ตรวจสอบคอนเท็กซ์ที่โหลดอยู่ได้ด้วย /memory show และรีเฟรชด้วย /memory refresh
สร้างเทมเพลตเริ่มต้นได้ด้วยคำสั่ง /init และรองรับการโหลดหลายไฟล์ด้วย @include

Tip 2 — สร้างคำสั่ง slash แบบกำหนดเอง

กำหนด คำสั่งแบบ custom ด้วยไฟล์ TOML เพื่อทำงานซ้ำ ๆ ให้เป็นอัตโนมัติ
- เช่น /test:gen → สร้าง Jest test จาก requirements
ลงทะเบียนได้ทั้งแบบ global (~/.gemini/commands/) หรือรายโปรเจกต์ (.gemini/commands/)
คำสั่งทำงานบนพื้นฐานของ prompt template และแชร์กันในทีมได้
มีประโยชน์ต่อ การทำเวิร์กโฟลว์ให้เป็นมาตรฐาน เช่น การจัดรูปแบบให้สม่ำเสมอ หรือกำหนดบทบาท (/review:security)

Tip 3 — ขยาย Gemini ด้วยเซิร์ฟเวอร์ MCP

เชื่อมต่อกับระบบภายนอกผ่านเซิร์ฟเวอร์ Model Context Protocol(MCP)
- เช่น Figma, Google Docs, Clipboard, ฐานข้อมูลภายในองค์กร
ลงทะเบียนเซิร์ฟเวอร์ได้ด้วยคำสั่ง gemini mcp add และบันทึกการตั้งค่าไว้ใน settings.json
ดูรายการเซิร์ฟเวอร์และเครื่องมือที่ลงทะเบียนไว้ได้ด้วยคำสั่ง /mcp
รองรับ OAuth 2.0 เพื่อเชื่อมต่อ API อย่างปลอดภัย

Tip 4 — เพิ่มและเรียกใช้หน่วยความจำ

บันทึกข้อมูลสำคัญไว้ในหน่วยความจำระยะยาวได้ด้วย /memory add "<text>"
- เช่น “RabbitMQ ใช้พอร์ต 5673”
ดูหน่วยความจำทั้งหมดได้ด้วย /memory show และรีเฟรชด้วย /memory refresh
เหมาะสำหรับเก็บบันทึกการตัดสินใจหรือการตั้งค่าส่วนตัว เช่น โทนการพูด ชื่อ เป็นต้น

Tip 5 — เช็กพอยต์และการกู้คืนด้วย `/restore`

สร้าง snapshot อัตโนมัติก่อนแก้ไขไฟล์ และย้อนกลับสถานะก่อนหน้าได้ด้วย /restore
เปิดใช้ได้ผ่านออปชัน --checkpointing หรือในไฟล์ตั้งค่า
ดูรายการเช็กพอยต์ได้ด้วย /restore list และกู้คืนด้วย /restore <id>
เมื่อนำมาใช้ร่วมกับ Git จะทำหน้าที่เป็น ตาข่ายนิรภัยสำหรับงานของ AI

Tip 6 — อ่าน Google Docs·Sheets

หากตั้งค่า Workspace MCP server แล้ว จะสามารถอ่านลิงก์ Google Docs/Sheets โดยตรงเพื่อสรุปเนื้อหาได้
ต้องยืนยันตัวตนด้วย OAuth และเข้าถึงได้ผ่านคำสั่งอย่าง /read_google_doc
อ้างอิงเอกสาร ชีต และไฟล์ Drive ผ่านลิงก์ได้ เพื่อ ใส่คอนเท็กซ์โดยไม่ต้องคัดลอกข้อมูล

Tip 7 — อ้างอิงไฟล์·รูปภาพด้วยไวยากรณ์ `@`

แนบโค้ด เอกสาร หรือรูปภาพเข้าไปใน prompt ได้โดยตรงด้วย @เส้นทางไฟล์
- เช่น Explain this code: @./src/main.js
เคารพกฎของ .gitignore และ .geminiignore โดยอัตโนมัติ
รองรับการรู้จำภาพ (รวม OCR) และการเปรียบเทียบหลายไฟล์

Tip 8 — สร้างเครื่องมือเฉพาะหน้า

Gemini สามารถ สร้างสคริปต์ชั่วคราวหรือเซิร์ฟเวอร์ MCP ได้เอง เมื่อต้องใช้
- เช่น JSON parser หรือ log analyzer
โค้ดที่สร้างขึ้นสามารถตรวจ diff แล้วค่อยอนุมัติได้
หากมีประโยชน์ก็สามารถยกระดับสคริปต์นั้นให้เป็นคำสั่ง custom ได้

Tip 9 — แก้ปัญหาและตั้งค่าระบบ

ใช้งานได้แม้อยู่นอกโปรเจกต์ และทำหน้าที่เป็น ผู้ช่วยดูแลสภาพแวดล้อมการพัฒนา
- เช่น แก้ .bashrc, วิเคราะห์ error log, ทำให้การติดตั้ง Docker เป็นอัตโนมัติ
จะขอการอนุมัติก่อนรันคำสั่งเสมอ ช่วยให้การปรับแต่งระบบปลอดภัยขึ้น

Tip 10 — โหมด YOLO (อนุมัติอัตโนมัติ)

ใช้ --yolo หรือ Ctrl+Y เพื่ออนุมัติการรันเครื่องมือทั้งหมดโดยอัตโนมัติ
มีประโยชน์ในการเร่งความเร็วงานซ้ำ ๆ แต่ มีความเสี่ยง
สามารถตั้ง whitelist เพื่ออนุมัติอัตโนมัติเฉพาะบางคำสั่งได้

Tip 11 — โหมด headless และ script mode

รันแบบไม่โต้ตอบได้ด้วย gemini -p "prompt"
เปลี่ยน system prompt ได้ด้วย GEMINI_SYSTEM_MD
รองรับเอาต์พุตแบบ JSON (--format=json) และไฟล์สรุปเซสชัน (--session-summary)
เหมาะสำหรับการเชื่อมเข้ากับ CI/CD และสคริปต์อัตโนมัติ

Tip 12 — บันทึกและกลับมาใช้ chat session ต่อ

บันทึกเซสชันได้ด้วย /chat save <name> และกู้คืนด้วย /chat resume <name>
ดูรายการได้ด้วย /chat list และแชร์ได้ด้วย /chat share
มีประโยชน์กับการดีบักที่กินเวลานานหรือการทำหลายโปรเจกต์พร้อมกัน

Tip 13 — เวิร์กสเปซหลายไดเรกทอรี

รวมหลายโฟลเดอร์เป็นเวิร์กสเปซเดียวได้ด้วย --include-directories หรือไฟล์ตั้งค่า
ตรวจดูโฟลเดอร์ที่รวมอยู่ปัจจุบันได้ด้วย /directory show
รองรับ สภาพแวดล้อมแบบ polyrepo เช่น การแก้ frontend และ backend พร้อมกัน

Tip 14 — จัดระเบียบไฟล์ด้วย AI

จัดหมวดหมู่และย้ายไฟล์ในไดเรกทอรีตามประเภท
- เช่น รูปภาพ→Images, PDF→Documents
เปลี่ยนชื่อไฟล์โดยอัตโนมัติตามเนื้อหาในรูปภาพได้
แนะนำให้ตรวจสอบอย่างปลอดภัยด้วยการ preview คำสั่งก่อนรัน

Tip 15 — รักษาคอนเท็กซ์ด้วยการบีบอัดบทสนทนา

ใช้คำสั่ง /compress เพื่อสรุปบทสนทนายาว ๆ และเพิ่มพื้นที่คอนเท็กซ์
ทำให้เซสชันดำเนินต่อได้โดยเก็บไว้เฉพาะข้อมูลสำคัญ
ตั้งค่า threshold สำหรับการบีบอัดอัตโนมัติได้

Tip 16 — รันคำสั่งเชลล์ด้วย `!`

ใช้ !command เพื่อรันคำสั่งเทอร์มินัลโดยตรง
หากพิมพ์แค่ ! จะเข้าสู่ shell mode และออกได้ด้วย ! อีกครั้ง
รวมการสนทนากับ AI และคำสั่งระบบไว้ใน อินเทอร์เฟซเดียว

Tip 17 — ใช้ทุกเครื่องมือ CLI เป็นเครื่องมือของ Gemini

AI สามารถเรียกใช้ทุกคำสั่งใน $PATH ได้
- เช่น convert, docker, ffmpeg, git
ตามสภาพแวดล้อม ควรจำกัด PATH หรือกำหนด whitelist

Tip 18 — ใช้อินพุตแบบมัลติโหมด

แนบไฟล์รูปภาพ PDF และเสียงด้วย @ เพื่อให้วิเคราะห์ได้
- เช่น อธิบายภาพหน้าจอ UI, วิเคราะห์ภาพ error, ทำ OCR
รองรับการสร้างโค้ดและดึงข้อมูลจากสื่อเชิงภาพ

Tip 19 — ควบคุม `$PATH` และการเข้าถึงเครื่องมือ

รันด้วย PATH ที่จำกัดเพื่อ เพิ่มเสถียรภาพและความปลอดภัย
สามารถบล็อกคำสั่งอันตรายได้ด้วย excludeTools ใน settings.json
รองรับการรันในสภาพแวดล้อมแยกด้วย Docker ผ่านออปชัน --sandbox

Tip 20 — token caching และการติดตามการใช้งาน

เมื่อใช้ API key หรือการยืนยันตัวตนแบบ Vertex จะสามารถ นำ token กลับมาใช้ซ้ำเพื่อลดค่าใช้จ่าย
ตรวจสอบ cache hit rate และการใช้ token ได้ด้วยคำสั่ง /stats
บันทึกรายงาน JSON รายเซสชันได้ด้วย --session-summary

Tip 21 — คัดลอกไปยังคลิปบอร์ดด้วย `/copy`

คัดลอกเอาต์พุตล่าสุด เช่น โค้ด ไปยังคลิปบอร์ดได้ทันที
รองรับ macOS(pbcopy), Windows(clip), Linux(xclip)

Tip 22 — ควบคุมปุ่มลัด `Ctrl+C`

กดหนึ่งครั้งเพื่อหยุดงานที่กำลังทำ กดสองครั้งเพื่อออกจาก CLI
ใน shell mode สามารถออกได้ด้วย Ctrl+C หรือ Esc

Tip 23 — ตั้งค่าผู้ใช้ด้วย `settings.json`

ปรับตั้งค่าละเอียดได้ เช่น ธีม sandbox การอนุมัติอัตโนมัติ และ Vim mode
รองรับการแก้ไขแบบโต้ตอบผ่านคำสั่ง /settings
รวมการตั้งค่าแบบ global (~/.gemini/) และรายโปรเจกต์เข้าด้วยกัน

Tip 24 — การเชื่อมต่อกับ VS Code

ส่วนขยาย VS Code (Companion Extension) ช่วย รู้จำไฟล์ เคอร์เซอร์ และพื้นที่ที่เลือกโดยอัตโนมัติ
เมื่อมีข้อเสนอให้เปลี่ยนโค้ด จะเปิด VS Code diff viewer ให้อัตโนมัติ
จัดการได้ด้วย /ide install, /ide enable, /ide status

Tip 25 — ทำงานอัตโนมัติด้วย GitHub Action

Gemini CLI GitHub Action ช่วยจัดหมวดหมู่ issue และทำ PR review แบบอัตโนมัติ
สามารถขอให้ทำงานอย่างการสร้าง test code ได้ด้วยการ mention @gemini-cli
สร้างไฟล์ workflow อัตโนมัติได้ด้วยคำสั่ง /setup-github

Tip 26 — เทเลเมทรี (Observability)

เก็บ metrics·logs·traces ของเซสชัน บนพื้นฐาน OpenTelemetry
เปิดใช้ได้ด้วยการตั้งค่า "telemetry.enabled": true หรือแฟล็ก --telemetry
ส่งข้อมูลไปยัง backend ได้หลากหลาย เช่น local file, GCP, Prometheus

Tip 27 — ติดตามโรดแมป

ดูฟีเจอร์ในอนาคตได้จาก Gemini CLI roadmap แบบสาธารณะบน GitHub
- เช่น background agent, การขยายโมเดล, การปรับปรุง UI
สามารถร่วมส่ง feedback และเสนอฟีเจอร์กับชุมชนได้

Tip 28 — ส่วนขยาย (Extensions)

ผสานรวมบริการภายนอกได้ด้วย gemini extensions install <URL>
- เช่น Cloud Run, BigQuery, Figma, Stripe
Extensions เป็นโครงสร้างแบบโมดูลาร์ที่เพิ่มเครื่องมือ MCP คำสั่ง และคอนเท็กซ์
ดูรายการส่วนขยายที่เปิดใช้งานได้ด้วยคำสั่ง /extensions

ฟีเจอร์เพิ่มเติม — Corgi Mode 🐕

ใช้คำสั่ง /corgi เพื่อแสดง แอนิเมชันคอร์กี้ ในเทอร์มินัล
เป็นเพียง easter egg เล็ก ๆ ที่ช่วยให้พักระหว่างใช้งาน CLI

บทสรุป

Gemini CLI คือ อินเทอร์เฟซสำหรับการพัฒนาที่ขับเคลื่อนด้วย AI ครอบคลุมตั้งแต่การเขียนโค้ด การจัดการระบบ ไปจนถึงระบบอัตโนมัติและการทำงานร่วมกัน
ด้วย GEMINI.md, MCP, ส่วนขยาย และการเชื่อมต่อกับ IDE ทำให้ได้ทั้ง คอนเท็กซ์แบบต่อเนื่องและความสามารถในการขยายเครื่องมือ
จากระบบนิเวศโอเพนซอร์สและการอัปเดตอย่างรวดเร็ว มันกำลังเติบโตเป็น แพลตฟอร์ม AI ศูนย์กลางของเวิร์กโฟลว์นักพัฒนา

1 ความคิดเห็น

GN⁺ 2025-11-28

ความคิดเห็นใน Hacker News

ฉันไม่ได้ตั้งค่าอะไรแบบนี้เลย
เพราะมัน ล้าสมัยเร็วเกินไป และ 80% ก็ใช้งานไม่ค่อยได้จริง
ฉันไม่คิดว่าจำเป็นต้องเขียน MCP server ขึ้นมาเอง ทั้งที่ยังไม่แน่ใจด้วยซ้ำว่า LLM จะเรียกใช้อย่างน่าเชื่อถือได้ไหม
กฎของฉันเรียบง่ายมาก — เขียน เอกสารสำหรับตัวเอง (เช่น template, checklist ฯลฯ) ขึ้นมาเอง แล้วให้ AI ลองทำดูหนึ่งครั้ง
ถ้าทำไม่ถูกในครั้งเดียวก็แก้เอกสาร หรือไม่ก็ลงมือทำเอง
- มุมมองที่ว่า LLM เป็น เครื่องสร้างเอกสารเชิงสถิติ ช่วยได้มาก
  ท้ายที่สุดแล้วความมีประโยชน์ของมันก็ขึ้นอยู่กับข้อมูลฝึกและวิวัฒนาการของโมเดล และฉันคิดว่าควรปฏิบัติกับมันเหมือน constraint programming ที่ไม่มีไวยากรณ์แบบเป็นทางการ
  เมื่อคำนึงถึงความกำกวมเชิงอัตวิสัยของภาษาธรรมชาติแล้ว การทำ iteration อย่างรวดเร็วด้วยการค่อย ๆ ปรับประโยคข้อจำกัดจึงเป็นวิธีที่ดีที่สุด
  ตัวอย่างเช่น ฉันเคยวน Gemini อยู่ 4 รอบจนได้ bash script ที่ทำงานอัตโนมัติได้สมบูรณ์
  ดูแนวคิดที่เกี่ยวข้องได้ที่ Constraint programming
- ช่วงหลังเอเจนต์ต่าง ๆ เริ่มสามารถทำ วงจร build-test-fix ได้ด้วยตัวเอง ซึ่งช่วยได้มาก
  ฉันสามารถโยนงานระดับนักพัฒนาจูเนียร์ให้มันทำ แล้วตัวเองไปทำอย่างอื่นได้
- แนวทางที่ปฏิบัติต่อ AI agent เหมือนเป็น นักพัฒนาใหม่ในทีม ได้ผลดี
  ถ้าล้มเหลวในครั้งเดียว ก็ปรับปรุงเอกสาร (.md file) แล้วลองใหม่
  ฉันไม่ค่อยใช้ MCP เพราะความเสี่ยงด้านความปลอดภัย แต่ลูปแบบนี้ค่อนข้างมีประสิทธิภาพ
  ในทางกลับกัน การบอกว่า “ถ้าครั้งเดียวไม่สำเร็จฉันจะทำเอง” ก็เหมือนกับไล่พนักงานใหม่ออกทันที
- ตอนนี้ฉันรู้สึกว่าการพัฒนาซอฟต์แวร์กำลังมุ่งหน้าไปสู่ plateau ใหม่
  เรายังไปไม่ถึงจุดนั้น และทักษะที่กำลังสั่งสมตอนนี้ก็เหมือนสร้างอะไรบางอย่างไว้บนทางลาด
- ฉันมองว่าทั้งสองแนวทางมีประโยชน์
  1. เริ่มด้วย session ใหม่ เพื่อหลีกเลี่ยง context ปนเปื้อน และ
  2. เชื่อมต่อเครื่องมือหลายอย่างเข้าด้วยกันเพื่อให้ทำงานง่ายขึ้น (ดูบทความล่าสุดของ Anthropic)
    ตอนนี้วิธีประเมิน prompt ยังไม่น่าเชื่อถือพอ ฉันเลยกำลังสร้าง agentic setting เพื่อปรับปรุงเรื่องนี้ด้วยตัวเอง
    เมื่อวานเพิ่งเพิ่มฟีเจอร์ time travel ของ session บนพื้นฐาน Dagger และวันนี้ตั้งใจจะใส่ฟีเจอร์ fork, clone และ registry
Gemini CLI ยังอ่อนกับงานเขียนโค้ดที่ซับซ้อน
เพราะมีแค่ ReAct loop แบบง่าย ๆ และ ความสามารถในการเรียกใช้เครื่องมือ ที่ยังไม่แข็งแรง
ถึงอย่างนั้นก็ยังมีศักยภาพสูง เพราะกำลังถูกพัฒนาอย่างคึกคักในฐานะโอเพนซอร์ส
ด้วย context window 1M (เร็ว ๆ นี้จะเป็น 2M) และโควตาฟรีที่ให้มาเยอะ ฉันเลยคิดว่าควร “ใช้มันให้หนักไปเลย (ABUSE IT)”
ฉันใช้มันเป็นเครื่องมือ orchestration แบบ TUI/CLI และมันก็มีประโยชน์พอสมควรในการประเมินโค้ดที่เครื่องมืออื่นสร้างขึ้นมา
ช่วงหลังฉันเชื่อม Homebrew กับ MCP และต่อเข้ากับ Knowledge Manager บน LLM แบบ local (Nowledge Mem)
ที่น่าสนใจคือฉันยังเห็นกรณีที่ใช้ Gemini CLI เป็น SubAgent เพื่อหลีกเลี่ยงไม่ให้ context หลักปนเปื้อนด้วย
ทวีตที่เกี่ยวข้อง
- Gemini CLI นี่ เหมือนสัตว์ป่าจริง ๆ
  ต่อให้บอกว่า “อย่าแก้โค้ด แค่เสนอแนะก็พอ” มันก็ยังแก้ไฟล์ทันที
  Pro 3 ฉลาดก็จริง แต่ การทำตามคำสั่ง ยังไม่นิ่ง
- ฉันทดสอบ Gemini 3 Pro แบบคร่าว ๆ แล้วพบว่า แม้แต่ งานเขียนโค้ดพื้นฐาน ก็ยังลำบาก
  ฉันลองผ่าน Antigravity แต่เพราะโควตาจำกัด เลยทดสอบอะไรซับซ้อนมากไม่ได้
  ดูความเห็นแบบละเอียดได้ใน บทความนี้
Addy Osmani เป็น วิศวกรซอฟต์แวร์ชาวไอริช ที่ดูแลงาน Google Chrome และ Gemini และเป็นผู้คร่ำหวอดในวงการมานาน 25 ปี
เขาหลงใหลในการปรับปรุงประสิทธิภาพเว็บและเครื่องมือพัฒนาที่มี AI ช่วย และเป็นผู้เขียนหนังสือหลายเล่ม เช่น 『Learning JavaScript Design Patterns』
- เขาเคยได้รางวัลจาก การแข่งขัน Irish Young Scientist ก่อน Patrick Collison อยู่ 2 ปี
  ลิงก์การแข่งขัน
- เขาได้รับ ชื่อเสียงสูงมาก ในชุมชน web performance
- เห็นว่าช่วง 5 ปีหลังออกหนังสือมา 11 เล่ม เลยสงสัยว่าใช้ AI ช่วยเขียน หรือเปล่า
ฉันอยากให้ coding agent แบบ ไม่ผูกกับ LLM เจ้าใดเจ้าหนึ่ง (agnostic) กลายเป็นมาตรฐาน
แทนที่แต่ละเจ้าจะสร้างทุกอย่างขึ้นมาใหม่เองแบบ Codex หรือ Gemini CLI ถ้าสามารถ สลับผู้ให้บริการ LLM ได้แบบ plugin ก็คงดี
ตอนนี้ Claude Code ยังดีที่สุด แต่ดูเหมือน Anthropic จะไม่เดินไปในทิศทางนั้น
สุดท้ายคงต้องรอ โอเพนซอร์ส coding agent รุ่นถัดไป
- จริง ๆ แล้วมีเครื่องมือแบบนั้นอยู่แล้วคือ Aider (aider.chat)
  เพียงแต่ว่า CLI พวกนี้ใกล้เคียงกับการเป็นอินเทอร์เฟซสำหรับ โมเดลแบบสมัครสมาชิก มากกว่าการเป็นเครื่องมือจริง
  โมเดลรุ่นใหม่ใช้ token สิ้นเปลืองมาก จนการจ่ายรายเดือนสมเหตุสมผลกว่าคิดค่าบริการผ่าน API
- Opencode (ทำโดย SST) เป็นตัวอย่างที่ทำวิสัยทัศน์แบบนั้นออกมาได้ดี
  ฉันลองใช้มาสองสามวันล่าสุดแล้วค่อนข้างพอใจ
  ลิงก์ GitHub
  ยังมีทางเลือกอื่นอีกหลายตัว เช่น Crush, Aider, Amp Code, Emacs+gptel, Editor Code Assistant
  แต่เพราะ การร่วมวิวัฒน์ (co-design) ระหว่าง LLM กับ coding agent ยังสำคัญมาก การแยกกันแบบสมบูรณ์จึงยังไม่สมจริงนัก
- ฉันคิดว่าเหตุผลที่ Claude Code ดีที่สุด ก็เพราะมัน ไม่ได้เป็นแบบ agnostic นี่แหละ
- Cursor ก็เป็นอีกทางเลือกที่ดี
  น่าขันตรงที่ตอนนี้มันมี LLM ของตัวเองแล้ว
  แนะนำ Cursor Composer
- ถ้าเป็นเครื่องมือที่ไม่ผูกกับโมเดล แนะนำ Roo Code หรือ fork ของมันอย่าง Kilo
ฉันใช้ Gemini CLI มาได้หลายเดือนแล้ว
ที่บริษัทมี subscription ฟรีเลยได้ลองใช้ต่อเนื่อง
มันบอกว่ารู้จักไฟล์ GEMINI.md แต่ในทางปฏิบัติก็มักจะเมินมัน
ถึงอย่างนั้น tip อย่าง Tip 12 กับ Tip 16 ก็มีประโยชน์
ปัญหา hallucination ของ AI ก็ยังมีอยู่ แต่เป็นครั้งแรกที่ทำให้ฉันรู้สึกว่า AI ‘สนุก’ จริง ๆ
โดยเฉพาะตอนให้มัน debug คลัสเตอร์ K8s แบบอัตโนมัติ ทั้งการดึง log และหาข้อผิดพลาด ทำให้ทึ่งมาก
บางครั้งถ้ามันทำตัวโง่เกินไป ฉันก็พิมพ์ /quit แล้วลงมือเอง แต่โดยรวมก็ยังใช้มันอย่างสนุก
- การที่ Gemini CLI มา debug คลัสเตอร์ K8s แบบ real-time ได้นี่ เหนือจริงมาก
  ฉันเองก็เพิ่งสร้างคลัสเตอร์ RKE2 เสร็จ อยากลองบ้างเลย
ฉันชอบ AI มาก
มันให้ความรู้สึกเหมือนเป็นเครื่องมือจำเป็นที่ทำให้ฉัน เป็นมนุษย์ที่มีประสิทธิภาพมากขึ้น คล้ายกับอินเทอร์เน็ตหรือ iPhone
แต่ฉันเริ่มล้ากับ tutorial ว่าด้วยการใช้ AI มากแล้ว
ส่วนใหญ่คุณภาพต่ำ และบทความนี้ก็แค่ดีกว่าทั่วไปหน่อย
มันเหมือนกับเวลานักพัฒนา JS ออกมาแนะนำ framework ใหม่ทุกสัปดาห์
- ช่วงนี้บทความแนว “ต้องใช้ LLM แบบนี้” นี่ น่าเบื่อจริง ๆ
  ไม่ว่าใครจะเขียน เขียนจากใจ หรือแค่เพื่อ engagement ก็ตาม ฉันก็ไม่สนใจแล้ว
พูดตรง ๆ ว่าการตั้งค่าซับซ้อนแบบนี้มันเกินจำเป็น
สำหรับฉัน แค่ prompt แบบตะโกนใส่ AI ก็ใช้งานได้ดีพอแล้ว
มีแค่ LazyVim กับเครื่องมือไม่กี่ตัว (git, ask, ripgrep) ก็ productive ได้มากพอ
โดยเฉพาะ Gemini 3 ที่มี token density สูงและ context ใหญ่มาก เลยมีประโยชน์มาก
ถ้า context เริ่มมากเกินไป ฉันก็ให้มันเขียนสรุปลง README.MD แล้วเริ่มเอเจนต์ใหม่
ลิงก์เครื่องมือ ask
- ฉันก็ใช้คล้าย ๆ กัน และ Gemini 3 ทำได้ดีกว่าแบบขาดลอย
  โมเดลอื่นไม่ค่อยช่วยเพิ่มผลิตภาพ แต่ตอนนี้งานซับซ้อนก็สำเร็จได้ 80% ตั้งแต่ครั้งแรก
ความ ตัดกัน ระหว่างการเขียนสคริปต์ด้วยมือกับ workflow ที่มี LLM ช่วยนั้นน่าสนใจ
ถ้าเงื่อนไขข้อจำกัดไม่ชัด ทั้งสองแบบก็ล้มเหลวได้เหมือนกัน แต่ถ้าชัดเจน LLM จะทำงานได้อย่างน่าทึ่งและค่อนข้างเชื่อถือได้
ปัญหาของการเขียนโค้ดแบบ AI/Agentic/Vibe ในช่วงนี้คือ มันวิวัฒน์เร็วเกินไป
best practice ยังไม่ทันตั้งหลักก็ล้าสมัยแล้ว
เมื่อก่อนต่อให้ภาษาและ framework เปลี่ยน วิธีแยกปัญหาและทำความเข้าใจ codebase ก็ยังค่อนข้างเสถียร
แต่ตอนนี้ฉันไม่แน่ใจแล้วว่าจุดสมดุลอยู่ตรงไหน
ฉันรู้สึกว่า Gemini CLI ไม่ค่อยดี
ถ้าจำเป็นต้องใช้ ฉันแนะนำ Opencode
Google เองก็ควร สร้าง CLI ขึ้นมาใหม่ตั้งแต่ต้น เหมือน Codex
- แต่ละคนอาจไม่เหมือนกัน สำหรับฉัน Gemini CLI เร็วและเสถียร มาก เลยใช้เป็นเครื่องมือหลัก
- Opencode เองก็เพิ่ง เปลี่ยน TUI ใหม่หมด เมื่อไม่นานมานี้
  อนึ่ง ตอนนี้ Gemini 3 ยังใช้บน Opencode ผ่าน Copilot ไม่ได้
  ลิงก์ issue
- ถ้าจะใช้ Opencode เห็นว่าต้องมี terminal emulator บางตัวเท่านั้น (WezTerm, Alacritty, Ghostty, Kitty)
  ฉันเลยสงสัยว่าทำไม TUI ธรรมดาถึงต้องมีข้อจำกัดแบบนี้
  จาก เอกสารทางการ Gemini ไม่ได้ถูกพูดถึงตรง ๆ และดูเหมือนจะให้ใช้งานผ่าน Google Vertex AI
  บางทีอาจเชื่อม Gemini ผ่าน subscription ของ Google Workspace ได้ก็ได้
- ฉันสงสัยว่า Codex เป็นยังไงบ้าง — เขาสร้างมันใหม่จริง ๆ เหรอ?

เคล็ดลับและเทคนิคการทำ Agentic Coding ด้วย Gemini CLI

ภาพรวมของ Gemini CLI

Tip 1 — จัดการคอนเท็กซ์แบบต่อเนื่องด้วย GEMINI.md

Tip 2 — สร้างคำสั่ง slash แบบกำหนดเอง

Tip 3 — ขยาย Gemini ด้วยเซิร์ฟเวอร์ MCP

Tip 4 — เพิ่มและเรียกใช้หน่วยความจำ

Tip 5 — เช็กพอยต์และการกู้คืนด้วย /restore

Tip 6 — อ่าน Google Docs·Sheets

Tip 7 — อ้างอิงไฟล์·รูปภาพด้วยไวยากรณ์ @

Tip 8 — สร้างเครื่องมือเฉพาะหน้า

Tip 9 — แก้ปัญหาและตั้งค่าระบบ

Tip 10 — โหมด YOLO (อนุมัติอัตโนมัติ)

Tip 11 — โหมด headless และ script mode

Tip 12 — บันทึกและกลับมาใช้ chat session ต่อ

Tip 13 — เวิร์กสเปซหลายไดเรกทอรี

Tip 14 — จัดระเบียบไฟล์ด้วย AI

Tip 15 — รักษาคอนเท็กซ์ด้วยการบีบอัดบทสนทนา

Tip 16 — รันคำสั่งเชลล์ด้วย !

Tip 17 — ใช้ทุกเครื่องมือ CLI เป็นเครื่องมือของ Gemini

Tip 18 — ใช้อินพุตแบบมัลติโหมด

Tip 19 — ควบคุม $PATH และการเข้าถึงเครื่องมือ

Tip 20 — token caching และการติดตามการใช้งาน

Tip 21 — คัดลอกไปยังคลิปบอร์ดด้วย /copy

Tip 22 — ควบคุมปุ่มลัด Ctrl+C

Tip 23 — ตั้งค่าผู้ใช้ด้วย settings.json

Tip 24 — การเชื่อมต่อกับ VS Code

Tip 25 — ทำงานอัตโนมัติด้วย GitHub Action

Tip 26 — เทเลเมทรี (Observability)

Tip 27 — ติดตามโรดแมป

Tip 28 — ส่วนขยาย (Extensions)

ฟีเจอร์เพิ่มเติม — Corgi Mode 🐕

บทสรุป

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นใน Hacker News

Tip 1 — จัดการคอนเท็กซ์แบบต่อเนื่องด้วย `GEMINI.md`

Tip 5 — เช็กพอยต์และการกู้คืนด้วย `/restore`

Tip 7 — อ้างอิงไฟล์·รูปภาพด้วยไวยากรณ์ `@`

Tip 16 — รันคำสั่งเชลล์ด้วย `!`

Tip 19 — ควบคุม `$PATH` และการเข้าถึงเครื่องมือ

Tip 21 — คัดลอกไปยังคลิปบอร์ดด้วย `/copy`

Tip 22 — ควบคุมปุ่มลัด `Ctrl+C`

Tip 23 — ตั้งค่าผู้ใช้ด้วย `settings.json`