- Gemini CLI คือผู้ช่วย AI แบบโอเพนซอร์สจาก Google ที่ให้ใช้งานโมเดล Gemini ได้โดยตรงจากเทอร์มินัล และเป็น เครื่องมือบรรทัดคำสั่งแบบโต้ตอบ ที่สามารถเขียนโค้ด ดีบัก และทำงานอัตโนมัติผ่านคำสั่งภาษาธรรมชาติ
- มี เคล็ดลับระดับผู้เชี่ยวชาญ ราว 30 ข้อ ครอบคลุมความสามารถขั้นสูง เช่น การจัดการคอนเท็กซ์แบบต่อเนื่องด้วย
GEMINI.md, คำสั่งแบบกำหนดเอง, การขยายผ่านเซิร์ฟเวอร์ MCP, ฟีเจอร์หน่วยความจำ, และการกู้คืนเช็กพอยต์
- มี ฟีเจอร์เพิ่มประสิทธิภาพเวิร์กโฟลว์นักพัฒนา เช่น การอ้างอิงไฟล์·รูปภาพด้วย
@, โหมด YOLO (อนุมัติอัตโนมัติ), การทำงานแบบ headless, การทำงานหลายไดเรกทอรี และการเชื่อมต่อกับ IDE (VS Code)
- รวมฟีเจอร์ใหม่ที่เน้น ระบบอัตโนมัติ·การสังเกตการณ์·การขยายระบบ เช่น GitHub Action, ส่วนขยาย (Extensions), เทเลเมทรี และ token caching
- Gemini CLI กำลังพัฒนาจาก AI chat ธรรมดาไปเป็น แพลตฟอร์มพัฒนาแบบ agentic ที่ควบคุมสภาพแวดล้อมการพัฒนาได้แบบบูรณาการ
ภาพรวมของ Gemini CLI
- Gemini CLI คือ อินเทอร์เฟซบรรทัดคำสั่งที่ขับเคลื่อนด้วย AI สำหรับใช้งานโมเดล Google Gemini ได้โดยตรงจากเทอร์มินัล
- พัฒนาด้วย Node.js/TypeScript และทำงานได้บนทุกระบบปฏิบัติการหลัก
- เมื่อป้อนคำสั่งเป็นภาษาธรรมชาติ จะสามารถทำงานหลายขั้นตอน เช่น สร้างโค้ด ดีบัก และตั้งค่าระบบ
- ติดตั้งได้ด้วย
npm install -g @google/gemini-cli หรือ npx @google/gemini-cli
- รองรับการยืนยันตัวตนผ่าน การล็อกอินด้วยบัญชี Google (ฟรี) หรือ API key (แบบชำระเงิน/องค์กร)
- บัญชีฟรีส่งคำขอได้ประมาณ 60 ครั้งต่อนาที และ 1,000 ครั้งต่อวัน
- เมื่อใช้ API key จะมีการคุ้มครองข้อมูลที่เข้มงวดขึ้นและใช้นโยบายการเก็บ log
- เริ่มใช้งานพื้นฐานด้วยคำสั่ง
gemini และรองรับคำสั่ง / (ควบคุมเซสชัน) กับ ! (สั่งเชลล์)
- โดยค่าเริ่มต้นจะเปิดใช้ โหมดความปลอดภัย ที่ขอการยืนยันจากผู้ใช้ (Y/n) เมื่อต้องมีการเปลี่ยนแปลงระบบ
Tip 1 — จัดการคอนเท็กซ์แบบต่อเนื่องด้วย GEMINI.md
- เก็บคำแนะนำหรือข้อมูลพื้นหลังรายโปรเจกต์ไว้ในไฟล์
GEMINI.md เพื่อให้ AI ตอบกลับด้วยคอนเท็กซ์เดิมอย่างสม่ำเสมอ
- เช่น สไตล์การเขียนโค้ด สถาปัตยกรรม กฎของฟังก์ชัน
- รวมไฟล์แบบลำดับชั้นจาก global (
~/.gemini/GEMINI.md) และรายโปรเจกต์ .gemini/GEMINI.md
- ตรวจสอบคอนเท็กซ์ที่โหลดอยู่ได้ด้วย
/memory show และรีเฟรชด้วย /memory refresh
- สร้างเทมเพลตเริ่มต้นได้ด้วยคำสั่ง
/init และรองรับการโหลดหลายไฟล์ด้วย @include
Tip 2 — สร้างคำสั่ง slash แบบกำหนดเอง
- กำหนด คำสั่งแบบ custom ด้วยไฟล์ TOML เพื่อทำงานซ้ำ ๆ ให้เป็นอัตโนมัติ
- เช่น
/test:gen → สร้าง Jest test จาก requirements
- ลงทะเบียนได้ทั้งแบบ global (
~/.gemini/commands/) หรือรายโปรเจกต์ (.gemini/commands/)
- คำสั่งทำงานบนพื้นฐานของ prompt template และแชร์กันในทีมได้
- มีประโยชน์ต่อ การทำเวิร์กโฟลว์ให้เป็นมาตรฐาน เช่น การจัดรูปแบบให้สม่ำเสมอ หรือกำหนดบทบาท (
/review:security)
Tip 3 — ขยาย Gemini ด้วยเซิร์ฟเวอร์ MCP
- เชื่อมต่อกับระบบภายนอกผ่านเซิร์ฟเวอร์ Model Context Protocol(MCP)
- เช่น Figma, Google Docs, Clipboard, ฐานข้อมูลภายในองค์กร
- ลงทะเบียนเซิร์ฟเวอร์ได้ด้วยคำสั่ง
gemini mcp add และบันทึกการตั้งค่าไว้ใน settings.json
- ดูรายการเซิร์ฟเวอร์และเครื่องมือที่ลงทะเบียนไว้ได้ด้วยคำสั่ง
/mcp
- รองรับ OAuth 2.0 เพื่อเชื่อมต่อ API อย่างปลอดภัย
Tip 4 — เพิ่มและเรียกใช้หน่วยความจำ
- บันทึกข้อมูลสำคัญไว้ในหน่วยความจำระยะยาวได้ด้วย
/memory add "<text>"
- เช่น “RabbitMQ ใช้พอร์ต 5673”
- ดูหน่วยความจำทั้งหมดได้ด้วย
/memory show และรีเฟรชด้วย /memory refresh
- เหมาะสำหรับเก็บบันทึกการตัดสินใจหรือการตั้งค่าส่วนตัว เช่น โทนการพูด ชื่อ เป็นต้น
Tip 5 — เช็กพอยต์และการกู้คืนด้วย /restore
- สร้าง snapshot อัตโนมัติก่อนแก้ไขไฟล์ และย้อนกลับสถานะก่อนหน้าได้ด้วย
/restore
- เปิดใช้ได้ผ่านออปชัน
--checkpointing หรือในไฟล์ตั้งค่า
- ดูรายการเช็กพอยต์ได้ด้วย
/restore list และกู้คืนด้วย /restore <id>
- เมื่อนำมาใช้ร่วมกับ Git จะทำหน้าที่เป็น ตาข่ายนิรภัยสำหรับงานของ AI
Tip 6 — อ่าน Google Docs·Sheets
- หากตั้งค่า Workspace MCP server แล้ว จะสามารถอ่านลิงก์ Google Docs/Sheets โดยตรงเพื่อสรุปเนื้อหาได้
- ต้องยืนยันตัวตนด้วย OAuth และเข้าถึงได้ผ่านคำสั่งอย่าง
/read_google_doc
- อ้างอิงเอกสาร ชีต และไฟล์ Drive ผ่านลิงก์ได้ เพื่อ ใส่คอนเท็กซ์โดยไม่ต้องคัดลอกข้อมูล
Tip 7 — อ้างอิงไฟล์·รูปภาพด้วยไวยากรณ์ @
- แนบโค้ด เอกสาร หรือรูปภาพเข้าไปใน prompt ได้โดยตรงด้วย
@เส้นทางไฟล์
- เช่น
Explain this code: @./src/main.js
- เคารพกฎของ
.gitignore และ .geminiignore โดยอัตโนมัติ
- รองรับการรู้จำภาพ (รวม OCR) และการเปรียบเทียบหลายไฟล์
Tip 8 — สร้างเครื่องมือเฉพาะหน้า
- Gemini สามารถ สร้างสคริปต์ชั่วคราวหรือเซิร์ฟเวอร์ MCP ได้เอง เมื่อต้องใช้
- เช่น JSON parser หรือ log analyzer
- โค้ดที่สร้างขึ้นสามารถตรวจ diff แล้วค่อยอนุมัติได้
- หากมีประโยชน์ก็สามารถยกระดับสคริปต์นั้นให้เป็นคำสั่ง custom ได้
Tip 9 — แก้ปัญหาและตั้งค่าระบบ
- ใช้งานได้แม้อยู่นอกโปรเจกต์ และทำหน้าที่เป็น ผู้ช่วยดูแลสภาพแวดล้อมการพัฒนา
- เช่น แก้
.bashrc, วิเคราะห์ error log, ทำให้การติดตั้ง Docker เป็นอัตโนมัติ
- จะขอการอนุมัติก่อนรันคำสั่งเสมอ ช่วยให้การปรับแต่งระบบปลอดภัยขึ้น
Tip 10 — โหมด YOLO (อนุมัติอัตโนมัติ)
- ใช้
--yolo หรือ Ctrl+Y เพื่ออนุมัติการรันเครื่องมือทั้งหมดโดยอัตโนมัติ
- มีประโยชน์ในการเร่งความเร็วงานซ้ำ ๆ แต่ มีความเสี่ยง
- สามารถตั้ง whitelist เพื่ออนุมัติอัตโนมัติเฉพาะบางคำสั่งได้
Tip 11 — โหมด headless และ script mode
- รันแบบไม่โต้ตอบได้ด้วย
gemini -p "prompt"
- เปลี่ยน system prompt ได้ด้วย
GEMINI_SYSTEM_MD
- รองรับเอาต์พุตแบบ JSON (
--format=json) และไฟล์สรุปเซสชัน (--session-summary)
- เหมาะสำหรับการเชื่อมเข้ากับ CI/CD และสคริปต์อัตโนมัติ
Tip 12 — บันทึกและกลับมาใช้ chat session ต่อ
- บันทึกเซสชันได้ด้วย
/chat save <name> และกู้คืนด้วย /chat resume <name>
- ดูรายการได้ด้วย
/chat list และแชร์ได้ด้วย /chat share
- มีประโยชน์กับการดีบักที่กินเวลานานหรือการทำหลายโปรเจกต์พร้อมกัน
Tip 13 — เวิร์กสเปซหลายไดเรกทอรี
- รวมหลายโฟลเดอร์เป็นเวิร์กสเปซเดียวได้ด้วย
--include-directories หรือไฟล์ตั้งค่า
- ตรวจดูโฟลเดอร์ที่รวมอยู่ปัจจุบันได้ด้วย
/directory show
- รองรับ สภาพแวดล้อมแบบ polyrepo เช่น การแก้ frontend และ backend พร้อมกัน
Tip 14 — จัดระเบียบไฟล์ด้วย AI
- จัดหมวดหมู่และย้ายไฟล์ในไดเรกทอรีตามประเภท
- เช่น รูปภาพ→Images, PDF→Documents
- เปลี่ยนชื่อไฟล์โดยอัตโนมัติตามเนื้อหาในรูปภาพได้
- แนะนำให้ตรวจสอบอย่างปลอดภัยด้วยการ preview คำสั่งก่อนรัน
Tip 15 — รักษาคอนเท็กซ์ด้วยการบีบอัดบทสนทนา
- ใช้คำสั่ง
/compress เพื่อสรุปบทสนทนายาว ๆ และเพิ่มพื้นที่คอนเท็กซ์
- ทำให้เซสชันดำเนินต่อได้โดยเก็บไว้เฉพาะข้อมูลสำคัญ
- ตั้งค่า threshold สำหรับการบีบอัดอัตโนมัติได้
Tip 16 — รันคำสั่งเชลล์ด้วย !
- ใช้
!command เพื่อรันคำสั่งเทอร์มินัลโดยตรง
- หากพิมพ์แค่
! จะเข้าสู่ shell mode และออกได้ด้วย ! อีกครั้ง
- รวมการสนทนากับ AI และคำสั่งระบบไว้ใน อินเทอร์เฟซเดียว
Tip 17 — ใช้ทุกเครื่องมือ CLI เป็นเครื่องมือของ Gemini
- AI สามารถเรียกใช้ทุกคำสั่งใน
$PATH ได้
- เช่น
convert, docker, ffmpeg, git
- ตามสภาพแวดล้อม ควรจำกัด PATH หรือกำหนด whitelist
Tip 18 — ใช้อินพุตแบบมัลติโหมด
- แนบไฟล์รูปภาพ PDF และเสียงด้วย
@ เพื่อให้วิเคราะห์ได้
- เช่น อธิบายภาพหน้าจอ UI, วิเคราะห์ภาพ error, ทำ OCR
- รองรับการสร้างโค้ดและดึงข้อมูลจากสื่อเชิงภาพ
Tip 19 — ควบคุม $PATH และการเข้าถึงเครื่องมือ
- รันด้วย PATH ที่จำกัดเพื่อ เพิ่มเสถียรภาพและความปลอดภัย
- สามารถบล็อกคำสั่งอันตรายได้ด้วย
excludeTools ใน settings.json
- รองรับการรันในสภาพแวดล้อมแยกด้วย Docker ผ่านออปชัน
--sandbox
Tip 20 — token caching และการติดตามการใช้งาน
- เมื่อใช้ API key หรือการยืนยันตัวตนแบบ Vertex จะสามารถ นำ token กลับมาใช้ซ้ำเพื่อลดค่าใช้จ่าย
- ตรวจสอบ cache hit rate และการใช้ token ได้ด้วยคำสั่ง
/stats
- บันทึกรายงาน JSON รายเซสชันได้ด้วย
--session-summary
Tip 21 — คัดลอกไปยังคลิปบอร์ดด้วย /copy
- คัดลอกเอาต์พุตล่าสุด เช่น โค้ด ไปยังคลิปบอร์ดได้ทันที
- รองรับ macOS(
pbcopy), Windows(clip), Linux(xclip)
Tip 22 — ควบคุมปุ่มลัด Ctrl+C
- กดหนึ่งครั้งเพื่อหยุดงานที่กำลังทำ กดสองครั้งเพื่อออกจาก CLI
- ใน shell mode สามารถออกได้ด้วย
Ctrl+C หรือ Esc
Tip 23 — ตั้งค่าผู้ใช้ด้วย settings.json
- ปรับตั้งค่าละเอียดได้ เช่น ธีม sandbox การอนุมัติอัตโนมัติ และ Vim mode
- รองรับการแก้ไขแบบโต้ตอบผ่านคำสั่ง
/settings
- รวมการตั้งค่าแบบ global (
~/.gemini/) และรายโปรเจกต์เข้าด้วยกัน
Tip 24 — การเชื่อมต่อกับ VS Code
- ส่วนขยาย VS Code (Companion Extension) ช่วย รู้จำไฟล์ เคอร์เซอร์ และพื้นที่ที่เลือกโดยอัตโนมัติ
- เมื่อมีข้อเสนอให้เปลี่ยนโค้ด จะเปิด VS Code diff viewer ให้อัตโนมัติ
- จัดการได้ด้วย
/ide install, /ide enable, /ide status
Tip 25 — ทำงานอัตโนมัติด้วย GitHub Action
- Gemini CLI GitHub Action ช่วยจัดหมวดหมู่ issue และทำ PR review แบบอัตโนมัติ
- สามารถขอให้ทำงานอย่างการสร้าง test code ได้ด้วยการ mention
@gemini-cli
- สร้างไฟล์ workflow อัตโนมัติได้ด้วยคำสั่ง
/setup-github
Tip 26 — เทเลเมทรี (Observability)
- เก็บ metrics·logs·traces ของเซสชัน บนพื้นฐาน OpenTelemetry
- เปิดใช้ได้ด้วยการตั้งค่า
"telemetry.enabled": true หรือแฟล็ก --telemetry
- ส่งข้อมูลไปยัง backend ได้หลากหลาย เช่น local file, GCP, Prometheus
Tip 27 — ติดตามโรดแมป
- ดูฟีเจอร์ในอนาคตได้จาก Gemini CLI roadmap แบบสาธารณะบน GitHub
- เช่น background agent, การขยายโมเดล, การปรับปรุง UI
- สามารถร่วมส่ง feedback และเสนอฟีเจอร์กับชุมชนได้
Tip 28 — ส่วนขยาย (Extensions)
- ผสานรวมบริการภายนอกได้ด้วย
gemini extensions install <URL>
- เช่น Cloud Run, BigQuery, Figma, Stripe
- Extensions เป็นโครงสร้างแบบโมดูลาร์ที่เพิ่มเครื่องมือ MCP คำสั่ง และคอนเท็กซ์
- ดูรายการส่วนขยายที่เปิดใช้งานได้ด้วยคำสั่ง
/extensions
ฟีเจอร์เพิ่มเติม — Corgi Mode 🐕
- ใช้คำสั่ง
/corgi เพื่อแสดง แอนิเมชันคอร์กี้ ในเทอร์มินัล
- เป็นเพียง easter egg เล็ก ๆ ที่ช่วยให้พักระหว่างใช้งาน CLI
บทสรุป
- Gemini CLI คือ อินเทอร์เฟซสำหรับการพัฒนาที่ขับเคลื่อนด้วย AI ครอบคลุมตั้งแต่การเขียนโค้ด การจัดการระบบ ไปจนถึงระบบอัตโนมัติและการทำงานร่วมกัน
- ด้วย
GEMINI.md, MCP, ส่วนขยาย และการเชื่อมต่อกับ IDE ทำให้ได้ทั้ง คอนเท็กซ์แบบต่อเนื่องและความสามารถในการขยายเครื่องมือ
- จากระบบนิเวศโอเพนซอร์สและการอัปเดตอย่างรวดเร็ว มันกำลังเติบโตเป็น แพลตฟอร์ม AI ศูนย์กลางของเวิร์กโฟลว์นักพัฒนา
1 ความคิดเห็น
ความคิดเห็นใน Hacker News
ฉันไม่ได้ตั้งค่าอะไรแบบนี้เลย
เพราะมัน ล้าสมัยเร็วเกินไป และ 80% ก็ใช้งานไม่ค่อยได้จริง
ฉันไม่คิดว่าจำเป็นต้องเขียน MCP server ขึ้นมาเอง ทั้งที่ยังไม่แน่ใจด้วยซ้ำว่า LLM จะเรียกใช้อย่างน่าเชื่อถือได้ไหม
กฎของฉันเรียบง่ายมาก — เขียน เอกสารสำหรับตัวเอง (เช่น template, checklist ฯลฯ) ขึ้นมาเอง แล้วให้ AI ลองทำดูหนึ่งครั้ง
ถ้าทำไม่ถูกในครั้งเดียวก็แก้เอกสาร หรือไม่ก็ลงมือทำเอง
ท้ายที่สุดแล้วความมีประโยชน์ของมันก็ขึ้นอยู่กับข้อมูลฝึกและวิวัฒนาการของโมเดล และฉันคิดว่าควรปฏิบัติกับมันเหมือน constraint programming ที่ไม่มีไวยากรณ์แบบเป็นทางการ
เมื่อคำนึงถึงความกำกวมเชิงอัตวิสัยของภาษาธรรมชาติแล้ว การทำ iteration อย่างรวดเร็วด้วยการค่อย ๆ ปรับประโยคข้อจำกัดจึงเป็นวิธีที่ดีที่สุด
ตัวอย่างเช่น ฉันเคยวน Gemini อยู่ 4 รอบจนได้ bash script ที่ทำงานอัตโนมัติได้สมบูรณ์
ดูแนวคิดที่เกี่ยวข้องได้ที่ Constraint programming
ฉันสามารถโยนงานระดับนักพัฒนาจูเนียร์ให้มันทำ แล้วตัวเองไปทำอย่างอื่นได้
ถ้าล้มเหลวในครั้งเดียว ก็ปรับปรุงเอกสาร (.md file) แล้วลองใหม่
ฉันไม่ค่อยใช้ MCP เพราะความเสี่ยงด้านความปลอดภัย แต่ลูปแบบนี้ค่อนข้างมีประสิทธิภาพ
ในทางกลับกัน การบอกว่า “ถ้าครั้งเดียวไม่สำเร็จฉันจะทำเอง” ก็เหมือนกับไล่พนักงานใหม่ออกทันที
เรายังไปไม่ถึงจุดนั้น และทักษะที่กำลังสั่งสมตอนนี้ก็เหมือนสร้างอะไรบางอย่างไว้บนทางลาด
ตอนนี้วิธีประเมิน prompt ยังไม่น่าเชื่อถือพอ ฉันเลยกำลังสร้าง agentic setting เพื่อปรับปรุงเรื่องนี้ด้วยตัวเอง
เมื่อวานเพิ่งเพิ่มฟีเจอร์ time travel ของ session บนพื้นฐาน Dagger และวันนี้ตั้งใจจะใส่ฟีเจอร์ fork, clone และ registry
Gemini CLI ยังอ่อนกับงานเขียนโค้ดที่ซับซ้อน
เพราะมีแค่ ReAct loop แบบง่าย ๆ และ ความสามารถในการเรียกใช้เครื่องมือ ที่ยังไม่แข็งแรง
ถึงอย่างนั้นก็ยังมีศักยภาพสูง เพราะกำลังถูกพัฒนาอย่างคึกคักในฐานะโอเพนซอร์ส
ด้วย context window 1M (เร็ว ๆ นี้จะเป็น 2M) และโควตาฟรีที่ให้มาเยอะ ฉันเลยคิดว่าควร “ใช้มันให้หนักไปเลย (ABUSE IT)”
ฉันใช้มันเป็นเครื่องมือ orchestration แบบ TUI/CLI และมันก็มีประโยชน์พอสมควรในการประเมินโค้ดที่เครื่องมืออื่นสร้างขึ้นมา
ช่วงหลังฉันเชื่อม Homebrew กับ MCP และต่อเข้ากับ Knowledge Manager บน LLM แบบ local (Nowledge Mem)
ที่น่าสนใจคือฉันยังเห็นกรณีที่ใช้ Gemini CLI เป็น SubAgent เพื่อหลีกเลี่ยงไม่ให้ context หลักปนเปื้อนด้วย
ทวีตที่เกี่ยวข้อง
ต่อให้บอกว่า “อย่าแก้โค้ด แค่เสนอแนะก็พอ” มันก็ยังแก้ไฟล์ทันที
Pro 3 ฉลาดก็จริง แต่ การทำตามคำสั่ง ยังไม่นิ่ง
ฉันลองผ่าน Antigravity แต่เพราะโควตาจำกัด เลยทดสอบอะไรซับซ้อนมากไม่ได้
ดูความเห็นแบบละเอียดได้ใน บทความนี้
Addy Osmani เป็น วิศวกรซอฟต์แวร์ชาวไอริช ที่ดูแลงาน Google Chrome และ Gemini และเป็นผู้คร่ำหวอดในวงการมานาน 25 ปี
เขาหลงใหลในการปรับปรุงประสิทธิภาพเว็บและเครื่องมือพัฒนาที่มี AI ช่วย และเป็นผู้เขียนหนังสือหลายเล่ม เช่น 『Learning JavaScript Design Patterns』
ลิงก์การแข่งขัน
ฉันอยากให้ coding agent แบบ ไม่ผูกกับ LLM เจ้าใดเจ้าหนึ่ง (agnostic) กลายเป็นมาตรฐาน
แทนที่แต่ละเจ้าจะสร้างทุกอย่างขึ้นมาใหม่เองแบบ Codex หรือ Gemini CLI ถ้าสามารถ สลับผู้ให้บริการ LLM ได้แบบ plugin ก็คงดี
ตอนนี้ Claude Code ยังดีที่สุด แต่ดูเหมือน Anthropic จะไม่เดินไปในทิศทางนั้น
สุดท้ายคงต้องรอ โอเพนซอร์ส coding agent รุ่นถัดไป
เพียงแต่ว่า CLI พวกนี้ใกล้เคียงกับการเป็นอินเทอร์เฟซสำหรับ โมเดลแบบสมัครสมาชิก มากกว่าการเป็นเครื่องมือจริง
โมเดลรุ่นใหม่ใช้ token สิ้นเปลืองมาก จนการจ่ายรายเดือนสมเหตุสมผลกว่าคิดค่าบริการผ่าน API
ฉันลองใช้มาสองสามวันล่าสุดแล้วค่อนข้างพอใจ
ลิงก์ GitHub
ยังมีทางเลือกอื่นอีกหลายตัว เช่น Crush, Aider, Amp Code, Emacs+gptel, Editor Code Assistant
แต่เพราะ การร่วมวิวัฒน์ (co-design) ระหว่าง LLM กับ coding agent ยังสำคัญมาก การแยกกันแบบสมบูรณ์จึงยังไม่สมจริงนัก
น่าขันตรงที่ตอนนี้มันมี LLM ของตัวเองแล้ว
แนะนำ Cursor Composer
ฉันใช้ Gemini CLI มาได้หลายเดือนแล้ว
ที่บริษัทมี subscription ฟรีเลยได้ลองใช้ต่อเนื่อง
มันบอกว่ารู้จักไฟล์ GEMINI.md แต่ในทางปฏิบัติก็มักจะเมินมัน
ถึงอย่างนั้น tip อย่าง Tip 12 กับ Tip 16 ก็มีประโยชน์
ปัญหา hallucination ของ AI ก็ยังมีอยู่ แต่เป็นครั้งแรกที่ทำให้ฉันรู้สึกว่า AI ‘สนุก’ จริง ๆ
โดยเฉพาะตอนให้มัน debug คลัสเตอร์ K8s แบบอัตโนมัติ ทั้งการดึง log และหาข้อผิดพลาด ทำให้ทึ่งมาก
บางครั้งถ้ามันทำตัวโง่เกินไป ฉันก็พิมพ์
/quitแล้วลงมือเอง แต่โดยรวมก็ยังใช้มันอย่างสนุกฉันเองก็เพิ่งสร้างคลัสเตอร์ RKE2 เสร็จ อยากลองบ้างเลย
ฉันชอบ AI มาก
มันให้ความรู้สึกเหมือนเป็นเครื่องมือจำเป็นที่ทำให้ฉัน เป็นมนุษย์ที่มีประสิทธิภาพมากขึ้น คล้ายกับอินเทอร์เน็ตหรือ iPhone
แต่ฉันเริ่มล้ากับ tutorial ว่าด้วยการใช้ AI มากแล้ว
ส่วนใหญ่คุณภาพต่ำ และบทความนี้ก็แค่ดีกว่าทั่วไปหน่อย
มันเหมือนกับเวลานักพัฒนา JS ออกมาแนะนำ framework ใหม่ทุกสัปดาห์
ไม่ว่าใครจะเขียน เขียนจากใจ หรือแค่เพื่อ engagement ก็ตาม ฉันก็ไม่สนใจแล้ว
พูดตรง ๆ ว่าการตั้งค่าซับซ้อนแบบนี้มันเกินจำเป็น
สำหรับฉัน แค่ prompt แบบตะโกนใส่ AI ก็ใช้งานได้ดีพอแล้ว
มีแค่ LazyVim กับเครื่องมือไม่กี่ตัว (git, ask, ripgrep) ก็ productive ได้มากพอ
โดยเฉพาะ Gemini 3 ที่มี token density สูงและ context ใหญ่มาก เลยมีประโยชน์มาก
ถ้า context เริ่มมากเกินไป ฉันก็ให้มันเขียนสรุปลง README.MD แล้วเริ่มเอเจนต์ใหม่
ลิงก์เครื่องมือ ask
โมเดลอื่นไม่ค่อยช่วยเพิ่มผลิตภาพ แต่ตอนนี้งานซับซ้อนก็สำเร็จได้ 80% ตั้งแต่ครั้งแรก
ความ ตัดกัน ระหว่างการเขียนสคริปต์ด้วยมือกับ workflow ที่มี LLM ช่วยนั้นน่าสนใจ
ถ้าเงื่อนไขข้อจำกัดไม่ชัด ทั้งสองแบบก็ล้มเหลวได้เหมือนกัน แต่ถ้าชัดเจน LLM จะทำงานได้อย่างน่าทึ่งและค่อนข้างเชื่อถือได้
ปัญหาของการเขียนโค้ดแบบ AI/Agentic/Vibe ในช่วงนี้คือ มันวิวัฒน์เร็วเกินไป
best practice ยังไม่ทันตั้งหลักก็ล้าสมัยแล้ว
เมื่อก่อนต่อให้ภาษาและ framework เปลี่ยน วิธีแยกปัญหาและทำความเข้าใจ codebase ก็ยังค่อนข้างเสถียร
แต่ตอนนี้ฉันไม่แน่ใจแล้วว่าจุดสมดุลอยู่ตรงไหน
ฉันรู้สึกว่า Gemini CLI ไม่ค่อยดี
ถ้าจำเป็นต้องใช้ ฉันแนะนำ Opencode
Google เองก็ควร สร้าง CLI ขึ้นมาใหม่ตั้งแต่ต้น เหมือน Codex
อนึ่ง ตอนนี้ Gemini 3 ยังใช้บน Opencode ผ่าน Copilot ไม่ได้
ลิงก์ issue
ฉันเลยสงสัยว่าทำไม TUI ธรรมดาถึงต้องมีข้อจำกัดแบบนี้
จาก เอกสารทางการ Gemini ไม่ได้ถูกพูดถึงตรง ๆ และดูเหมือนจะให้ใช้งานผ่าน Google Vertex AI
บางทีอาจเชื่อม Gemini ผ่าน subscription ของ Google Workspace ได้ก็ได้