วิธีใช้ AI ฟรีหรือราคาถูกเพื่อการพัฒนา
(wuu73.org)- ใช้ โมเดล AI บนเว็บฟรี หลายตัวควบคู่กันเพื่อแยกงานแก้ปัญหาและงานสร้างโค้ดออกจากกัน และใช้ กลยุทธ์แบบไฮบริด เพื่อดึงจุดแข็งของแต่ละโมเดลมาใช้
- ใช้ AI Code Prep GUI เพื่อคัดเลือกและจัดระเบียบเฉพาะโค้ดที่จำเป็น ป้องกันประสิทธิภาพลดลงจากบริบทที่ไม่จำเป็น และ ส่งให้ AI เฉพาะคอนเท็กซ์หลักเท่านั้น
- งานวางแผนและดีบักใช้ โมเดลประสิทธิภาพสูง/ฟรี (เช่น Gemini 2.5 Pro, o3, o4-mini, Claude 4) ส่วน การลงมือทำและเขียนโค้ด ใช้ GPT-4.1·Claude 3.5
- ใช้ OpenAI data sharing, GitHub Copilot, Poe.com, OpenRouter และช่องทางอื่น ๆ เพื่อหา โทเค็นฟรีหรือราคาถูก และ ลดต้นทุน
- ผสมใช้ เอเจนต์และเครื่องมือ CLI หลายแบบตามสถานการณ์ เช่น Claude Code, Qwen Code, Gemini CLI, Roo Code, Trae IDE เพื่อเพิ่ม ประสิทธิภาพการทำงาน
การตั้งค่าเบราว์เซอร์ของฉัน: บุฟเฟต์ AI ฟรี
- เปิดแท็บฟรีของโมเดล AI ทรงพลังหลายตัวไว้พร้อมกันในเบราว์เซอร์แล้วใช้งาน
- เป็นวิธีที่ไม่พึ่งพาโมเดลใดโมเดลหนึ่งเพียงอย่างเดียว แต่รับคำตอบจากหลายมุมมอง โดยชุดโมเดลฟรีที่ใช้เป็นประจำมีดังนี้
- GLM 4.5: ใช้งานฟรีบนเว็บได้ และจากประสบการณ์ให้ประสิทธิภาพระดับ Claude 4 หรือดีกว่า มักเปิดไว้ 2–3 แท็บเสมอ
- Kimi K2: เป็นโมเดลที่คล้ายสาย Claude หรือ Opus และใช้งานบนเว็บได้ฟรี ปกติเปิดไว้ 1–2 แท็บ ก่อนที่ GLM 4.5 จะมา โมเดลนี้ช่วยแก้บั๊กยาก ๆ ได้หลายครั้งต่อวัน
- Qwen3 Coder และโมเดลรุ่นใหม่ต่าง ๆ: ใช้สำหรับทดสอบโมเดลที่เน้นงานเขียนโค้ดหลายแบบ
- OpenAI Playground: ใช้โมเดลหลากหลายอย่าง GPT-4.5, o3 ได้ฟรี หากอนุญาตในการตั้งค่าข้อมูลบัญชีให้ "OpenAI ใช้ข้อมูลเพื่อฝึกโมเดล" จะได้รับโทเค็นฟรี
- Google Gemini AI Studio: ใช้งานโมเดล Gemini 2.5 Pro/Flash ได้ฟรีและแทบไม่จำกัด มักเปิดไว้ 1–3 แท็บ
- Google Gemini 2.5 Pro: เป็นบริการแยกจาก AI Studio และเด่นกว่าด้านการสร้างภาพและฟีเจอร์วิจัยเชิงลึก จึงเปิดใช้ควบคู่กับ AI Studio
- Poe.com: ให้เครดิตฟรีรายวันสำหรับโมเดลพรีเมียมอย่าง Claude 4 หรือ o4-mini
- OpenRouter: ใช้ได้ทั้งโมเดลฟรีและเสียเงินแบบผสมกัน โดยตั้งค่าแต่ละโมเดลไว้คนละแท็บ
- ChatGPT: เวอร์ชันฟรีก็ยังมีประโยชน์ จึงคงไว้อย่างน้อย 1 แท็บ
- Perplexity AI: เด่นสำหรับคำถามที่เน้นการค้นคว้า
- Deepseek: ให้ใช้ฟรีสำหรับโมเดล v3 และ r1 แต่ต้องระวังข้อจำกัดด้านคอนเท็กซ์
- Grok.com: ให้ใช้ฟรีไม่จำกัดสำหรับการใช้งานทั่วไป การวิจัยเชิงลึก และการแก้ไขภาพ โดยเฉพาะฟีเจอร์วิจัยเชิงลึกที่คล้าย Perplexity จึงมีประโยชน์
- Phind: พยายามให้คำตอบพร้อมโฟลว์ชาร์ตหรือไดอะแกรม
- lmarena.ai: ให้ Claude Opus 4 และ Sonnet 4 ใช้งานฟรี ซึ่งการใช้ Opus 4 ฟรีถือว่ามีคุณค่ามาก
ตัว Claude.ai เองก็ใช้ฟรีเช่นกัน แต่ข้อจำกัดการใช้งานเกิดขึ้นบ่อยจนอาจไม่สะดวก จึงใช้วิธีเข้าถึงแบบอื่นผ่านส่วนขยาย Cody หรือ Copilot เป็นต้น
ข้อควรระวัง – เมื่อใช้ Grok
Grok ให้การประมวลผลฟรีและการสร้างภาพแบบไม่ถูกกรอง จึงอาจมีประโยชน์เมื่อระบบความปลอดภัยของโมเดลอื่นขัดขวางการทำงาน อย่างไรก็ตาม มีรายงานว่าผู้ดูแลอาจมีเจตนาส่งเสริมแนวคิดที่เชื่อมโยงกับนาซีหรือข้อมูลเท็จ และยังมีข้อกล่าวอ้างว่าเคยถูกสั่งให้ให้ข้อมูลเท็จเกี่ยวกับเหตุการณ์ทางประวัติศาสตร์ เช่น การฆ่าล้างเผ่าพันธุ์ในแอฟริกา ความบิดเบือนเหล่านี้ส่วนใหญ่ปรากฏบนแพลตฟอร์ม X ดังนั้นจึงแนะนำให้ใช้แบบจำกัดเฉพาะงานที่ปลอดภัย เช่น การเขียนโค้ด หรือใช้งานโดยคำนึงถึงอคติที่อาจมีอยู่
เวิร์กโฟลว์ที่ฉลาดและถูกกว่า: Focused Context
- เมื่อใช้แชต AI บนเว็บ (เช่น AI Studio, ChatGPT, OpenRouter) หลายครั้งกลับแก้ปัญหาหรือเสนอแนวทางแก้ได้ดีกว่า IDE หรือเฟรมเวิร์กเอเจนต์ (เช่น Cline, Trae, Copilot)
- หากใช้เครื่องมืออย่าง Cursor, Cline, Roo Code จัดการทุกอย่างทั้งหมด จะต้องส่งข้อความจำนวนมากที่ไม่เกี่ยวกับปัญหาโดยตรงไปให้ AI เช่น วิธีใช้ MCP server หรือขั้นตอนการแก้ไขไฟล์ ทำให้ AI สับสนและประสิทธิภาพลดลง
- ด้วยเหตุนี้ แม้จะใช้โมเดลราคาแพงที่สุด ก็ยังเอาชนะ ‘ผลของความอืด’ ที่เกิดจากข้อมูลไม่จำเป็นไม่ได้
- ดังนั้นจึงใช้วิธีสร้างคอนเท็กซ์ที่แม่นยำสำหรับการแก้ปัญหาด้วยตัวเอง แล้วค่อยนำไปวางในเว็บแชต AI เพื่อถามคำถามหรือขอรีวิวโค้ด
- เมื่อได้แนวทางแก้แล้ว ก็เขียนเนื้อหานั้นเป็นพรอมป์ต์สำหรับเอเจนต์อย่าง Cline แล้วมอบหมายแค่การแก้ไขไฟล์
- วิธีนี้ทำให้ใช้ GPT-4.1 (ที่ใช้งานได้ไม่จำกัด) เพื่อแก้ปัญหาและวางแผนได้อย่างประหยัด โดยไม่จำเป็นต้องเปลืองเครดิต Claude
- ใช้ Claude สำหรับปัญหาที่ยาก และใช้เว็บแชต AI สำหรับการลงมือทำควบคู่กัน เพื่อเพิ่มประสิทธิภาพ
-
AI Code Prep ช่วยอย่างไร (โครงสร้างพรอมป์ต์ตัวอย่าง)
พรอมป์ต์ตัวอย่าง:
Can you help me figure out why my program does x instead of y?- AI Code Prep GUI จะสแกนโฟลเดอร์โปรเจกต์แบบ recursive สำรวจทุกโฟลเดอร์ย่อยและไฟล์ จากนั้นจัดระเบียบโค้ดและคำถามให้อยู่ในรูปแบบที่ AI อ่านได้สะดวก
- ตัวอย่างคอนเท็กซ์ที่สร้างขึ้น:
Can you help me figure out why my program does x instead of y? fileName.js: <code> ... 파일 내용 ... </code> nextFile.py: <code> import example ... 기타 내용 ... </code> Can you help me figure out why my program does x instead of y?- ทำซ้ำคำถามสองครั้ง (เลือกวางด้านบน/ล่าง/ทั้งสองด้านได้) เพื่อช่วยให้ AI รักษาโฟกัส
- บน Windows ให้คลิกขวาเมาส์ภายในโฟลเดอร์โปรเจกต์ → เรียกใช้ "AI Code Prep GUI" → ระบบจะเลือกไฟล์โค้ดโดยอัตโนมัติ และตัดไดเรกทอรีที่ไม่จำเป็นอย่าง
node_modules,.gitออกให้อัตโนมัติ - แม้การเลือกจะไม่สมบูรณ์แบบ ก็ยังปรับได้ง่ายผ่านช่องทำเครื่องหมาย
- เมื่อเป็นโปรเจกต์ขนาดใหญ่จนเกินขีดจำกัดคอนเท็กซ์ของ AI ก็สามารถคัดเลือกเฉพาะไฟล์ที่จำเป็นจริง ๆ เพื่อส่งให้ได้
-
ทำไมวิธีนี้จึงสำคัญ?
- เอเจนต์เขียนโค้ดจำนวนมาก เช่น Cline, GitHub Copilot, Cursor, Windsurf มักส่งคอนเท็กซ์ มากเกินไป หรือ น้อยเกินไป จนไม่มีประสิทธิภาพ
- หากคัดเลือกไฟล์ด้วยตัวเอง ก็จะส่งให้ AI ได้เฉพาะข้อมูลที่จำเป็นโดยไม่มีข้อมูลส่วนเกิน
- เนื่องจากเป็น GUI จึง รักษาความปลอดภัยของโค้ดส่วนตัว และ ใช้งานสะดวก ได้ดีกว่าเครื่องมือสร้างคอนเท็กซ์อื่นที่ต้องใช้ CLI หรือลิงก์ GitHub แบบสาธารณะ
- ดูอัปเดตฟีเจอร์ล่าสุดได้ที่ wuu73.org/aicp
กลยุทธ์ด้านโมเดล: เลือกสมองที่เหมาะกับงาน
- มีโมเดล AI ทรงพลังจำนวนมากที่เปิดให้ใช้ฟรีผ่านเว็บอินเทอร์เฟซ (Gemini in AI Studio, Grok, Deepseek เป็นต้น) จึงควรใช้สิ่งเหล่านี้ก่อนเป็นอันดับแรก
- Poe.com ให้เครดิตฟรีรายวันสำหรับโมเดลระดับท็อปอย่าง Claude และซีรีส์ o4 ใหม่
- Gemini 2.5 Pro (ให้บริการผ่าน AI Studio) โดดเด่นมากในงานดีบัก การวางแผน และงานโดยรวม จึงถูกมองว่าเป็นโมเดลที่อเนกประสงค์ที่สุดในตอนนี้
- สำหรับปัญหาที่ยากเป็นพิเศษ ให้ลอง o4-mini (ใช้งานได้ผ่าน OpenRouter หรือ Poe)
- เมื่อใช้ผ่าน API มีค่าใช้จ่ายถูกกว่ารุ่นท็อประดับก่อนหน้า (Claude 3.5/3.7/4) มาก
- มีประสบการณ์ว่าเคยช่วยแก้บั๊กที่แก้ไม่ตกได้ทันที
- Claude 3.7 หรือ 4 เข้าถึงได้ผ่าน Poe, API (OpenRouter), GitHub Copilot Chat เป็นต้น
- มีโควตาฟรีให้บางส่วน แต่ถ้าใช้บ่อย ค่าใช้จ่ายจะค่อนข้างสูง
- รุ่น 3.7/4 ให้ผลลัพธ์ที่สร้างสรรค์และพุ่งแรง (“สไตล์ Hunter S. Thompson”) แต่สำหรับการเขียนโค้ดจริง การให้ Claude 3.5 ทำงานแบบนิ่ง ๆ อาจมีประสิทธิภาพกว่า
-
วิธีใช้โทเค็นฟรีใน OpenAI Playground
- หากเปิดใช้งานการตั้งค่าการแชร์ข้อมูลในบัญชี OpenAI จะสามารถใช้โทเค็นฟรีจำนวนมากได้ทุกวัน
- ไปที่ OpenAI Playground → ไอคอนตั้งค่ามุมขวาบน → เมนูด้านซ้าย Data Controls → Sharing แล้วเปิด "Share inputs and outputs with OpenAI" เพื่อรับสิทธิประโยชน์ดังนี้:
- สูงสุด 250,000 โทเค็นต่อวัน: gpt-5, gpt-4.1, gpt-4o, o1, o3
- สูงสุด 2,500,000 โทเค็นต่อวัน: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
- หากใช้การตั้งค่านี้ จะสามารถใช้โมเดลระดับท็อปอย่าง o3 และ GPT-4.5 ได้ฟรีในปริมาณมาก
- ใน OpenAI Playground สามารถรัน o3 และ o4-mini แบบวางคู่กันเพื่อเปรียบเทียบ และทำความเข้าใจจุดแข็งกับการใช้งานที่เหมาะของแต่ละโมเดลได้
-
กลยุทธ์การใช้งานโมเดลที่แนะนำ
- Gemini 2.5 Pro: ตัวเลือกอันดับแรกสำหรับการดีบัก การวางแผน และงานเขียนโค้ดโดยรวม
- o4-mini: เหมาะกับการแก้บั๊กยาก ๆ และคุ้มค่าด้านต้นทุน
- Claude 4 / 3.7: เหมาะที่สุดสำหรับการแก้ปัญหาที่ยากและเร่งด่วน แต่มีข้อจำกัดด้านการเข้าถึงและค่าใช้จ่าย
- Claude 3.5: เหมาะสำหรับนำผลลัพธ์เชิงสร้างสรรค์จาก 3.7/4 มาขัดเกลา หรือใช้เขียนโค้ดจริง
- o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: มีความสามารถยอดเยี่ยมมากในการแก้ปัญหาที่ซับซ้อน และสามารถใช้งานได้จำนวนมากหากอาศัยการตั้งค่าโทเค็นฟรี
แนวทางแบบไฮบริด: วางแผนด้วยรุ่นพรีเมียม + ลงมือด้วยรุ่นประหยัด
- หลังจากทดลองโมเดลหลากหลายแบบ ได้พัฒนากลยุทธ์ไฮบริดที่ช่วยเพิ่มทั้งคุณภาพและความคุ้มค่าด้านต้นทุนให้สูงสุด
- อินไซต์สำคัญคือ แต่ละโมเดลมีจุดแข็งต่างกันในแต่ละช่วงของกระบวนการพัฒนา
ทฤษฎี “Smart Juice” – ทำไม AI ถึงดูโง่ลง
‘พลังความฉลาด’ ที่โมเดลได้รับมีอยู่อย่างจำกัด
หากส่งพรอมป์ต์ที่กระชับและโฟกัส พลังนั้นแทบ 100% จะถูกใช้ไปกับการแก้ปัญหา
แต่ถ้าส่งอินพุตที่ซับซ้อนเกินจำเป็น (คำอธิบายวิธีใช้เครื่องมือยาว ๆ บริบทที่ไม่เกี่ยวกับปัญหา โค้ดหลายหน้า ฯลฯ) พลังส่วนใหญ่จะถูกใช้ไปกับการประมวลผลสิ่งเหล่านั้น ทำให้ ‘ความฉลาด’ ที่เหลือไว้แก้ปัญหาจริงลดลงตัวอย่าง: เอเจนต์ที่เชื่อมกับ IDE อย่าง Cursor และ Cline มักส่งคำสั่งและคอนเท็กซ์จำนวนมากก่อนถาม ทำให้ความสามารถในการโฟกัสของโมเดลลดลง
ดังนั้น การลดบริบทที่ไม่จำเป็น และส่งเฉพาะแก่นที่จำเป็นต่อการแก้ปัญหา คือวิธีให้ได้ผลลัพธ์ที่ดีที่สุด
-
เวิร์กโฟลว์เมื่อเริ่มโปรเจกต์ใหม่
- 1. Plan & Brainstorm
- ใช้เว็บโมเดลที่ฉลาดและฟรี (Gemini 2.5, o4-mini, Claude 3.7/4, o3 เป็นต้น) เพื่อออกแบบแนวทาง วางแผนทีละขั้น และระบุไลบรารีที่ต้องใช้
- 2. Generate Agent Prompt
- ขอให้หนึ่งในโมเดลข้างต้นเขียนว่า:
"Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [คำอธิบายงาน]" - จากนั้นนำพรอมป์ต์ที่ได้ไปขัดเกลาอีกครั้งด้วย AI ฟรีที่เก่งด้านการรีไรต์ เช่น ChatGPT
- ขอให้หนึ่งในโมเดลข้างต้นเขียนว่า:
- 3. Execute with Cline
- วางพรอมป์ต์ที่ปรับแล้วลงใน Cline และรันด้วย GPT 4.1 หรือ Claude 3.5 (ถ้าเป็นงานซับซ้อนให้ใช้ Claude 4)
- กลุ่ม GPT 4.1 ถูกฝึกมาดีในด้านการทำตามคำสั่ง
- 4. Fallback
- หาก GPT 4.1 ล้มเหลว ให้สลับไปใช้ Claude 3.5 ผ่าน API
- Deepseek v3 หรือ R1 ก็ทำงานตามคำสั่งได้แข็งแกร่งมากเช่นกัน
- 1. Plan & Brainstorm
-
กลยุทธ์หลัก
- ใช้ โมเดลที่แพงและฉลาด (หรือ Gemini 2.5 Pro ที่ใช้ฟรีได้) สำหรับขั้นวางกลยุทธ์และออกแบบ
- นำแผนไปแปะให้โมเดลฟรีตัวอื่นอีก 2~3 ตัวตรวจสอบ (Deepseek R1, Claude บน Poe เป็นต้น):
"Is this good? Can you improve it or find flaws?" - สำหรับ ขั้นเขียนโค้ดและรันจริง ให้ใช้โมเดลที่เสถียรและมีประสิทธิภาพ (GPT 4.1, Claude 3.5) ใน Cline
-
ทิปการใช้งานแต่ละโมเดล
- o4-mini
- เก่งด้าน กลยุทธ์การลงมือพัฒนาระดับสูง เช่น การตีความลอจิกโค้ดที่ซับซ้อน การเลือกเฟรมเวิร์กและไลบรารี
- การระดมไอเดีย
- เมื่อแก้ไม่ได้
- หากโมเดลฟรี/ราคาถูกยังแก้ไม่สำเร็จ ให้ escalatation ไปใช้โมเดลระดับสูงแบบเสียเงินผ่าน API
- o4-mini
เอเจนต์และการตั้งค่าทางเลือกอื่น
- Trae.ai (Bytedance, ผู้สร้าง TikTok)
- IDE ที่เข้ากันได้กับ VS Code พร้อมให้ใช้งาน AI ฟรี: รวมถึง Claude 4, Claude 3.7, Claude 3.5, GPT 4.1
- ประสิทธิภาพของเอเจนต์ในตัวด้อยกว่า Cline (พูดตรงๆ คือ Cline แกร่งสุด)
- เนื่องจากเป็นโคลนของ VS Code จึงดูว่าน่าจะติดตั้งส่วนขยาย Cline ได้
- แต่ ช้าเพราะเซิร์ฟเวอร์โอเวอร์โหลด → ประสิทธิผลในการใช้งานฟรีค่อนข้างต่ำ
- ถึงอย่างนั้นก็ยังควรกล่าวถึง เพราะเข้าถึงโมเดลฟรีได้
-
การตั้งค่าที่แนะนำ 2 แบบ
- 1. VS Code + Cline + Copilot
- สมัคร Copilot เดือนละ $10 → ใช้โมเดลทรงพลังผ่าน API ใน Cline ได้แบบประหยัด
- ฟรีเทียร์ก็ใช้ฟังก์ชันพื้นฐานบางส่วนได้
- 2. Trae.ai + Cline
- ทดสอบว่าสามารถใช้การเข้าถึงโมเดลฟรีของ Trae ควบคู่กับการใช้ API key ของ Cline ได้หรือไม่
ทิป: บางครั้งเอเจนต์พื้นฐานของ Copilot ก็แก้ปัญหาที่ Cline ทำได้ไม่ดี และบางครั้งก็เป็นในทางกลับกัน
Cline อาจส่งพรอมป์ต์ที่ยาวเกินไปจนประสิทธิภาพลดลง → จึงมีกรณีที่ Copilot ได้เปรียบ - 1. VS Code + Cline + Copilot
-
Roo Code: โคลนของ Cline
- Roo Code แทบจะเหมือน Cline แต่มีฟีเจอร์บางอย่างที่ต่างออกไป
- ขึ้นอยู่กับโปรเจกต์หรือสไตล์การเขียนโค้ดของคุณว่า Roo Code อาจเหมาะกว่า
- ตัว Cline เองใช้ฟรี แต่มีค่าใช้จ่ายจากการเรียก API
- วิธีที่คุ้มที่สุด: ตั้งค่า VS Code LM API + สมัคร Copilot เดือนละ $10 → ใช้โมเดลทรงพลังได้แทบไม่จำกัด
-
เครื่องมือ CLI ใหม่: Claude Code, Qwen Code, Gemini CLI
- ช่วงหลังความสนใจในเครื่องมือเขียนโค้ดแบบ CLI เพิ่มขึ้นอย่างมาก
- Claude Code: รองรับ subagent → ทำงานทีละอย่างเท่านั้น และไม่ใช้เครื่องมือเพิ่มเติม
- สามารถจำลองเวิร์กโฟลว์แบบโฟกัส ‘smart juice’ ที่อธิบายในไกด์นี้ได้
- ตัดคำสั่งเอเจนต์ที่ไม่จำเป็น (bloat) ออก พร้อมรักษาประสิทธิภาพไว้
- Qwen Code, Gemini CLI ต่างก็มีจุดเด่นของตัวเอง
- มีไกด์การตั้งค่าสำหรับใช้ Claude Code กับ GLM 4.5 อยู่บนเว็บไซต์ z.ai
- เครื่องมือ CLI แต่ละตัวมีจุดแข็งต่างกัน จึงแนะนำให้ทดลองโดยอ้างอิงจากไกด์และทิปของชุมชน
TL;DR: Quickstart Guide
- Models & Roles
- Planning & Brainstorming
แนะนำให้ใช้ GLM 4.5, Kimi K2, Qwen3 Coder และซีรีส์ 2507 ล่าสุด, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), และใช้โทเค็นฟรีวันละ 250k ใน OpenAI Playground (o3, GPT-5) - Problem Solving & Debugging
GPT-5 (โทเค็นฟรีใน Playground), GLM-4.5 (ประสิทธิภาพระดับ Claude 4), Claude 4 (โทเค็นฟรีรายวันบน Poe) - Actual Coding
GPT-4.1 (Cline), หากล้มเหลวให้ใช้ Claude 3.5 แทน หรือใช้ Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2
- Planning & Brainstorming
- Key Tools
- VS Code
- AI Code Prep GUI – สแกนและคัดเฉพาะไฟล์ที่จำเป็นจากเครื่องโลคัล เพื่อปรับบริบทสำหรับ AI ให้เหมาะสมที่สุด
- Cline (เอเจนต์สำหรับ VS Code) – รันโค้ดแบบเป็นขั้นตอน
- เว็บแชตฟรี – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio(Gemini 2.5 Pro), OpenRouter, duck.ai
- Quick Workflow
- ใช้ AI Code Prep GUI เพื่อรวมไฟล์ที่เกี่ยวข้องกับโปรเจกต์เป็นชุด
- วางบริบทนั้นลงในโมเดลเว็บแชตที่คุณชอบ เพื่อวางแผนและดีบัก
- ขอให้โมเดลหนึ่งตัว
เขียน Cline prompt แบบละเอียดสำหรับงานนี้แล้วนำไปขัดเกลาต่อใน ChatGPT เป็นต้น - วางพรอมป์ต์ที่เสร็จแล้วลงใน Cline ที่ตั้งค่าเป็น GPT-4.1 เพื่อสร้างหรือแก้ไขโค้ด
→ หากล้มเหลวให้สลับไปใช้ Claude 3.5
- Cost-Saving Hacks
- เปิดใช้งาน “data sharing” ใน OpenAI Playground → รับโทเค็นฟรีวันละ 250k (GPT-4.5, o3) + โทเค็นฟรีวันละ 2.5M (o4-mini, o3-mini)
- สมัคร GitHub Copilot เดือนละ $10 → ใช้โมเดล Claude ใน Cline ได้แบบมีข้อจำกัด
- คิดค่าบริการตามการใช้งานของ OpenRouter → ใช้โมเดลล่าสุดอย่าง o4-mini, Claude 3.7 ได้ในราคาประหยัด
Some Thoughts
- AI เป็นตัวเร่งผลิตภาพที่น่าทึ่ง แต่ไม่ใช่ไม้กายสิทธิ์
- เวทมนตร์ที่แท้จริงเกิดขึ้นเมื่อ ความอยากรู้อยากเห็น, ความอุตสาหะ, และ ความตั้งใจจะทดลอง ของคุณมาผสานกับเครื่องมือทรงพลังเหล่านี้
- อย่าท้อกับบั๊กหรือปัญหา — ทุกความท้าทายคือโอกาสในการเรียนรู้สิ่งใหม่
- ลองผสมการใช้หลายโมเดล กล้าทดลองไอเดียจัดจ้าน และอย่ากลัวที่จะพังแล้วสร้างใหม่
- นักพัฒนาที่ดีที่สุดไม่ใช่คนที่ไม่เคยตัน แต่คือคนที่แม้ตันก็ยังเดินหน้าต่อและใช้ทุกเครื่องมือกับเทคนิคที่มี
- จงโอบรับความโกลาหล สนุกกับกระบวนการ และปล่อยให้ ความคิดสร้างสรรค์ ของคุณเป็นผู้นำทาง!
Latest Model Updates (Aug 2025)
💰 สายประหยัด: รีดความคุ้มค่าสูงสุด
-
GPT 4.5
- สถานะ: ยุติการให้บริการ
-
o3
- ความสามารถ: ประสิทธิภาพทัดเทียม Claude 4, โดดเด่นในการแก้ปัญหายาก, ระดับอัจฉริยะ
- ทิปการใช้งาน: ใส่ทั้งโค้ดเบสเพื่อวิเคราะห์ได้ด้วย AI Code Prep GUI
- Free Tokens: เปิดการแชร์ข้อมูลใน Data Controls/Sharing settings แล้วจะได้ 250k tokens/day
-
o4-mini
- ความสามารถ: ด้อยกว่า o3 เล็กน้อยแต่ยังยอดเยี่ยมมาก เหมือนเป็นน้องของ o3
- Free Tokens: เปิดการแชร์ข้อมูลแล้วจะได้ 2.5M tokens/day
-
Gemini 2.5 Pro
- การใช้งาน: ใช้ฟรีบน AI Studio
- จุดเด่น: การดีบักที่ซับซ้อน การออกแบบสถาปัตยกรรม และการวางแผน
-
Deepseek R1 0528
- ความสามารถ: โมเดลที่ฉลาดมากพร้อมความสามารถด้านการให้เหตุผลที่พัฒนาขึ้น
- การใช้งาน: ใช้ฟรีได้ผ่านเว็บอินเทอร์เฟซของ Deepseek
🚀 Premium: แก้ปัญหาได้เดี๋ยวนี้
-
Claude 4 Sonnet
- ความสามารถ: หากให้บริบทเพียงพอ มักจะแก้ปัญหาส่วนใหญ่ได้ในครั้งเดียว
- จุดเด่น: ประสิทธิภาพยอดเยี่ยมรอบด้าน ทั้งการเขียนและการแก้ปัญหา
- การใช้งาน: เมื่อจำเป็นต้องแก้ให้สมบูรณ์ตั้งแต่ครั้งแรก
-
Claude 4 Opus
- ราคา: $75 / 1M โทเค็น
- ประสิทธิภาพ: ขึ้นชื่อว่าเหนือกว่า Sonnet เป็นระดับ “magic sauce”
- การใช้งาน: เมื่อคุณต้องการการแก้ปัญหาระดับสุดยอด
Solid Worker Models
โมเดลต่อไปนี้ทำตามคำสั่งได้ดีและทำงานได้อย่างเสถียร:
-
GPT 4.1
- ใช้เป็นโมเดลอัจฉริยะระดับสูงสำหรับการออกแบบและแก้ปัญหา ก่อนนำไปใช้แก้โค้ดจริง
- สามารถคัดลอกผลลัพธ์ที่ได้จากที่ไหนก็ได้ไปวางใน Cline แล้วรันได้ทันที
-
Claude Sonnet 3.5
- เด่นด้านการเขียนโค้ดและการแก้ไข
- ช้ากว่า 4.1 เล็กน้อย แต่เสถียรมาก
-
Deepseek v3
- เหมาะสำหรับการเขียนโค้ด การแก้ไขโค้ด และงานแบบเอเจนต์
- คุ้มค่ามากเมื่อเทียบราคาและประสิทธิภาพ
-
OpenRouter Free Models
- สำรวจโมเดลฟรีได้ที่ OpenRouter โดยตั้งตัวกรองราคาเป็น
$0 - เมื่อมีโมเดลใหม่ออกมา ก็คุ้มค่าที่จะลองทดสอบ
- สำรวจโมเดลฟรีได้ที่ OpenRouter โดยตั้งตัวกรองราคาเป็น
Claude 4 ฟรี: lmarena.ai และอีกมากมาย
Claude Opus 4 and Sonnet 4
- lmarena.ai ให้ใช้งาน Claude Opus 4, Sonnet 4 และรุ่นอื่น ๆ ได้ฟรี
- เคล็ดลับ: โอกาสใช้งานโมเดลตระกูล Anthropic ฟรี ควรบันทึก จำไว้ และใช้ให้คุ้ม
- การใช้งาน: เมื่อทุกอย่างล้มเหลว หรือจำเป็นต้องให้งานเสร็จสมบูรณ์แบบทันที ให้เลือก Claude 4 Sonnet หรือ Opus
ใหม่!! โมเดลจีนตัวแรงรุ่นใหม่ + GPT 5
-
GLM 4.5
- ประสิทธิภาพ: ใกล้เคียงกับ Claude 4 Opus หรือ Sonnet
- จุดเด่น: ทำตามกฎของเอเจนต์และการใช้เครื่องมือได้แทบสมบูรณ์แบบ
- การใช้งาน: เก่งมากกับการแก้บั๊กที่ยากมาก และงานซับซ้อนที่ต้องใช้คอนเท็กซ์จำนวนมาก
-
Qwen3 Coder 480B
- การประเมิน: เป็นโมเดลที่ทรงพลังและราคาถูก จึงได้รับความนิยมสูง
- การใช้งาน: งานเขียนโค้ดในสภาพแวดล้อมที่ต้องการประสิทธิภาพสูงและต้นทุนต่ำ
-
Qwen3 Instruct & Thinking 2507
- ประสิทธิภาพ: มีความเสถียรและความสามารถสูงใกล้เคียงกับ Qwen3 Coder
- ข้อดี: เชื่อถือได้และคุ้มค่าใช้จ่าย
-
Kimi K2 (Moonshot)
- จุดเด่น: มีลักษณะเหมือนถูกฝึกด้วยข้อมูลสังเคราะห์แนว Anthropic หรือคล้าย Claude
- การประเมิน: ประสิทธิภาพยอดเยี่ยมมาก และเป็นโมเดลที่ถูกใช้งานบ่อย
-
GPT 5
- ข้อจำกัด: ไม่ได้เด่นมากในการใช้เครื่องมือแบบกำหนดเอง (MCP, Cline ฯลฯ)
- วิธีใช้ที่แนะนำ:
1. ใช้โมเดลชั้นนำอย่าง GPT 5, GLM 4.5 เป็นต้น เพื่อวางแผนและแก้ปัญหา
2. จากนั้นเขียนพรอมป์ต์ให้โมเดลเอเจนต์ที่ง่ายกว่ารับหน้าที่แก้ไขจริงและใช้เครื่องมือ - การเปรียบเทียบ:
- GPT 4.1 ยังคุ้มค่ามากเมื่อเทียบกับราคา
- โมเดลจีนรุ่นใหม่เด่นด้านการใช้ custom tools/Cline
- สรุป: แม้จะยังทดลองได้ไม่มากพอ แต่แต่ละโมเดลมีจุดแข็งต่างกัน และตอนนี้โมเดลจีนก็น่าสนใจมากในด้านราคาและความเสถียร
Current Coding Workflow (2025)
-
สำหรับโปรเจกต์ใหม่:
- 1. ช่วงวางแผน:
- จดรายละเอียดทั้งหมดของโปรเจกต์ (ภาษา, ไลบรารี, เซิร์ฟเวอร์ ฯลฯ) ไว้ใน notepad
- 2. ปรึกษาหลายโมเดล:
- นำเนื้อหาเดียวกันไปวางในหลายโมเดลเพื่อรับ "ความเห็นจากแพทย์หลายคน":
- Gemini 2.5 Pro (ฟรี)
- GPT 4.1
- o4-mini
- Claude 4 (ใช้เครดิตฟรีรายวันของ Poe)
- นำเนื้อหาเดียวกันไปวางในหลายโมเดลเพื่อรับ "ความเห็นจากแพทย์หลายคน":
- 3. ปรับแต่ง:
- ปรับรายละเอียดอย่างละเอียดผ่านการสนทนาโต้ตอบกับโมเดล
- 4. สร้างงาน:
- ขอให้โมเดลเขียนรายการงานแบบเป็นขั้นตอนสำหรับเอเจนต์เขียนโค้ด Cline AI
- 5. ลงมือทำ:
- รันงานใน Cline (หรือ Roo Code) โดยตั้ง GPT 4.1 เป็นโหมด
act
- รันงานใน Cline (หรือ Roo Code) โดยตั้ง GPT 4.1 เป็นโหมด
- 1. ช่วงวางแผน:
-
สำหรับการแก้ปัญหา:
- การวิเคราะห์โค้ดเบสที่ซับซ้อน: ใช้ GPT 4.5 + AI Code Prep
- ขอ GPT 4.5 ว่า “ช่วยเขียนพรอมป์ต์ให้ Cline ทำงานนี้ให้เสร็จหน่อย”
- เลือกโมเดลตามความซับซ้อนของปัญหา
- ใช้หลายโมเดลเพื่อหาแนวทางแก้จากหลายมุม
-
รายการงาน & Test Driven Development (เร็ว ๆ นี้)
Test Driven Development & Task Lists:- ขอให้ AI เขียนรายการงานอย่างละเอียดสำหรับการรัน Cline, Roo Code, Trae agent
- สามารถสั่งให้ Cline หรือ Roo Code บันทึกความคืบหน้าของงานลงในไฟล์ Markdown และติ๊กเมื่อเสร็จได้
- ช่วยให้ติดตามความคืบหน้าได้ง่ายและลดการตกหล่น
- ตอนนี้สามารถทดลองโดยให้โมเดลสร้าง Markdown checklist และให้ Cline หรือ Roo Code อัปเดตไฟล์นั้น
-
เทคนิคประหยัดเงิน
- GPT 4.5 & o3: หากเปิดการแชร์ข้อมูลการฝึกของโมเดล จะได้ใช้ฟรีวันละ 250,000 โทเค็น
- โมเดลราคาถูก: ใช้โทเค็นได้วันละ 2.5 ล้านกับ o4-mini, 4.1-mini/nano
- GitHub Copilot: จ่าย $10 ต่อเดือนเพื่อใช้ Claude รุ่นใหม่ได้ (มีการจำกัดความเร็ว)
- Trae IDE: ตอนนี้ใช้ Claude 4 และ GPT 4.1 ได้ฟรี (ไม่ต้องสมัครสมาชิก และดูเหมือนไม่มีข้อจำกัด)
- Poe.com: มีเครดิตฟรีรายวันสำหรับทุกโมเดล
- Web Interfaces: ใช้อินเทอร์เฟซแชตบนเว็บแบบฟรีเพื่อวางแผนและขอคำปรึกษา
-
เร็ว ๆ นี้: ข้อมูล Reddit แบบสด & อินไซต์
Live Reddit Data Scraping & Daily Insights:- มีแผนจะสแครปข้อมูล Reddit แบบเรียลไทม์เพื่อให้ตัวอย่างการใช้งานโมเดล AI ที่อัปเดตรายวัน
- จะรวมการวิเคราะห์การใช้งานเชิงลึก การแสดงภาพข้อมูล และอินไซต์ใหม่เกี่ยวกับเวิร์กโฟลว์การเขียนโค้ดจริงและเทรนด์ต่าง ๆ
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
เผื่อใครสับสน บทความหลักยังมีต่ออีก 2-3 หน้า และเข้าไปดูได้ผ่านไอคอนลูกศรที่อยู่ด้านล่าง
ผมเป็นคนเขียนบทความเอง ขอโทษเรื่องฟอนต์ด้วย เนื้อหาค่อนข้างเก่าไปนิด แต่ฝั่ง AI เปลี่ยนเร็วมาก เลยมีแผนอัปเดตให้รวมโมเดลใหม่ ๆ ด้วย ช่วงนี้มีโมเดลใหม่ออกถี่มาก และตัวที่ผมชอบที่สุดช่วงหลังคือ GLM-4.5 ส่วน Kimi K2 ก็ใช้ได้ดี และ Qwen3-Coder 480b หรือ 2507 instruct ก็ถือว่าดีมาก โมเดลพวกนี้ทำงานได้ดีมากในสภาพแวดล้อมหรือเครื่องมือแบบ agentic ผมยังทำแอป context helper ของตัวเองด้วย(https://wuu73.org/aicp) เข้าได้จากลิงก์นี้เลย มันสะดวกมากเวลาผมต้องสลับไปมาระหว่างแท็บ AI แชตจำนวนมากกับ IDE ที่ใช้อยู่เป็นหลัก(แทบจะฟรีตลอด และได้ผลลัพธ์ดีที่สุดด้วย) ผมพยายามตัดความยุ่งยากและความน่ารำคาญทั้งหมดออกให้มากที่สุดเวลาต้องใช้เว็บแชตอินเทอร์เฟซ ตัวแอปฟรีและได้รับฟีดแบ็กที่ดีมาก รวมถึงยินดีรับคำวิจารณ์ด้วย การย้ายไปมาระหว่าง IDE <----> แท็บเว็บแชตสะดวกขึ้นมาก เดิมทีผมทำมันเพื่อประหยัดเวลาตัวเอง และเพราะ UI เป็น PySide6 เลยทำงานเบากว่า webview มาก ข้อความที่ใช้บ่อยสามารถเพิ่มได้ทันทีผ่านปุ่ม preset และยังจำสถานะคอนเท็กซ์อย่างขนาดหน้าต่างหรือไฟล์ที่ใช้แยกตามแต่ละโปรเจกต์ได้ด้วย พอเปิดครั้งถัดไปก็กลับมาสถานะเดิมทันที มันสแกนไฟล์โค้ดอัตโนมัติแล้วเดาไฟล์ที่น่าจะมีประโยชน์ให้ได้ และคุณยังใส่ข้อความก่อนหรือหลังโค้ดในกล่องพรอมป์ต์ได้ด้วย(วิธีนี้มักช่วยให้ผลลัพธ์ดีขึ้น) ปุ่มหนึ่งที่ผมใช้บ่อยตั้งไว้เป็น "เขียนพรอมป์ต์สำหรับ Cline(โค้ดดิ้งเอเจนต์), ครอบทั้งพรอมป์ต์ด้วย code tag เดียวเพื่อให้คัดลอก/วางง่าย, แยกงานทั้งหมดออกเป็นส่วนย่อย ๆ พร้อมคำอธิบายละเอียดและเหตุผลเพื่อให้ Cline ทำตามได้, และเพิ่ม search and replace block แบบ plain language เพื่อระบุตำแหน่งแก้ไข" วิธีที่ผมใช้แก้ปัญหาหรือหา bug คือ ใน VS Code ผมมักพิมพ์
aicpในเทอร์มินัลเพื่อเปิดแอป จากนั้นทำ file fine-tuning ใส่คำอธิบายหรือสิ่งที่อยากแก้ แล้วกดปุ่ม Cline กับ Generate Context! ก่อนนำไปวางใน GLM-4.5 ถ้าเป็นปัญหายากก็จะลองกับ 2-3 โมเดล เช่น o3, o4-mini, GPT-5, Gemini 2.5 Pro แล้วเลือกคำตอบที่สมเหตุสมผลที่สุดไปวางใน Cline(VS Code, GPT 4.1 แบบ unlimited/free version) 4.1 อาจไม่ได้ฉลาดมากเป็นพิเศษ แต่ทำตามคำสั่งได้แม่น และยังแก้ความผิดพลาดเล็ก ๆ น้อย ๆ แบบที่โมเดลใหญ่ชอบพลาดได้เอง โมเดลใหญ่จะช่วยเขียนคำอธิบายละเอียดกับรายการงานให้สวยงาม แล้ว 4.1 ก็เอาไปลงมือทำต่อใน agent mode ทำแบบนี้คุณก็เขียนโค้ดกับ AI ที่ฉลาดมากได้แบบฟรีไม่จำกัด ถ้าเอา MCP(tool ฯลฯ) ไปต่อกับโมเดล ประสิทธิภาพกลับลดลง และถ้าใช้ API อย่าง Claude 4 ก็มีแต่จะเสียเงินเยอะความเร็วการเลื่อนหน้าเว็บช้ามาก(Firefox Android ได้ต่ำกว่า 1 fps) และ call-out ที่เกี่ยวกับ grok ก็เลื่อนไม่ได้ ด้านบนยังมีปุ่มสีเขียวขนาดใหญ่น่าสงสัยเขียนว่า CSS loaded โผล่มาด้วย
ไดอะแกรมใน [https://wuu73.org/aicp] มีประโยชน์ แต่พอกดแล้วไม่แสดงแบบความละเอียดเต็มเลยดูเบลอ เป็นเหมือนกันทั้ง Firefox และ Chrome แต่ใน GitHub repo ภาพคมชัดดี เลยน่าจะเป็นปัญหาที่ฝั่งไลบรารี JS สำหรับเรนเดอร์
อ่านบทความอย่างเพลิดเพลินและขอบคุณสำหรับการอัปเดต ถ้าคุณพอจะลงลึกเรื่องความต่างจากประสบการณ์ใช้งานระหว่าง Roo Code กับ Cline ได้อีก ผมจะสนใจมาก ตอนนี้ผมเคยใช้แต่ Roo Code ซึ่งน่าสนใจดี แต่ผลลัพธ์ค่อนข้างไม่นิ่ง
อยากรู้ว่าเคยลอง Microsoft copilot ไหม มันแทบจะเป็นโมเดล openai ฟรีอยู่แล้ว
ที่บอกว่าเขียนโค้ดได้ฟรี จริง ๆ จะฟรีก็ต่อเมื่อคุณอนุญาตในการตั้งค่าข้อมูล OpenAI ให้เอาข้อมูลของคุณไปใช้ฝึกโมเดลได้ นั่นแปลว่ามันไม่ได้ "ฟรี" จริง ๆ
ประสบการณ์ของผมก็ตรงกับเนื้อหาในบทความ ความสามารถแบบ agentic ใช้งานได้จริงเฉพาะกับโมเดลใหญ่เท่านั้น (คำว่า "ใช้งานได้จริง" นี่คือ... ตัวอย่างเช่น OpenAI Codex ที่ใช้ o4-mini ต้องส่งคำขอ 200 ครั้งเพื่อแก้โค้ด 3 บรรทัด) สำหรับการแก้ไขง่าย ๆ โมเดลเล็กกลับเร็วกว่าเยอะ เลยดีกว่า ดังนั้นผมเลยไม่ได้โฟกัสที่โมเดลที่ "ดีที่สุด" แต่โฟกัสที่ "โง่ที่สุดที่ยังใช้งานได้" ถ้าผลักแนวคิดนี้ไปอีกขั้นแล้วเลิกใช้วิธีแบบ agentic คุณจะทำงานที่ละเอียดมากด้วยโมเดลจิ๋วได้เลย แค่บอกสิ่งที่ต้องการอย่างแม่นยำ มันก็จะให้ผลลัพธ์เป็น diff กลับมาทันที วิธีให้มันไล่ดูระบบไฟล์ไม่มีประสิทธิภาพสำหรับสเกลงานของผม เพราะผมยัดเกือบทั้งโค้ดเบสเข้าไปในคอนเท็กซ์ได้อยู่แล้ว เลยโยน
src/ทั้งก้อนไปในพรอมป์ต์เลย สำหรับโปรเจกต์คนอื่นที่มี boilerplate เยอะ ผมกำลังทดลองใช้โมเดลราคาถูกมากอย่าง gpt-oss-20b เพื่อค้นหาโค้ด ซึ่งสำหรับงานแบบนั้นโมเดลที่เล็กกว่านี้ก็ยังพอใช้ได้ Patent pending นะผมก็คิดเหมือนกัน Haiku ก็พอจัดการ flow ของบทสนทนาได้แล้ว และงานที่ซับซ้อนกว่านั้นก็ส่งไปให้โมเดลใหญ่อย่าง Gemini 2.5 Pro หรือ GPT-5 ช่วงนี้ผมกำลังทดลองใช้ Codex ผ่าน MCP(
${codex mcp}) ใน Gemini CLI และมันทำงานได้ดีมาก Gemini CLI ใช้ Flash เป็นหลัก แต่ก็เพียงพอสำหรับการนิยามปัญหาและประเมินคำตอบซ้ำ ส่วนการใช้ Gemini 2.5 Pro ผ่าน Claude Code MCP ก็ได้ผลเหมือนกัน แต่การใช้ Claude Code เป็น MCP เองกลับไม่ค่อยเวิร์ก แนวคิดพื้นฐานของทั้งหมดนี้แน่นอนว่ามาจาก Aider และเป็นคอนเซปต์การใช้โมเดลหลัก โมเดลรอง และโมเดลสำหรับแก้ไขพร้อมกันAider เป็นเครื่องมือเขียนโค้ดที่ไม่ใช่แบบ agentic แต่บาลานซ์ทั้งประสิทธิภาพและความคุ้มค่าได้ดี มันสร้างแผนที่ repo ด้วย tree-sitter เลยลดความจำเป็นในการไล่ดูระบบไฟล์ลงมาก ถึงจะไม่มี MCP แต่ก็ใช้คำสั่งเชลล์ได้ ทำให้ใช้ยูทิลิตีที่ผมคุ้นเคยได้ด้วย ถ้าจับคู่กับผู้ให้บริการอย่าง Cerebras ความเร็วในการประมวลผลพรอมป์ต์แทบจะทันที ไม่ต้องรอการเรียกใช้เครื่องมือหลายรอบและยังแทรกแซงการทำงานได้ตลอด สำหรับโปรเจกต์เล็กนี่ดีที่สุดจริง ๆ
ผมก็เริ่มคิดไปทางเดียวกันมากขึ้นเรื่อย ๆ ผมอยากได้เครื่องมือที่เร็วและเชื่อถือได้ การเข้าสู่ flow state สำคัญกับผมมาก แต่การต้องรอเครื่องมือเขียนโค้ดแบบ agentic ทำให้จังหวะขาดหมด เลยเริ่มสนใจโมเดลเล็ก หรือผู้ให้บริการอย่าง Cerebras มากขึ้น พอจำกัดขอบเขตปัญหาให้แคบลง ความน่าเชื่อถือก็สูงขึ้นด้วย ส่วนตัวผมก็อยากฟังเรื่องเครื่องมือแนว "surgical" ที่คุณใช้เพิ่มเติมเหมือนกัน ประเด็นนี้ทำให้ผมได้เรียบเรียงความคิดไว้หลายอย่างในโพสต์บล็อกของผม เมื่อไม่นานมานี้
ตอนนี้ใน Codex CLI เปลี่ยนไปใช้โมเดลที่ต่ำกว่า GPT-5 ไม่ได้อีกแล้ว(ถ้าไม่มี API key) เพราะเขาไม่แนะนำ ถ้ารันด้วยตัวเลือก
thinking=highประสิทธิภาพจะดีกว่า o4-mini มาก และ o4-mini ก็แทบจะให้ความรู้สึกเหมือน gpt-5-thinking-mini ใน codex ไม่มีตัวเลือกนั้น และ gpt-5-thinking-high ก็ใกล้เคียงกับ o1 หรือ o3-proเรื่อง "(แทบจะใช้งานได้จริง)"... ที่คุณพูดถึง OpenAI Codex ใช้ o4-mini แล้วต้องส่งคำขอ 200 ครั้งเพื่อแก้โค้ด 3 บรรทัดนั้น ขอบอกว่าในประสบการณ์ผมเองก็เคยเสียเวลาไปหลายวันกับงาน 3 บรรทัดแบบนี้จริง ๆ หลายครั้งเลย
ผมคิดว่าสแตกที่เป็น local ล้วน ๆ ไม่ต้องพึ่งคลาวด์แบบ Cursor มี huge potential มาก ตัวอย่างเช่น: • Cursor CLI สำหรับงาน agentic/dev(https://x.com/cursor_ai/status/1953559384531050724) • ชั้น memory แบบ local ที่เข้ากับ CLI ได้ - LEANN(ดัชนีเล็กลง 97%, ค่าใช้จ่ายคลาวด์ 0, เป็นส่วนตัวเต็มที่, https://github.com/yichuan-w/LEANN) หรือ Milvus(แต่อันนี้มักจะลงเอยที่ใช้งานแบบคลาวด์/คิดตามโทเคน) • สำหรับ inference engine ก็มีตัวอย่างอย่าง Ollama ซึ่งยอดเยี่ยมมากสำหรับรันโมเดล OSS GPT แบบโลคัล ด้วยวิธีนี้คุณจะสร้างสภาพแวดล้อม dev+AI ส่วนตัวที่ออฟไลน์ทั้งหมด เป็นส่วนตัว และเร็วมากได้ LEANN ถูกออกแบบมาสำหรับงานแนวนี้โดยตรง มีขนาดเล็กมาก ค้นหาเชิงความหมายได้ทั่วทั้งสภาพแวดล้อม local รองรับ Claude Code/Cursor ได้แบบ out-of-the-box และใช้ ollama จัดการ generation ได้เลย ไม่ต้องเสียเงินเลยสักบาทและไม่ต้องใช้ API เลย แน่นอนว่าการตั้งค่าต้องลงแรงนิดหน่อย แต่ก็หวังว่าจะมีใครทำให้มันใช้งานง่ายแบบโอเพนซอร์สอย่างสมบูรณ์ได้
ถ้าคุณกำลังหา API ฟรีอยู่ ใน Google Gemini คุณสามารถใช้ Gemini ได้ฟรี โดยเฉพาะ
gemini-2.5-proพร้อมเปิดฟังก์ชัน thinking ได้ด้วย ขีดจำกัดค่อนข้างสูง ผมกำลังใช้ทำ benchmark อยู่แต่ยังไม่ชนลิมิตเลย ส่วนโมเดล open weight อย่าง DeepSeek R1 และ GPT-OSS ก็มีผู้ให้บริการ inference หรือผู้ผลิตฮาร์ดแวร์หลายรายที่เปิดให้เข้าถึง API ฟรีโควตาฟรีของ Gemini 2.5 pro คือวันละ 100 ครั้ง
https://ai.google.dev/gemini-api/docs/rate-limits
เผื่อไว้ด้วยว่า ถ้าใช้กับงานที่ไม่อ่อนไหวก็อาจโอเค แต่ Google จะเอา interaction พวกนี้ไปใช้ฝึก(ยกเว้นถ้าเป็นแบบจ่ายเงิน)
ผมแปลกใจที่ในบทความมีข้อมูลใหม่มากกว่าที่คิด ปกติผมไม่ค่อยเจาะลึกตัวเลือกต่าง ๆ ขนาดนั้น แต่ครั้งนี้รู้สึกว่าคุ้มที่อ่านจนจบ รวมถึงคอมเมนต์ใน HN ก็มีข้อมูลเชิงปฏิบัติเยอะมาก ขอบคุณทุกคน
อยากแนะนำ OP ว่าควรลองศึกษา Continue.dev, ollama/lmstudio และวิธีรันโมเดลบนเครื่องดู บางโมเดลเก่งเรื่อง autocomplete มาก และโมเดลอย่าง gpt-oss ก็ทำได้ดีทั้งด้าน reasoning และการใช้เครื่องมือ สำหรับผม นี่คือ my goto copilot
ผมก็เหมือนกัน! ผมใช้ Continue บน VSCode อยู่ และโมเดลใหญ่ของ Qwen หรือ gpt-oss-120b ก็ทำงานในโหมด agentic ได้ค่อนข้างดี
ผมรู้สึกว่า Zed เหนือกว่า continue.dev ไปอีกขั้น เพราะในนั้นคุณเลือกใช้โมเดลที่ต้องการเองได้
ตามที่โพสต์บอก ปัญหาของ coding agent คือทุกคำขอต้องส่งข้อมูลของตัวเองบวกกับแทบทั้งโค้ดเบสไปด้วย ทำให้ต้นทุนสูง แต่ถ้าเป็น AI แชต ต้นทุนแทบมองข้ามได้เลย ผมใช้แต่ OpenRouter เท่านั้น เพราะเข้าถึงได้แทบทุกโมเดล เดิม Sonnet คือของโปรด แต่พอได้ลอง Gemini 2.5 Pro แล้วพบว่าดีกว่าเกือบตลอด(ข้อเสียคือช้า) ส่วนคำถามง่าย ๆ หรือเวลานึกไวยากรณ์ไม่ออก Gemini Flash เร็วมากจึงเหมาะสุด
บางคนอาจแปลกใจว่าทำไมถึงยอมแลกข้อมูลตัวเองเพื่อใช้ free tier แต่เอาเข้าจริงทรัพยากรที่ต้องใช้เพื่อรัน LLM ดี ๆ เองที่บ้านมันสูงมาก ผมเลยมองว่าปล่อยโค้ดตัวเองออกไปแล้วใช้ฟรีคุ้มกว่า ยังไงโค้ดนั้นก็มีแผนจะเป็นโอเพนซอร์สในที่สุดอยู่แล้ว
ผมเห็นด้วยมากกับคำกล่าวที่ว่า "เวลาใช้ AI ผ่านเว็บแชต(เช่นเว็บอินเทอร์เฟซของ ChatGPT หรือ Openrouter) มักได้ผลลัพธ์ที่ดีกว่า IDE หรือ agent framework แทบทุกครั้ง ในแง่การแก้ปัญหาและเสนอทางออก" ถึงแม้การคัดลอกโค้ดจาก IDE ไปวางในเว็บแชตจะดูไม่สะดวก แต่จากประสบการณ์ของผม ผลลัพธ์มันดีกว่า Github copilot หรือ cursor มาก