34 คะแนน โดย GN⁺ 2025-08-10 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ใช้ โมเดล AI บนเว็บฟรี หลายตัวควบคู่กันเพื่อแยกงานแก้ปัญหาและงานสร้างโค้ดออกจากกัน และใช้ กลยุทธ์แบบไฮบริด เพื่อดึงจุดแข็งของแต่ละโมเดลมาใช้
  • ใช้ AI Code Prep GUI เพื่อคัดเลือกและจัดระเบียบเฉพาะโค้ดที่จำเป็น ป้องกันประสิทธิภาพลดลงจากบริบทที่ไม่จำเป็น และ ส่งให้ AI เฉพาะคอนเท็กซ์หลักเท่านั้น
  • งานวางแผนและดีบักใช้ โมเดลประสิทธิภาพสูง/ฟรี (เช่น Gemini 2.5 Pro, o3, o4-mini, Claude 4) ส่วน การลงมือทำและเขียนโค้ด ใช้ GPT-4.1·Claude 3.5
  • ใช้ OpenAI data sharing, GitHub Copilot, Poe.com, OpenRouter และช่องทางอื่น ๆ เพื่อหา โทเค็นฟรีหรือราคาถูก และ ลดต้นทุน
  • ผสมใช้ เอเจนต์และเครื่องมือ CLI หลายแบบตามสถานการณ์ เช่น Claude Code, Qwen Code, Gemini CLI, Roo Code, Trae IDE เพื่อเพิ่ม ประสิทธิภาพการทำงาน

การตั้งค่าเบราว์เซอร์ของฉัน: บุฟเฟต์ AI ฟรี

  • เปิดแท็บฟรีของโมเดล AI ทรงพลังหลายตัวไว้พร้อมกันในเบราว์เซอร์แล้วใช้งาน
  • เป็นวิธีที่ไม่พึ่งพาโมเดลใดโมเดลหนึ่งเพียงอย่างเดียว แต่รับคำตอบจากหลายมุมมอง โดยชุดโมเดลฟรีที่ใช้เป็นประจำมีดังนี้
  • GLM 4.5: ใช้งานฟรีบนเว็บได้ และจากประสบการณ์ให้ประสิทธิภาพระดับ Claude 4 หรือดีกว่า มักเปิดไว้ 2–3 แท็บเสมอ
  • Kimi K2: เป็นโมเดลที่คล้ายสาย Claude หรือ Opus และใช้งานบนเว็บได้ฟรี ปกติเปิดไว้ 1–2 แท็บ ก่อนที่ GLM 4.5 จะมา โมเดลนี้ช่วยแก้บั๊กยาก ๆ ได้หลายครั้งต่อวัน
  • Qwen3 Coder และโมเดลรุ่นใหม่ต่าง ๆ: ใช้สำหรับทดสอบโมเดลที่เน้นงานเขียนโค้ดหลายแบบ
  • OpenAI Playground: ใช้โมเดลหลากหลายอย่าง GPT-4.5, o3 ได้ฟรี หากอนุญาตในการตั้งค่าข้อมูลบัญชีให้ "OpenAI ใช้ข้อมูลเพื่อฝึกโมเดล" จะได้รับโทเค็นฟรี
  • Google Gemini AI Studio: ใช้งานโมเดล Gemini 2.5 Pro/Flash ได้ฟรีและแทบไม่จำกัด มักเปิดไว้ 1–3 แท็บ
  • Google Gemini 2.5 Pro: เป็นบริการแยกจาก AI Studio และเด่นกว่าด้านการสร้างภาพและฟีเจอร์วิจัยเชิงลึก จึงเปิดใช้ควบคู่กับ AI Studio
  • Poe.com: ให้เครดิตฟรีรายวันสำหรับโมเดลพรีเมียมอย่าง Claude 4 หรือ o4-mini
  • OpenRouter: ใช้ได้ทั้งโมเดลฟรีและเสียเงินแบบผสมกัน โดยตั้งค่าแต่ละโมเดลไว้คนละแท็บ
  • ChatGPT: เวอร์ชันฟรีก็ยังมีประโยชน์ จึงคงไว้อย่างน้อย 1 แท็บ
  • Perplexity AI: เด่นสำหรับคำถามที่เน้นการค้นคว้า
  • Deepseek: ให้ใช้ฟรีสำหรับโมเดล v3 และ r1 แต่ต้องระวังข้อจำกัดด้านคอนเท็กซ์
  • Grok.com: ให้ใช้ฟรีไม่จำกัดสำหรับการใช้งานทั่วไป การวิจัยเชิงลึก และการแก้ไขภาพ โดยเฉพาะฟีเจอร์วิจัยเชิงลึกที่คล้าย Perplexity จึงมีประโยชน์
  • Phind: พยายามให้คำตอบพร้อมโฟลว์ชาร์ตหรือไดอะแกรม
  • lmarena.ai: ให้ Claude Opus 4 และ Sonnet 4 ใช้งานฟรี ซึ่งการใช้ Opus 4 ฟรีถือว่ามีคุณค่ามาก

ตัว Claude.ai เองก็ใช้ฟรีเช่นกัน แต่ข้อจำกัดการใช้งานเกิดขึ้นบ่อยจนอาจไม่สะดวก จึงใช้วิธีเข้าถึงแบบอื่นผ่านส่วนขยาย Cody หรือ Copilot เป็นต้น

ข้อควรระวัง – เมื่อใช้ Grok
Grok ให้การประมวลผลฟรีและการสร้างภาพแบบไม่ถูกกรอง จึงอาจมีประโยชน์เมื่อระบบความปลอดภัยของโมเดลอื่นขัดขวางการทำงาน อย่างไรก็ตาม มีรายงานว่าผู้ดูแลอาจมีเจตนาส่งเสริมแนวคิดที่เชื่อมโยงกับนาซีหรือข้อมูลเท็จ และยังมีข้อกล่าวอ้างว่าเคยถูกสั่งให้ให้ข้อมูลเท็จเกี่ยวกับเหตุการณ์ทางประวัติศาสตร์ เช่น การฆ่าล้างเผ่าพันธุ์ในแอฟริกา ความบิดเบือนเหล่านี้ส่วนใหญ่ปรากฏบนแพลตฟอร์ม X ดังนั้นจึงแนะนำให้ใช้แบบจำกัดเฉพาะงานที่ปลอดภัย เช่น การเขียนโค้ด หรือใช้งานโดยคำนึงถึงอคติที่อาจมีอยู่

เวิร์กโฟลว์ที่ฉลาดและถูกกว่า: Focused Context

  • เมื่อใช้แชต AI บนเว็บ (เช่น AI Studio, ChatGPT, OpenRouter) หลายครั้งกลับแก้ปัญหาหรือเสนอแนวทางแก้ได้ดีกว่า IDE หรือเฟรมเวิร์กเอเจนต์ (เช่น Cline, Trae, Copilot)
  • หากใช้เครื่องมืออย่าง Cursor, Cline, Roo Code จัดการทุกอย่างทั้งหมด จะต้องส่งข้อความจำนวนมากที่ไม่เกี่ยวกับปัญหาโดยตรงไปให้ AI เช่น วิธีใช้ MCP server หรือขั้นตอนการแก้ไขไฟล์ ทำให้ AI สับสนและประสิทธิภาพลดลง
  • ด้วยเหตุนี้ แม้จะใช้โมเดลราคาแพงที่สุด ก็ยังเอาชนะ ‘ผลของความอืด’ ที่เกิดจากข้อมูลไม่จำเป็นไม่ได้
  • ดังนั้นจึงใช้วิธีสร้างคอนเท็กซ์ที่แม่นยำสำหรับการแก้ปัญหาด้วยตัวเอง แล้วค่อยนำไปวางในเว็บแชต AI เพื่อถามคำถามหรือขอรีวิวโค้ด
  • เมื่อได้แนวทางแก้แล้ว ก็เขียนเนื้อหานั้นเป็นพรอมป์ต์สำหรับเอเจนต์อย่าง Cline แล้วมอบหมายแค่การแก้ไขไฟล์
  • วิธีนี้ทำให้ใช้ GPT-4.1 (ที่ใช้งานได้ไม่จำกัด) เพื่อแก้ปัญหาและวางแผนได้อย่างประหยัด โดยไม่จำเป็นต้องเปลืองเครดิต Claude
  • ใช้ Claude สำหรับปัญหาที่ยาก และใช้เว็บแชต AI สำหรับการลงมือทำควบคู่กัน เพื่อเพิ่มประสิทธิภาพ
  • AI Code Prep ช่วยอย่างไร (โครงสร้างพรอมป์ต์ตัวอย่าง)

    พรอมป์ต์ตัวอย่าง:

    Can you help me figure out why my program does x instead of y?  
    
    • AI Code Prep GUI จะสแกนโฟลเดอร์โปรเจกต์แบบ recursive สำรวจทุกโฟลเดอร์ย่อยและไฟล์ จากนั้นจัดระเบียบโค้ดและคำถามให้อยู่ในรูปแบบที่ AI อ่านได้สะดวก
    • ตัวอย่างคอนเท็กซ์ที่สร้างขึ้น:
    Can you help me figure out why my program does x instead of y?  
    
    fileName.js: <code>  
    ... 파일 내용 ... </code>  
    
    nextFile.py: <code>  
    import example  
    ... 기타 내용 ... </code>  
    
    Can you help me figure out why my program does x instead of y?  
    
    • ทำซ้ำคำถามสองครั้ง (เลือกวางด้านบน/ล่าง/ทั้งสองด้านได้) เพื่อช่วยให้ AI รักษาโฟกัส
    • บน Windows ให้คลิกขวาเมาส์ภายในโฟลเดอร์โปรเจกต์ → เรียกใช้ "AI Code Prep GUI" → ระบบจะเลือกไฟล์โค้ดโดยอัตโนมัติ และตัดไดเรกทอรีที่ไม่จำเป็นอย่าง node_modules, .git ออกให้อัตโนมัติ
    • แม้การเลือกจะไม่สมบูรณ์แบบ ก็ยังปรับได้ง่ายผ่านช่องทำเครื่องหมาย
    • เมื่อเป็นโปรเจกต์ขนาดใหญ่จนเกินขีดจำกัดคอนเท็กซ์ของ AI ก็สามารถคัดเลือกเฉพาะไฟล์ที่จำเป็นจริง ๆ เพื่อส่งให้ได้
  • ทำไมวิธีนี้จึงสำคัญ?

    • เอเจนต์เขียนโค้ดจำนวนมาก เช่น Cline, GitHub Copilot, Cursor, Windsurf มักส่งคอนเท็กซ์ มากเกินไป หรือ น้อยเกินไป จนไม่มีประสิทธิภาพ
    • หากคัดเลือกไฟล์ด้วยตัวเอง ก็จะส่งให้ AI ได้เฉพาะข้อมูลที่จำเป็นโดยไม่มีข้อมูลส่วนเกิน
    • เนื่องจากเป็น GUI จึง รักษาความปลอดภัยของโค้ดส่วนตัว และ ใช้งานสะดวก ได้ดีกว่าเครื่องมือสร้างคอนเท็กซ์อื่นที่ต้องใช้ CLI หรือลิงก์ GitHub แบบสาธารณะ
    • ดูอัปเดตฟีเจอร์ล่าสุดได้ที่ wuu73.org/aicp

กลยุทธ์ด้านโมเดล: เลือกสมองที่เหมาะกับงาน

  • มีโมเดล AI ทรงพลังจำนวนมากที่เปิดให้ใช้ฟรีผ่านเว็บอินเทอร์เฟซ (Gemini in AI Studio, Grok, Deepseek เป็นต้น) จึงควรใช้สิ่งเหล่านี้ก่อนเป็นอันดับแรก
  • Poe.com ให้เครดิตฟรีรายวันสำหรับโมเดลระดับท็อปอย่าง Claude และซีรีส์ o4 ใหม่
  • Gemini 2.5 Pro (ให้บริการผ่าน AI Studio) โดดเด่นมากในงานดีบัก การวางแผน และงานโดยรวม จึงถูกมองว่าเป็นโมเดลที่อเนกประสงค์ที่สุดในตอนนี้
  • สำหรับปัญหาที่ยากเป็นพิเศษ ให้ลอง o4-mini (ใช้งานได้ผ่าน OpenRouter หรือ Poe)
    • เมื่อใช้ผ่าน API มีค่าใช้จ่ายถูกกว่ารุ่นท็อประดับก่อนหน้า (Claude 3.5/3.7/4) มาก
    • มีประสบการณ์ว่าเคยช่วยแก้บั๊กที่แก้ไม่ตกได้ทันที
  • Claude 3.7 หรือ 4 เข้าถึงได้ผ่าน Poe, API (OpenRouter), GitHub Copilot Chat เป็นต้น
    • มีโควตาฟรีให้บางส่วน แต่ถ้าใช้บ่อย ค่าใช้จ่ายจะค่อนข้างสูง
    • รุ่น 3.7/4 ให้ผลลัพธ์ที่สร้างสรรค์และพุ่งแรง (“สไตล์ Hunter S. Thompson”) แต่สำหรับการเขียนโค้ดจริง การให้ Claude 3.5 ทำงานแบบนิ่ง ๆ อาจมีประสิทธิภาพกว่า
  • วิธีใช้โทเค็นฟรีใน OpenAI Playground

    • หากเปิดใช้งานการตั้งค่าการแชร์ข้อมูลในบัญชี OpenAI จะสามารถใช้โทเค็นฟรีจำนวนมากได้ทุกวัน
    • ไปที่ OpenAI Playground → ไอคอนตั้งค่ามุมขวาบน → เมนูด้านซ้าย Data ControlsSharing แล้วเปิด "Share inputs and outputs with OpenAI" เพื่อรับสิทธิประโยชน์ดังนี้:
    • สูงสุด 250,000 โทเค็นต่อวัน: gpt-5, gpt-4.1, gpt-4o, o1, o3
    • สูงสุด 2,500,000 โทเค็นต่อวัน: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
    • หากใช้การตั้งค่านี้ จะสามารถใช้โมเดลระดับท็อปอย่าง o3 และ GPT-4.5 ได้ฟรีในปริมาณมาก
    • ใน OpenAI Playground สามารถรัน o3 และ o4-mini แบบวางคู่กันเพื่อเปรียบเทียบ และทำความเข้าใจจุดแข็งกับการใช้งานที่เหมาะของแต่ละโมเดลได้
  • กลยุทธ์การใช้งานโมเดลที่แนะนำ

    • Gemini 2.5 Pro: ตัวเลือกอันดับแรกสำหรับการดีบัก การวางแผน และงานเขียนโค้ดโดยรวม
    • o4-mini: เหมาะกับการแก้บั๊กยาก ๆ และคุ้มค่าด้านต้นทุน
    • Claude 4 / 3.7: เหมาะที่สุดสำหรับการแก้ปัญหาที่ยากและเร่งด่วน แต่มีข้อจำกัดด้านการเข้าถึงและค่าใช้จ่าย
    • Claude 3.5: เหมาะสำหรับนำผลลัพธ์เชิงสร้างสรรค์จาก 3.7/4 มาขัดเกลา หรือใช้เขียนโค้ดจริง
    • o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: มีความสามารถยอดเยี่ยมมากในการแก้ปัญหาที่ซับซ้อน และสามารถใช้งานได้จำนวนมากหากอาศัยการตั้งค่าโทเค็นฟรี

แนวทางแบบไฮบริด: วางแผนด้วยรุ่นพรีเมียม + ลงมือด้วยรุ่นประหยัด

  • หลังจากทดลองโมเดลหลากหลายแบบ ได้พัฒนากลยุทธ์ไฮบริดที่ช่วยเพิ่มทั้งคุณภาพและความคุ้มค่าด้านต้นทุนให้สูงสุด
  • อินไซต์สำคัญคือ แต่ละโมเดลมีจุดแข็งต่างกันในแต่ละช่วงของกระบวนการพัฒนา

ทฤษฎี “Smart Juice” – ทำไม AI ถึงดูโง่ลง
‘พลังความฉลาด’ ที่โมเดลได้รับมีอยู่อย่างจำกัด
หากส่งพรอมป์ต์ที่กระชับและโฟกัส พลังนั้นแทบ 100% จะถูกใช้ไปกับการแก้ปัญหา
แต่ถ้าส่งอินพุตที่ซับซ้อนเกินจำเป็น (คำอธิบายวิธีใช้เครื่องมือยาว ๆ บริบทที่ไม่เกี่ยวกับปัญหา โค้ดหลายหน้า ฯลฯ) พลังส่วนใหญ่จะถูกใช้ไปกับการประมวลผลสิ่งเหล่านั้น ทำให้ ‘ความฉลาด’ ที่เหลือไว้แก้ปัญหาจริงลดลง

ตัวอย่าง: เอเจนต์ที่เชื่อมกับ IDE อย่าง Cursor และ Cline มักส่งคำสั่งและคอนเท็กซ์จำนวนมากก่อนถาม ทำให้ความสามารถในการโฟกัสของโมเดลลดลง
ดังนั้น การลดบริบทที่ไม่จำเป็น และส่งเฉพาะแก่นที่จำเป็นต่อการแก้ปัญหา คือวิธีให้ได้ผลลัพธ์ที่ดีที่สุด

  • เวิร์กโฟลว์เมื่อเริ่มโปรเจกต์ใหม่

    • 1. Plan & Brainstorm
      • ใช้เว็บโมเดลที่ฉลาดและฟรี (Gemini 2.5, o4-mini, Claude 3.7/4, o3 เป็นต้น) เพื่อออกแบบแนวทาง วางแผนทีละขั้น และระบุไลบรารีที่ต้องใช้
    • 2. Generate Agent Prompt
      • ขอให้หนึ่งในโมเดลข้างต้นเขียนว่า:
        "Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [คำอธิบายงาน]"
      • จากนั้นนำพรอมป์ต์ที่ได้ไปขัดเกลาอีกครั้งด้วย AI ฟรีที่เก่งด้านการรีไรต์ เช่น ChatGPT
    • 3. Execute with Cline
      • วางพรอมป์ต์ที่ปรับแล้วลงใน Cline และรันด้วย GPT 4.1 หรือ Claude 3.5 (ถ้าเป็นงานซับซ้อนให้ใช้ Claude 4)
      • กลุ่ม GPT 4.1 ถูกฝึกมาดีในด้านการทำตามคำสั่ง
    • 4. Fallback
      • หาก GPT 4.1 ล้มเหลว ให้สลับไปใช้ Claude 3.5 ผ่าน API
      • Deepseek v3 หรือ R1 ก็ทำงานตามคำสั่งได้แข็งแกร่งมากเช่นกัน
  • กลยุทธ์หลัก

    • ใช้ โมเดลที่แพงและฉลาด (หรือ Gemini 2.5 Pro ที่ใช้ฟรีได้) สำหรับขั้นวางกลยุทธ์และออกแบบ
    • นำแผนไปแปะให้โมเดลฟรีตัวอื่นอีก 2~3 ตัวตรวจสอบ (Deepseek R1, Claude บน Poe เป็นต้น):
      "Is this good? Can you improve it or find flaws?"
    • สำหรับ ขั้นเขียนโค้ดและรันจริง ให้ใช้โมเดลที่เสถียรและมีประสิทธิภาพ (GPT 4.1, Claude 3.5) ใน Cline
  • ทิปการใช้งานแต่ละโมเดล

    • o4-mini
      • เก่งด้าน กลยุทธ์การลงมือพัฒนาระดับสูง เช่น การตีความลอจิกโค้ดที่ซับซ้อน การเลือกเฟรมเวิร์กและไลบรารี
    • การระดมไอเดีย
      • ใช้ Gemini 2.5, o4-mini, GPT 4.1, ChatGPT, o3-mini (มักใช้ฟรีบน duck.ai), Phind เป็นต้น
    • เมื่อแก้ไม่ได้
      • หากโมเดลฟรี/ราคาถูกยังแก้ไม่สำเร็จ ให้ escalatation ไปใช้โมเดลระดับสูงแบบเสียเงินผ่าน API

เอเจนต์และการตั้งค่าทางเลือกอื่น

  • Trae.ai (Bytedance, ผู้สร้าง TikTok)
    • IDE ที่เข้ากันได้กับ VS Code พร้อมให้ใช้งาน AI ฟรี: รวมถึง Claude 4, Claude 3.7, Claude 3.5, GPT 4.1
    • ประสิทธิภาพของเอเจนต์ในตัวด้อยกว่า Cline (พูดตรงๆ คือ Cline แกร่งสุด)
    • เนื่องจากเป็นโคลนของ VS Code จึงดูว่าน่าจะติดตั้งส่วนขยาย Cline ได้
    • แต่ ช้าเพราะเซิร์ฟเวอร์โอเวอร์โหลด → ประสิทธิผลในการใช้งานฟรีค่อนข้างต่ำ
    • ถึงอย่างนั้นก็ยังควรกล่าวถึง เพราะเข้าถึงโมเดลฟรีได้
  • การตั้งค่าที่แนะนำ 2 แบบ

    • 1. VS Code + Cline + Copilot
      • สมัคร Copilot เดือนละ $10 → ใช้โมเดลทรงพลังผ่าน API ใน Cline ได้แบบประหยัด
      • ฟรีเทียร์ก็ใช้ฟังก์ชันพื้นฐานบางส่วนได้
    • 2. Trae.ai + Cline
      • ทดสอบว่าสามารถใช้การเข้าถึงโมเดลฟรีของ Trae ควบคู่กับการใช้ API key ของ Cline ได้หรือไม่

    ทิป: บางครั้งเอเจนต์พื้นฐานของ Copilot ก็แก้ปัญหาที่ Cline ทำได้ไม่ดี และบางครั้งก็เป็นในทางกลับกัน
    Cline อาจส่งพรอมป์ต์ที่ยาวเกินไปจนประสิทธิภาพลดลง → จึงมีกรณีที่ Copilot ได้เปรียบ

  • Roo Code: โคลนของ Cline

    • Roo Code แทบจะเหมือน Cline แต่มีฟีเจอร์บางอย่างที่ต่างออกไป
    • ขึ้นอยู่กับโปรเจกต์หรือสไตล์การเขียนโค้ดของคุณว่า Roo Code อาจเหมาะกว่า
    • ตัว Cline เองใช้ฟรี แต่มีค่าใช้จ่ายจากการเรียก API
    • วิธีที่คุ้มที่สุด: ตั้งค่า VS Code LM API + สมัคร Copilot เดือนละ $10 → ใช้โมเดลทรงพลังได้แทบไม่จำกัด
  • เครื่องมือ CLI ใหม่: Claude Code, Qwen Code, Gemini CLI

    • ช่วงหลังความสนใจในเครื่องมือเขียนโค้ดแบบ CLI เพิ่มขึ้นอย่างมาก
    • Claude Code: รองรับ subagent → ทำงานทีละอย่างเท่านั้น และไม่ใช้เครื่องมือเพิ่มเติม
      • สามารถจำลองเวิร์กโฟลว์แบบโฟกัส ‘smart juice’ ที่อธิบายในไกด์นี้ได้
      • ตัดคำสั่งเอเจนต์ที่ไม่จำเป็น (bloat) ออก พร้อมรักษาประสิทธิภาพไว้
    • Qwen Code, Gemini CLI ต่างก็มีจุดเด่นของตัวเอง
    • มีไกด์การตั้งค่าสำหรับใช้ Claude Code กับ GLM 4.5 อยู่บนเว็บไซต์ z.ai
    • เครื่องมือ CLI แต่ละตัวมีจุดแข็งต่างกัน จึงแนะนำให้ทดลองโดยอ้างอิงจากไกด์และทิปของชุมชน

TL;DR: Quickstart Guide

  • Models & Roles
    • Planning & Brainstorming
      แนะนำให้ใช้ GLM 4.5, Kimi K2, Qwen3 Coder และซีรีส์ 2507 ล่าสุด, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), และใช้โทเค็นฟรีวันละ 250k ใน OpenAI Playground (o3, GPT-5)
    • Problem Solving & Debugging
      GPT-5 (โทเค็นฟรีใน Playground), GLM-4.5 (ประสิทธิภาพระดับ Claude 4), Claude 4 (โทเค็นฟรีรายวันบน Poe)
    • Actual Coding
      GPT-4.1 (Cline), หากล้มเหลวให้ใช้ Claude 3.5 แทน หรือใช้ Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2
  • Key Tools
    • VS Code
    • AI Code Prep GUI – สแกนและคัดเฉพาะไฟล์ที่จำเป็นจากเครื่องโลคัล เพื่อปรับบริบทสำหรับ AI ให้เหมาะสมที่สุด
    • Cline (เอเจนต์สำหรับ VS Code) – รันโค้ดแบบเป็นขั้นตอน
    • เว็บแชตฟรี – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio(Gemini 2.5 Pro), OpenRouter, duck.ai
  • Quick Workflow
    1. ใช้ AI Code Prep GUI เพื่อรวมไฟล์ที่เกี่ยวข้องกับโปรเจกต์เป็นชุด
    2. วางบริบทนั้นลงในโมเดลเว็บแชตที่คุณชอบ เพื่อวางแผนและดีบัก
    3. ขอให้โมเดลหนึ่งตัว เขียน Cline prompt แบบละเอียดสำหรับงานนี้ แล้วนำไปขัดเกลาต่อใน ChatGPT เป็นต้น
    4. วางพรอมป์ต์ที่เสร็จแล้วลงใน Cline ที่ตั้งค่าเป็น GPT-4.1 เพื่อสร้างหรือแก้ไขโค้ด
      → หากล้มเหลวให้สลับไปใช้ Claude 3.5
  • Cost-Saving Hacks
    • เปิดใช้งาน “data sharing” ใน OpenAI Playground → รับโทเค็นฟรีวันละ 250k (GPT-4.5, o3) + โทเค็นฟรีวันละ 2.5M (o4-mini, o3-mini)
    • สมัคร GitHub Copilot เดือนละ $10 → ใช้โมเดล Claude ใน Cline ได้แบบมีข้อจำกัด
    • คิดค่าบริการตามการใช้งานของ OpenRouter → ใช้โมเดลล่าสุดอย่าง o4-mini, Claude 3.7 ได้ในราคาประหยัด

Some Thoughts

  • AI เป็นตัวเร่งผลิตภาพที่น่าทึ่ง แต่ไม่ใช่ไม้กายสิทธิ์
  • เวทมนตร์ที่แท้จริงเกิดขึ้นเมื่อ ความอยากรู้อยากเห็น, ความอุตสาหะ, และ ความตั้งใจจะทดลอง ของคุณมาผสานกับเครื่องมือทรงพลังเหล่านี้
  • อย่าท้อกับบั๊กหรือปัญหา — ทุกความท้าทายคือโอกาสในการเรียนรู้สิ่งใหม่
  • ลองผสมการใช้หลายโมเดล กล้าทดลองไอเดียจัดจ้าน และอย่ากลัวที่จะพังแล้วสร้างใหม่
  • นักพัฒนาที่ดีที่สุดไม่ใช่คนที่ไม่เคยตัน แต่คือคนที่แม้ตันก็ยังเดินหน้าต่อและใช้ทุกเครื่องมือกับเทคนิคที่มี
  • จงโอบรับความโกลาหล สนุกกับกระบวนการ และปล่อยให้ ความคิดสร้างสรรค์ ของคุณเป็นผู้นำทาง!

Latest Model Updates (Aug 2025)

💰 สายประหยัด: รีดความคุ้มค่าสูงสุด

  • GPT 4.5

    • สถานะ: ยุติการให้บริการ
  • o3

    • ความสามารถ: ประสิทธิภาพทัดเทียม Claude 4, โดดเด่นในการแก้ปัญหายาก, ระดับอัจฉริยะ
    • ทิปการใช้งาน: ใส่ทั้งโค้ดเบสเพื่อวิเคราะห์ได้ด้วย AI Code Prep GUI
    • Free Tokens: เปิดการแชร์ข้อมูลใน Data Controls/Sharing settings แล้วจะได้ 250k tokens/day
  • o4-mini

    • ความสามารถ: ด้อยกว่า o3 เล็กน้อยแต่ยังยอดเยี่ยมมาก เหมือนเป็นน้องของ o3
    • Free Tokens: เปิดการแชร์ข้อมูลแล้วจะได้ 2.5M tokens/day
  • Gemini 2.5 Pro

    • การใช้งาน: ใช้ฟรีบน AI Studio
    • จุดเด่น: การดีบักที่ซับซ้อน การออกแบบสถาปัตยกรรม และการวางแผน
  • Deepseek R1 0528

    • ความสามารถ: โมเดลที่ฉลาดมากพร้อมความสามารถด้านการให้เหตุผลที่พัฒนาขึ้น
    • การใช้งาน: ใช้ฟรีได้ผ่านเว็บอินเทอร์เฟซของ Deepseek

🚀 Premium: แก้ปัญหาได้เดี๋ยวนี้

  • Claude 4 Sonnet

    • ความสามารถ: หากให้บริบทเพียงพอ มักจะแก้ปัญหาส่วนใหญ่ได้ในครั้งเดียว
    • จุดเด่น: ประสิทธิภาพยอดเยี่ยมรอบด้าน ทั้งการเขียนและการแก้ปัญหา
    • การใช้งาน: เมื่อจำเป็นต้องแก้ให้สมบูรณ์ตั้งแต่ครั้งแรก
  • Claude 4 Opus

    • ราคา: $75 / 1M โทเค็น
    • ประสิทธิภาพ: ขึ้นชื่อว่าเหนือกว่า Sonnet เป็นระดับ “magic sauce”
    • การใช้งาน: เมื่อคุณต้องการการแก้ปัญหาระดับสุดยอด

Solid Worker Models

โมเดลต่อไปนี้ทำตามคำสั่งได้ดีและทำงานได้อย่างเสถียร:

  • GPT 4.1

    • ใช้เป็นโมเดลอัจฉริยะระดับสูงสำหรับการออกแบบและแก้ปัญหา ก่อนนำไปใช้แก้โค้ดจริง
    • สามารถคัดลอกผลลัพธ์ที่ได้จากที่ไหนก็ได้ไปวางใน Cline แล้วรันได้ทันที
  • Claude Sonnet 3.5

    • เด่นด้านการเขียนโค้ดและการแก้ไข
    • ช้ากว่า 4.1 เล็กน้อย แต่เสถียรมาก
  • Deepseek v3

    • เหมาะสำหรับการเขียนโค้ด การแก้ไขโค้ด และงานแบบเอเจนต์
    • คุ้มค่ามากเมื่อเทียบราคาและประสิทธิภาพ
  • OpenRouter Free Models

    • สำรวจโมเดลฟรีได้ที่ OpenRouter โดยตั้งตัวกรองราคาเป็น $0
    • เมื่อมีโมเดลใหม่ออกมา ก็คุ้มค่าที่จะลองทดสอบ

Claude 4 ฟรี: lmarena.ai และอีกมากมาย

Claude Opus 4 and Sonnet 4
  • lmarena.ai ให้ใช้งาน Claude Opus 4, Sonnet 4 และรุ่นอื่น ๆ ได้ฟรี
  • เคล็ดลับ: โอกาสใช้งานโมเดลตระกูล Anthropic ฟรี ควรบันทึก จำไว้ และใช้ให้คุ้ม
  • การใช้งาน: เมื่อทุกอย่างล้มเหลว หรือจำเป็นต้องให้งานเสร็จสมบูรณ์แบบทันที ให้เลือก Claude 4 Sonnet หรือ Opus

ใหม่!! โมเดลจีนตัวแรงรุ่นใหม่ + GPT 5

  • GLM 4.5

    • ประสิทธิภาพ: ใกล้เคียงกับ Claude 4 Opus หรือ Sonnet
    • จุดเด่น: ทำตามกฎของเอเจนต์และการใช้เครื่องมือได้แทบสมบูรณ์แบบ
    • การใช้งาน: เก่งมากกับการแก้บั๊กที่ยากมาก และงานซับซ้อนที่ต้องใช้คอนเท็กซ์จำนวนมาก
  • Qwen3 Coder 480B

    • การประเมิน: เป็นโมเดลที่ทรงพลังและราคาถูก จึงได้รับความนิยมสูง
    • การใช้งาน: งานเขียนโค้ดในสภาพแวดล้อมที่ต้องการประสิทธิภาพสูงและต้นทุนต่ำ
  • Qwen3 Instruct & Thinking 2507

    • ประสิทธิภาพ: มีความเสถียรและความสามารถสูงใกล้เคียงกับ Qwen3 Coder
    • ข้อดี: เชื่อถือได้และคุ้มค่าใช้จ่าย
  • Kimi K2 (Moonshot)

    • จุดเด่น: มีลักษณะเหมือนถูกฝึกด้วยข้อมูลสังเคราะห์แนว Anthropic หรือคล้าย Claude
    • การประเมิน: ประสิทธิภาพยอดเยี่ยมมาก และเป็นโมเดลที่ถูกใช้งานบ่อย
  • GPT 5

    • ข้อจำกัด: ไม่ได้เด่นมากในการใช้เครื่องมือแบบกำหนดเอง (MCP, Cline ฯลฯ)
    • วิธีใช้ที่แนะนำ:
      1. ใช้โมเดลชั้นนำอย่าง GPT 5, GLM 4.5 เป็นต้น เพื่อวางแผนและแก้ปัญหา
      2. จากนั้นเขียนพรอมป์ต์ให้โมเดลเอเจนต์ที่ง่ายกว่ารับหน้าที่แก้ไขจริงและใช้เครื่องมือ
    • การเปรียบเทียบ:
      • GPT 4.1 ยังคุ้มค่ามากเมื่อเทียบกับราคา
      • โมเดลจีนรุ่นใหม่เด่นด้านการใช้ custom tools/Cline
    • สรุป: แม้จะยังทดลองได้ไม่มากพอ แต่แต่ละโมเดลมีจุดแข็งต่างกัน และตอนนี้โมเดลจีนก็น่าสนใจมากในด้านราคาและความเสถียร

Current Coding Workflow (2025)

  • สำหรับโปรเจกต์ใหม่:

    • 1. ช่วงวางแผน:
      • จดรายละเอียดทั้งหมดของโปรเจกต์ (ภาษา, ไลบรารี, เซิร์ฟเวอร์ ฯลฯ) ไว้ใน notepad
    • 2. ปรึกษาหลายโมเดล:
      • นำเนื้อหาเดียวกันไปวางในหลายโมเดลเพื่อรับ "ความเห็นจากแพทย์หลายคน":
        • Gemini 2.5 Pro (ฟรี)
        • GPT 4.1
        • o4-mini
        • Claude 4 (ใช้เครดิตฟรีรายวันของ Poe)
    • 3. ปรับแต่ง:
      • ปรับรายละเอียดอย่างละเอียดผ่านการสนทนาโต้ตอบกับโมเดล
    • 4. สร้างงาน:
      • ขอให้โมเดลเขียนรายการงานแบบเป็นขั้นตอนสำหรับเอเจนต์เขียนโค้ด Cline AI
    • 5. ลงมือทำ:
      • รันงานใน Cline (หรือ Roo Code) โดยตั้ง GPT 4.1 เป็นโหมด act
  • สำหรับการแก้ปัญหา:

    • การวิเคราะห์โค้ดเบสที่ซับซ้อน: ใช้ GPT 4.5 + AI Code Prep
    • ขอ GPT 4.5 ว่า “ช่วยเขียนพรอมป์ต์ให้ Cline ทำงานนี้ให้เสร็จหน่อย”
    • เลือกโมเดลตามความซับซ้อนของปัญหา
    • ใช้หลายโมเดลเพื่อหาแนวทางแก้จากหลายมุม
  • รายการงาน & Test Driven Development (เร็ว ๆ นี้)

    Test Driven Development & Task Lists:
    • ขอให้ AI เขียนรายการงานอย่างละเอียดสำหรับการรัน Cline, Roo Code, Trae agent
    • สามารถสั่งให้ Cline หรือ Roo Code บันทึกความคืบหน้าของงานลงในไฟล์ Markdown และติ๊กเมื่อเสร็จได้
    • ช่วยให้ติดตามความคืบหน้าได้ง่ายและลดการตกหล่น
    • ตอนนี้สามารถทดลองโดยให้โมเดลสร้าง Markdown checklist และให้ Cline หรือ Roo Code อัปเดตไฟล์นั้น
  • เทคนิคประหยัดเงิน

    • GPT 4.5 & o3: หากเปิดการแชร์ข้อมูลการฝึกของโมเดล จะได้ใช้ฟรีวันละ 250,000 โทเค็น
    • โมเดลราคาถูก: ใช้โทเค็นได้วันละ 2.5 ล้านกับ o4-mini, 4.1-mini/nano
    • GitHub Copilot: จ่าย $10 ต่อเดือนเพื่อใช้ Claude รุ่นใหม่ได้ (มีการจำกัดความเร็ว)
    • Trae IDE: ตอนนี้ใช้ Claude 4 และ GPT 4.1 ได้ฟรี (ไม่ต้องสมัครสมาชิก และดูเหมือนไม่มีข้อจำกัด)
    • Poe.com: มีเครดิตฟรีรายวันสำหรับทุกโมเดล
    • Web Interfaces: ใช้อินเทอร์เฟซแชตบนเว็บแบบฟรีเพื่อวางแผนและขอคำปรึกษา
  • เร็ว ๆ นี้: ข้อมูล Reddit แบบสด & อินไซต์

    Live Reddit Data Scraping & Daily Insights:
    • มีแผนจะสแครปข้อมูล Reddit แบบเรียลไทม์เพื่อให้ตัวอย่างการใช้งานโมเดล AI ที่อัปเดตรายวัน
    • จะรวมการวิเคราะห์การใช้งานเชิงลึก การแสดงภาพข้อมูล และอินไซต์ใหม่เกี่ยวกับเวิร์กโฟลว์การเขียนโค้ดจริงและเทรนด์ต่าง ๆ

1 ความคิดเห็น

 
GN⁺ 2025-08-10
ความคิดเห็นจาก Hacker News
  • เผื่อใครสับสน บทความหลักยังมีต่ออีก 2-3 หน้า และเข้าไปดูได้ผ่านไอคอนลูกศรที่อยู่ด้านล่าง

  • ผมเป็นคนเขียนบทความเอง ขอโทษเรื่องฟอนต์ด้วย เนื้อหาค่อนข้างเก่าไปนิด แต่ฝั่ง AI เปลี่ยนเร็วมาก เลยมีแผนอัปเดตให้รวมโมเดลใหม่ ๆ ด้วย ช่วงนี้มีโมเดลใหม่ออกถี่มาก และตัวที่ผมชอบที่สุดช่วงหลังคือ GLM-4.5 ส่วน Kimi K2 ก็ใช้ได้ดี และ Qwen3-Coder 480b หรือ 2507 instruct ก็ถือว่าดีมาก โมเดลพวกนี้ทำงานได้ดีมากในสภาพแวดล้อมหรือเครื่องมือแบบ agentic ผมยังทำแอป context helper ของตัวเองด้วย(https://wuu73.org/aicp) เข้าได้จากลิงก์นี้เลย มันสะดวกมากเวลาผมต้องสลับไปมาระหว่างแท็บ AI แชตจำนวนมากกับ IDE ที่ใช้อยู่เป็นหลัก(แทบจะฟรีตลอด และได้ผลลัพธ์ดีที่สุดด้วย) ผมพยายามตัดความยุ่งยากและความน่ารำคาญทั้งหมดออกให้มากที่สุดเวลาต้องใช้เว็บแชตอินเทอร์เฟซ ตัวแอปฟรีและได้รับฟีดแบ็กที่ดีมาก รวมถึงยินดีรับคำวิจารณ์ด้วย การย้ายไปมาระหว่าง IDE <----> แท็บเว็บแชตสะดวกขึ้นมาก เดิมทีผมทำมันเพื่อประหยัดเวลาตัวเอง และเพราะ UI เป็น PySide6 เลยทำงานเบากว่า webview มาก ข้อความที่ใช้บ่อยสามารถเพิ่มได้ทันทีผ่านปุ่ม preset และยังจำสถานะคอนเท็กซ์อย่างขนาดหน้าต่างหรือไฟล์ที่ใช้แยกตามแต่ละโปรเจกต์ได้ด้วย พอเปิดครั้งถัดไปก็กลับมาสถานะเดิมทันที มันสแกนไฟล์โค้ดอัตโนมัติแล้วเดาไฟล์ที่น่าจะมีประโยชน์ให้ได้ และคุณยังใส่ข้อความก่อนหรือหลังโค้ดในกล่องพรอมป์ต์ได้ด้วย(วิธีนี้มักช่วยให้ผลลัพธ์ดีขึ้น) ปุ่มหนึ่งที่ผมใช้บ่อยตั้งไว้เป็น "เขียนพรอมป์ต์สำหรับ Cline(โค้ดดิ้งเอเจนต์), ครอบทั้งพรอมป์ต์ด้วย code tag เดียวเพื่อให้คัดลอก/วางง่าย, แยกงานทั้งหมดออกเป็นส่วนย่อย ๆ พร้อมคำอธิบายละเอียดและเหตุผลเพื่อให้ Cline ทำตามได้, และเพิ่ม search and replace block แบบ plain language เพื่อระบุตำแหน่งแก้ไข" วิธีที่ผมใช้แก้ปัญหาหรือหา bug คือ ใน VS Code ผมมักพิมพ์ aicp ในเทอร์มินัลเพื่อเปิดแอป จากนั้นทำ file fine-tuning ใส่คำอธิบายหรือสิ่งที่อยากแก้ แล้วกดปุ่ม Cline กับ Generate Context! ก่อนนำไปวางใน GLM-4.5 ถ้าเป็นปัญหายากก็จะลองกับ 2-3 โมเดล เช่น o3, o4-mini, GPT-5, Gemini 2.5 Pro แล้วเลือกคำตอบที่สมเหตุสมผลที่สุดไปวางใน Cline(VS Code, GPT 4.1 แบบ unlimited/free version) 4.1 อาจไม่ได้ฉลาดมากเป็นพิเศษ แต่ทำตามคำสั่งได้แม่น และยังแก้ความผิดพลาดเล็ก ๆ น้อย ๆ แบบที่โมเดลใหญ่ชอบพลาดได้เอง โมเดลใหญ่จะช่วยเขียนคำอธิบายละเอียดกับรายการงานให้สวยงาม แล้ว 4.1 ก็เอาไปลงมือทำต่อใน agent mode ทำแบบนี้คุณก็เขียนโค้ดกับ AI ที่ฉลาดมากได้แบบฟรีไม่จำกัด ถ้าเอา MCP(tool ฯลฯ) ไปต่อกับโมเดล ประสิทธิภาพกลับลดลง และถ้าใช้ API อย่าง Claude 4 ก็มีแต่จะเสียเงินเยอะ

    • ความเร็วการเลื่อนหน้าเว็บช้ามาก(Firefox Android ได้ต่ำกว่า 1 fps) และ call-out ที่เกี่ยวกับ grok ก็เลื่อนไม่ได้ ด้านบนยังมีปุ่มสีเขียวขนาดใหญ่น่าสงสัยเขียนว่า CSS loaded โผล่มาด้วย

    • ไดอะแกรมใน [https://wuu73.org/aicp] มีประโยชน์ แต่พอกดแล้วไม่แสดงแบบความละเอียดเต็มเลยดูเบลอ เป็นเหมือนกันทั้ง Firefox และ Chrome แต่ใน GitHub repo ภาพคมชัดดี เลยน่าจะเป็นปัญหาที่ฝั่งไลบรารี JS สำหรับเรนเดอร์

    • อ่านบทความอย่างเพลิดเพลินและขอบคุณสำหรับการอัปเดต ถ้าคุณพอจะลงลึกเรื่องความต่างจากประสบการณ์ใช้งานระหว่าง Roo Code กับ Cline ได้อีก ผมจะสนใจมาก ตอนนี้ผมเคยใช้แต่ Roo Code ซึ่งน่าสนใจดี แต่ผลลัพธ์ค่อนข้างไม่นิ่ง

    • อยากรู้ว่าเคยลอง Microsoft copilot ไหม มันแทบจะเป็นโมเดล openai ฟรีอยู่แล้ว

    • ที่บอกว่าเขียนโค้ดได้ฟรี จริง ๆ จะฟรีก็ต่อเมื่อคุณอนุญาตในการตั้งค่าข้อมูล OpenAI ให้เอาข้อมูลของคุณไปใช้ฝึกโมเดลได้ นั่นแปลว่ามันไม่ได้ "ฟรี" จริง ๆ

  • ประสบการณ์ของผมก็ตรงกับเนื้อหาในบทความ ความสามารถแบบ agentic ใช้งานได้จริงเฉพาะกับโมเดลใหญ่เท่านั้น (คำว่า "ใช้งานได้จริง" นี่คือ... ตัวอย่างเช่น OpenAI Codex ที่ใช้ o4-mini ต้องส่งคำขอ 200 ครั้งเพื่อแก้โค้ด 3 บรรทัด) สำหรับการแก้ไขง่าย ๆ โมเดลเล็กกลับเร็วกว่าเยอะ เลยดีกว่า ดังนั้นผมเลยไม่ได้โฟกัสที่โมเดลที่ "ดีที่สุด" แต่โฟกัสที่ "โง่ที่สุดที่ยังใช้งานได้" ถ้าผลักแนวคิดนี้ไปอีกขั้นแล้วเลิกใช้วิธีแบบ agentic คุณจะทำงานที่ละเอียดมากด้วยโมเดลจิ๋วได้เลย แค่บอกสิ่งที่ต้องการอย่างแม่นยำ มันก็จะให้ผลลัพธ์เป็น diff กลับมาทันที วิธีให้มันไล่ดูระบบไฟล์ไม่มีประสิทธิภาพสำหรับสเกลงานของผม เพราะผมยัดเกือบทั้งโค้ดเบสเข้าไปในคอนเท็กซ์ได้อยู่แล้ว เลยโยน src/ ทั้งก้อนไปในพรอมป์ต์เลย สำหรับโปรเจกต์คนอื่นที่มี boilerplate เยอะ ผมกำลังทดลองใช้โมเดลราคาถูกมากอย่าง gpt-oss-20b เพื่อค้นหาโค้ด ซึ่งสำหรับงานแบบนั้นโมเดลที่เล็กกว่านี้ก็ยังพอใช้ได้ Patent pending นะ

    • ผมก็คิดเหมือนกัน Haiku ก็พอจัดการ flow ของบทสนทนาได้แล้ว และงานที่ซับซ้อนกว่านั้นก็ส่งไปให้โมเดลใหญ่อย่าง Gemini 2.5 Pro หรือ GPT-5 ช่วงนี้ผมกำลังทดลองใช้ Codex ผ่าน MCP(${codex mcp}) ใน Gemini CLI และมันทำงานได้ดีมาก Gemini CLI ใช้ Flash เป็นหลัก แต่ก็เพียงพอสำหรับการนิยามปัญหาและประเมินคำตอบซ้ำ ส่วนการใช้ Gemini 2.5 Pro ผ่าน Claude Code MCP ก็ได้ผลเหมือนกัน แต่การใช้ Claude Code เป็น MCP เองกลับไม่ค่อยเวิร์ก แนวคิดพื้นฐานของทั้งหมดนี้แน่นอนว่ามาจาก Aider และเป็นคอนเซปต์การใช้โมเดลหลัก โมเดลรอง และโมเดลสำหรับแก้ไขพร้อมกัน

    • Aider เป็นเครื่องมือเขียนโค้ดที่ไม่ใช่แบบ agentic แต่บาลานซ์ทั้งประสิทธิภาพและความคุ้มค่าได้ดี มันสร้างแผนที่ repo ด้วย tree-sitter เลยลดความจำเป็นในการไล่ดูระบบไฟล์ลงมาก ถึงจะไม่มี MCP แต่ก็ใช้คำสั่งเชลล์ได้ ทำให้ใช้ยูทิลิตีที่ผมคุ้นเคยได้ด้วย ถ้าจับคู่กับผู้ให้บริการอย่าง Cerebras ความเร็วในการประมวลผลพรอมป์ต์แทบจะทันที ไม่ต้องรอการเรียกใช้เครื่องมือหลายรอบและยังแทรกแซงการทำงานได้ตลอด สำหรับโปรเจกต์เล็กนี่ดีที่สุดจริง ๆ

    • ผมก็เริ่มคิดไปทางเดียวกันมากขึ้นเรื่อย ๆ ผมอยากได้เครื่องมือที่เร็วและเชื่อถือได้ การเข้าสู่ flow state สำคัญกับผมมาก แต่การต้องรอเครื่องมือเขียนโค้ดแบบ agentic ทำให้จังหวะขาดหมด เลยเริ่มสนใจโมเดลเล็ก หรือผู้ให้บริการอย่าง Cerebras มากขึ้น พอจำกัดขอบเขตปัญหาให้แคบลง ความน่าเชื่อถือก็สูงขึ้นด้วย ส่วนตัวผมก็อยากฟังเรื่องเครื่องมือแนว "surgical" ที่คุณใช้เพิ่มเติมเหมือนกัน ประเด็นนี้ทำให้ผมได้เรียบเรียงความคิดไว้หลายอย่างในโพสต์บล็อกของผม เมื่อไม่นานมานี้

    • ตอนนี้ใน Codex CLI เปลี่ยนไปใช้โมเดลที่ต่ำกว่า GPT-5 ไม่ได้อีกแล้ว(ถ้าไม่มี API key) เพราะเขาไม่แนะนำ ถ้ารันด้วยตัวเลือก thinking=high ประสิทธิภาพจะดีกว่า o4-mini มาก และ o4-mini ก็แทบจะให้ความรู้สึกเหมือน gpt-5-thinking-mini ใน codex ไม่มีตัวเลือกนั้น และ gpt-5-thinking-high ก็ใกล้เคียงกับ o1 หรือ o3-pro

    • เรื่อง "(แทบจะใช้งานได้จริง)"... ที่คุณพูดถึง OpenAI Codex ใช้ o4-mini แล้วต้องส่งคำขอ 200 ครั้งเพื่อแก้โค้ด 3 บรรทัดนั้น ขอบอกว่าในประสบการณ์ผมเองก็เคยเสียเวลาไปหลายวันกับงาน 3 บรรทัดแบบนี้จริง ๆ หลายครั้งเลย

  • ผมคิดว่าสแตกที่เป็น local ล้วน ๆ ไม่ต้องพึ่งคลาวด์แบบ Cursor มี huge potential มาก ตัวอย่างเช่น: • Cursor CLI สำหรับงาน agentic/dev(https://x.com/cursor_ai/status/1953559384531050724) • ชั้น memory แบบ local ที่เข้ากับ CLI ได้ - LEANN(ดัชนีเล็กลง 97%, ค่าใช้จ่ายคลาวด์ 0, เป็นส่วนตัวเต็มที่, https://github.com/yichuan-w/LEANN) หรือ Milvus(แต่อันนี้มักจะลงเอยที่ใช้งานแบบคลาวด์/คิดตามโทเคน) • สำหรับ inference engine ก็มีตัวอย่างอย่าง Ollama ซึ่งยอดเยี่ยมมากสำหรับรันโมเดล OSS GPT แบบโลคัล ด้วยวิธีนี้คุณจะสร้างสภาพแวดล้อม dev+AI ส่วนตัวที่ออฟไลน์ทั้งหมด เป็นส่วนตัว และเร็วมากได้ LEANN ถูกออกแบบมาสำหรับงานแนวนี้โดยตรง มีขนาดเล็กมาก ค้นหาเชิงความหมายได้ทั่วทั้งสภาพแวดล้อม local รองรับ Claude Code/Cursor ได้แบบ out-of-the-box และใช้ ollama จัดการ generation ได้เลย ไม่ต้องเสียเงินเลยสักบาทและไม่ต้องใช้ API เลย แน่นอนว่าการตั้งค่าต้องลงแรงนิดหน่อย แต่ก็หวังว่าจะมีใครทำให้มันใช้งานง่ายแบบโอเพนซอร์สอย่างสมบูรณ์ได้

    • รู้สึกว่านี่เป็นสรุปที่ใกล้เคียงรูปแบบสุดท้ายของ local AI stack จริง ๆ สำหรับผม เครื่องมืออย่าง Cursor หรือ aider มักขาด memory layer ที่ทั้งทรงพลังและเป็นส่วนตัวเสมอ การจับคู่ระหว่าง private index ขนาดเล็กแบบ LEANN กับ local inference ผ่าน Ollama ดูทรงพลังมาก ผมชอบไอเดียการใช้ชุดแบบนี้กับงานเขียนโปรแกรม และถ้าประสบการณ์แบบ "คล้าย Cursor" ที่เป็นส่วนตัวจริงเกิดขึ้นได้ มันน่าจะเปลี่ยน AI Workflow ไปหมดเลย
  • ถ้าคุณกำลังหา API ฟรีอยู่ ใน Google Gemini คุณสามารถใช้ Gemini ได้ฟรี โดยเฉพาะ gemini-2.5-pro พร้อมเปิดฟังก์ชัน thinking ได้ด้วย ขีดจำกัดค่อนข้างสูง ผมกำลังใช้ทำ benchmark อยู่แต่ยังไม่ชนลิมิตเลย ส่วนโมเดล open weight อย่าง DeepSeek R1 และ GPT-OSS ก็มีผู้ให้บริการ inference หรือผู้ผลิตฮาร์ดแวร์หลายรายที่เปิดให้เข้าถึง API ฟรี

    • โควตาฟรีของ Gemini 2.5 pro คือวันละ 100 ครั้ง
      https://ai.google.dev/gemini-api/docs/rate-limits

    • เผื่อไว้ด้วยว่า ถ้าใช้กับงานที่ไม่อ่อนไหวก็อาจโอเค แต่ Google จะเอา interaction พวกนี้ไปใช้ฝึก(ยกเว้นถ้าเป็นแบบจ่ายเงิน)

  • ผมแปลกใจที่ในบทความมีข้อมูลใหม่มากกว่าที่คิด ปกติผมไม่ค่อยเจาะลึกตัวเลือกต่าง ๆ ขนาดนั้น แต่ครั้งนี้รู้สึกว่าคุ้มที่อ่านจนจบ รวมถึงคอมเมนต์ใน HN ก็มีข้อมูลเชิงปฏิบัติเยอะมาก ขอบคุณทุกคน

  • อยากแนะนำ OP ว่าควรลองศึกษา Continue.dev, ollama/lmstudio และวิธีรันโมเดลบนเครื่องดู บางโมเดลเก่งเรื่อง autocomplete มาก และโมเดลอย่าง gpt-oss ก็ทำได้ดีทั้งด้าน reasoning และการใช้เครื่องมือ สำหรับผม นี่คือ my goto copilot

    • ผมก็เหมือนกัน! ผมใช้ Continue บน VSCode อยู่ และโมเดลใหญ่ของ Qwen หรือ gpt-oss-120b ก็ทำงานในโหมด agentic ได้ค่อนข้างดี

    • ผมรู้สึกว่า Zed เหนือกว่า continue.dev ไปอีกขั้น เพราะในนั้นคุณเลือกใช้โมเดลที่ต้องการเองได้

  • ตามที่โพสต์บอก ปัญหาของ coding agent คือทุกคำขอต้องส่งข้อมูลของตัวเองบวกกับแทบทั้งโค้ดเบสไปด้วย ทำให้ต้นทุนสูง แต่ถ้าเป็น AI แชต ต้นทุนแทบมองข้ามได้เลย ผมใช้แต่ OpenRouter เท่านั้น เพราะเข้าถึงได้แทบทุกโมเดล เดิม Sonnet คือของโปรด แต่พอได้ลอง Gemini 2.5 Pro แล้วพบว่าดีกว่าเกือบตลอด(ข้อเสียคือช้า) ส่วนคำถามง่าย ๆ หรือเวลานึกไวยากรณ์ไม่ออก Gemini Flash เร็วมากจึงเหมาะสุด

  • บางคนอาจแปลกใจว่าทำไมถึงยอมแลกข้อมูลตัวเองเพื่อใช้ free tier แต่เอาเข้าจริงทรัพยากรที่ต้องใช้เพื่อรัน LLM ดี ๆ เองที่บ้านมันสูงมาก ผมเลยมองว่าปล่อยโค้ดตัวเองออกไปแล้วใช้ฟรีคุ้มกว่า ยังไงโค้ดนั้นก็มีแผนจะเป็นโอเพนซอร์สในที่สุดอยู่แล้ว

    • ถ้าที่ทำงานของผมโอเคกับการใช้โมเดลช่วยเขียนโค้ด สำหรับผมก็ไม่มีอะไรต้องกังวล
  • ผมเห็นด้วยมากกับคำกล่าวที่ว่า "เวลาใช้ AI ผ่านเว็บแชต(เช่นเว็บอินเทอร์เฟซของ ChatGPT หรือ Openrouter) มักได้ผลลัพธ์ที่ดีกว่า IDE หรือ agent framework แทบทุกครั้ง ในแง่การแก้ปัญหาและเสนอทางออก" ถึงแม้การคัดลอกโค้ดจาก IDE ไปวางในเว็บแชตจะดูไม่สะดวก แต่จากประสบการณ์ของผม ผลลัพธ์มันดีกว่า Github copilot หรือ cursor มาก

    • ผมมีประสบการณ์ตรงกันข้ามแบบสุด ๆ จะเป็น agentic หรือไม่ก็ตาม สิ่งสำคัญที่สุดคือ context การเข้าถึงทั้งโปรเจกต์แบบ agentic การต่อกับ GitHub โดยตรง การทำ fine-tune, RAG หรือการเข้าถึงคอนเท็กซ์ทั้งหมด ช่วยลด hallucination ได้มหาศาล ระหว่าง "ช่วยเขียน x ให้หน่อย" กับ "ช่วยเขียน x ให้โดยยึดสไตล์ของผม, dependency y และโค้ดรอบข้าง z" นั้นต่างกันมาก พูดตรง ๆ ผมไม่เข้าใจเหตุผลของการสนับสนุน AI coding แบบคัดลอกวางเลย และคิดว่านั่นคือเหตุผลที่วิธีแบบเอเจนต์กำลังได้รับความนิยมระเบิดอยู่ตอนนี้