32 คะแนน โดย GN⁺ 2025-05-01 | 5 ความคิดเห็น | แชร์ทาง WhatsApp
  • gpt-4.1 เป็นผู้ช่วยที่รอบคอบและเชื่อถือได้ โดย เด่นด้านการเข้าใจโค้ดอย่างแม่นยำและแนวทางแบบอนุรักษ์นิยม
  • gemini 2.5 pro ยอดเยี่ยมในการจัดการคอนเท็กซ์ขนาดใหญ่และการวิเคราะห์ภาพ แต่ก็มี ความเสี่ยงที่จะทำการแก้ไขเกินจำเป็น
  • sonnet 3.5/3.7 สร้างสรรค์และฉลาด แต่ขาดการรักษาบริบทและความสม่ำเสมอ จึงแกว่งในบทสนทนายาว
  • grok-3-beta แม้จะช้า แต่แสดง ศักยภาพโดดเด่นในการทำภาพจำลองด้านดีไซน์และการแก้ปัญหาที่ซับซ้อน
  • ผู้ใช้มัก แยกใช้โมเดลตามเวิร์กโฟลว์ของงาน และเมื่อดีบักไม่สำเร็จ ก็จะนิยมใช้ กลยุทธ์กู้คืน checkpoint และสลับโมเดล

gpt-4.1

  • ทำงานเหมือน ผู้ช่วยอัจฉริยะที่น่าเชื่อถือ
  • ไม่ด่วนสรุป ทำตามคำขอ แต่ไม่แก้ไขเกินความจำเป็น
  • เป็นโมเดลที่ให้ความรู้สึกเหมือน ส่วนต่อขยายของนักพัฒนา จึงเหมาะอย่างยิ่งกับนักพัฒนาที่มีประสบการณ์

gemini 2.5 pro

  • ทรงพลังเมื่อใช้กับ บริบทขนาดใหญ่ เช่น console log ยาว ๆ หรือไฟล์โค้ดทั้งไฟล์
  • ความสามารถในการวิเคราะห์ภาพยอดเยี่ยม สามารถจับข้อผิดพลาดเชิงภาพได้
  • ข้อเสียคืออาจ ทำงานอย่างอัตโนมัติมากเกินไป จนทำให้ลบโค้ดโดยไม่จำเป็นหรือแก้ไขมากเกินไป
  • จึงต้องมี การควบคุมอย่างระมัดระวัง

sonnet 3.5 / 3.7

  • 3.7 มีความสร้างสรรค์และฉลาด แต่ในการสนทนายาว ๆ บางครั้งอาจหลุดบริบทหรือไม่ทำตามคำสั่ง
  • 3.5 เด่นด้านการเข้าใจและแก้ไขโค้ดแบบอิงไฟล์เดียว
  • การผสานรวมกับ Cursor ยังมีปัญหาในช่วงเปลี่ยนผ่าน ทำให้ ยังไม่สามารถแสดงประสิทธิภาพที่สม่ำเสมอได้

ความเห็นและกลยุทธ์อื่น ๆ

  • grok-3-beta แม้จะช้า แต่มีประโยชน์ในการแก้ปัญหาที่โมเดลอื่นทำไม่สำเร็จ
  • ผู้ใช้คนหนึ่งกำลังใช้ กลยุทธ์แบ่งงานตามโมเดล ดังนี้:
    • o3/4-mini: จัดระเบียบแผนและเรียบเรียงเหตุผลในรูปแบบ Markdown
    • gemini 2.5 pro: วิเคราะห์ปัญหาโดยอิงทั้งไฟล์ และใช้สำหรับการเรียกฟังก์ชัน
    • sonnet 3.5: ใช้แก้ไขไฟล์เดี่ยวแบบอิง cmd+k

5 ความคิดเห็น

 
bungker 2025-05-02

พูดได้อย่างมั่นใจว่า Gemini 2.5 Pro นั้นแข็งแกร่งที่สุดเมื่อพูดถึง Go เพียงอย่างเดียว

 
daddy 2025-05-02

ผมแนะนำ Gemini สำหรับการถามตอบ เพราะมันเร็วที่สุด

 
jk34011 2025-05-02

ปกติผมใช้ Sonnet เป็นหลักอยู่แล้ว
รู้สึกเห็นด้วยกับหลายอย่างที่อยู่ในบทความมากครับ
คงต้องลองใช้ 4.1 ดูบ้างแล้ว

 
gnoopy 2025-05-01

ความรู้สึกของผมก็คล้าย ๆ กันครับ sonnet ยิ่งใช้ยิ่งรู้สึกไม่มั่นคง ส่วน chatgpt 4.1 ต่อให้สั่งงานไปแล้วก็ยังพอรู้สึกอุ่นใจได้อยู่บ้าง

ส่วนความเห็นเกี่ยวกับ Grok ก็เห็นด้วยเหมือนกัน แต่ผมมักจะใช้ตอนค่อย ๆ ตรวจสอบอย่างใจเย็นในแชตมากกว่าใช้ใน IDE

 
GN⁺ 2025-05-01

ปฏิกิริยาจากชุมชน Reddit

วิธีใช้งานโมเดล

  • o3/4-mini: ใช้สำหรับการวางแผนและการจัดระเบียบด้วย Markdown โดยมี reasoning ที่ดีกว่าและเหมาะกับการสนทนามากกว่า (Masony817, scragz, Princekid1878)
  • gemini 2.5 pro:
    • มีประโยชน์สำหรับ agent mode หรือการเรียกใช้ฟังก์ชันที่อิงบริบทยาว (Masony817, computerlegs)
    • ทรงพลังในการมองภาพรวมของโค้ดทั้งโปรเจ็กต์และใช้ตัดสินใจในโปรเจ็กต์ที่ซับซ้อน (WorryBubbly3438)
    • เหมาะสำหรับงานค้นหา cross-check และงาน preprocessing (computerlegs)
  • sonnet 3.5: เด่นด้านการเข้าใจและแก้ไขไฟล์เดียว เหมาะกับการใช้คีย์ลัด cmd+k (Masony817)
  • sonnet 3.7:
    • มีความสร้างสรรค์มากกว่าและเก่งกว่า 3.5 แต่มีปัญหาเสียโฟกัสในบทสนทนายาว ๆ (Sea_Cardiologist_212)
    • โดดเด่นด้านการสะท้อนข้อมูล cutoff ล่าสุดและความสามารถในการคิดวิเคราะห์ (yairEO)
    • ถ้าจัดการ context window ได้ดี ก็ใช้งานได้เสถียร (computerlegs)
  • Claude 3.7: ในสภาพแวดล้อม Cursor ทำงานได้เสถียรและสม่ำเสมอ (cmndr_spanky)
  • gpt-4.1:
    • เหมาะกับงานง่าย ๆ ที่ทำซ้ำหรือ งานที่มีโครงสร้างชัดเจน (Princekid1878, ILikeBubblyWater)
    • มีแนวโน้มจะแก้ไขมากเกินไปโดยไม่อธิบาย (ILikeBubblyWater)
  • Deepseek R1: ในบางปัญหากลับทำงานได้ดีกว่าโมเดลอื่นอย่างน่าประหลาดใจ (Leather_Science_7911)

กลยุทธ์การใช้งานและเวิร์กโฟลว์

  • แบ่งบทบาทให้แต่ละโมเดล แล้วสลับใช้ตามสถานการณ์ (มีหลายความเห็นตรงกัน)
  • cmd+k: ใช้ sonnet 3.5 จัดการไฟล์เดียว (Masony817)
  • agent mode: หลังตั้งค่าเริ่มต้นแล้วจะไม่ค่อยใช้ แต่หันไปใช้ ฟีเจอร์ checkpoint และพรอมป์ที่ชัดเจน แทน (WorryBubbly3438)
  • นิยม Auto mode: ทำงานได้เร็วและต้นทุนต่ำ (Funny-Anything-791, d0RSI)
  • แนวทางแบบเครื่องจักร: การสั่งงานอย่างชัดเจนและแม่นยำสำคัญ เหมือนเครื่อง CNC (Funny-Anything-791)
  • โมเดลที่เชี่ยวชาญการทดสอบ UI และดีไซน์ยังไม่ดีพอ (Princekid1878)

ความเห็นอื่น ๆ

  • มีคำบ่นว่า Sonnet 3.7 มีสมาธิและการรักษาบริบทแย่ลงกว่าเดิม (Sea_Cardiologist_212)
  • Gemini หรือ Claude อาจดูดีในวิดีโอทดสอบ แต่ในสภาพแวดล้อมจริงต่างออกไป (cmndr_spanky)
  • สำหรับโมเดลส่วนใหญ่ พรอมป์ที่ชัดเจนคือหัวใจสำคัญ (เป็นประเด็นที่พูดตรงกัน)
  • ผู้ใช้บางส่วนคาดหวังการผสานรวมกับ crypto หรือ Web (มีการกล่าวถึงทางอ้อม)