GPT-5-Codex

(openai.com)

16 คะแนน โดย GN⁺ 2025-09-17 | 6 ความคิดเห็น | แชร์ทาง WhatsApp

GPT-5-Codex เป็นโมเดลที่ปรับแต่งมาสำหรับงานวิศวกรรมซอฟต์แวร์จริง รองรับตั้งแต่เซสชันโต้ตอบสั้น ๆ ไปจนถึง งานอิสระระยะยาว
โมเดลใหม่นี้เสริมความสามารถด้าน การรีวิวโค้ด ให้แข็งแกร่งขึ้น โดยสามารถสำรวจ dependency, รันเทสต์ และเปรียบเทียบระหว่างเจตนากับการนำไปใช้จริงเพื่อจับข้อบกพร่องสำคัญได้ตั้งแต่เนิ่น ๆ
ทำผลงานได้ดีในงานอย่าง การรีแฟกเตอร์โค้ดขนาดใหญ่ และปรับเวลาการทำงานแบบไดนามิกตามความต้องการของผู้ใช้
มีการปรับโฉม Codex CLI และส่วนขยาย IDE ให้เหมาะกับเวิร์กโฟลว์แบบเอเจนต์มากขึ้น เช่น การแนบภาพ การติดตามความคืบหน้างาน การค้นหาเว็บ และการเชื่อมต่อ MCP
การผสานกับ GitHub ทำให้สามารถรีวิว PR อัตโนมัติและเสนอการแก้ไขได้ ช่วยลดภาระการรีวิวของทีมและเพิ่ม ความน่าเชื่อถือในการปล่อยซอฟต์แวร์
ตอนนี้ Codex รวมอยู่ในแพ็กเกจ ChatGPT Plus, Pro, Business, Edu, Enterprise แล้ว

GPT-5-Codex

GPT-5-Codex เป็นโมเดลที่ออกแบบมาเฉพาะสำหรับ งานวิศวกรรมจริงที่ซับซ้อน (เช่น การบิลด์โปรเจกต์ การเพิ่มฟีเจอร์ การรีแฟกเตอร์ขนาดใหญ่ การดีบัก และการรีวิวโค้ด)
- ความสามารถในการทำตามคำสั่งใน AGENTS.md ดีขึ้น ทำให้ได้ผลลัพธ์ตามต้องการโดยไม่ต้องอธิบายยาว ๆ เรื่องสไตล์โค้ดหรือความสะอาดของโค้ด
ปรับ เวลาในการคิด แบบไดนามิกตามระดับความยากของงาน
- คำขอที่ง่ายจะตอบสนองได้รวดเร็ว ส่วนงานขนาดใหญ่สามารถทำงานได้อย่างอิสระนานหลายชั่วโมงพร้อมปรับปรุงผลลัพธ์ต่อเนื่อง
ปรับให้เหมาะกับการรีวิวโค้ด โดยเฉพาะ สามารถสำรวจ codebase วิเคราะห์ dependency และรันเทสต์เพื่อทำ การตรวจสอบที่แม่นยำ
- ในการตรวจสอบคอมมิตของโปรเจกต์โอเพนซอร์ส รีวิวของ GPT-5-Codex ถูกประเมินว่ามีความน่าเชื่อถือมากกว่า
ยังแข็งแกร่งในงานฝั่งฟรอนต์เอนด์ และบนคลาวด์สามารถใช้ อินพุตรูปภาพ เพื่อตรวจดูความคืบหน้าแบบภาพและแชร์ผลลัพธ์เป็นสกรีนช็อตได้
ขณะที่ GPT-5 เป็นโมเดลเอนกประสงค์ GPT-5-Codex ถูกออกแบบมาสำหรับ งานเขียนโค้ดแบบเอเจนต์ในสภาพแวดล้อม Codex โดยเฉพาะ

อัปเดต Codex

Codex CLI และส่วนขยาย IDE ถูกออกแบบใหม่โดยเน้นประสบการณ์การเขียนโค้ดแบบเอเจนต์
- ใน CLI สามารถ แนบภาพ จัดการ To-Do ความคืบหน้างาน และเชื่อมต่อระบบภายนอก ได้
- UI ของเทอร์มินัลได้รับการปรับปรุงให้ดูการเรียกใช้เครื่องมือและ diff ได้ง่ายขึ้น
- โหมดการอนุมัติถูกทำให้ง่ายขึ้น เพื่อให้ได้ทั้งความปลอดภัยและความสะดวก
ส่วนขยาย IDE ทำงานได้บน VS Code, Cursor เป็นต้น และให้ผลลัพธ์ได้เร็วขึ้นด้วยพรอมป์ต์ที่สั้นลง โดยอิงจากไฟล์และโค้ดที่เลือก
- สลับใช้งานระหว่างสภาพแวดล้อม local และ cloud ได้อย่างลื่นไหล พร้อมรองรับการติดตามงานที่กำลังทำและการตรวจทานงานที่เสร็จแล้ว
ในสภาพแวดล้อมคลาวด์ มีการเสริมความสามารถด้าน ความเร็วผ่านแคช (ลดเวลาได้ 90%), การตั้งค่าสภาพแวดล้อมอัตโนมัติ และการควบคุมการเข้าถึงอินเทอร์เน็ต
- สามารถใช้ภาพสำหรับสเปกงานออกแบบ UI หรือรายงานบั๊กได้ และ Codex สามารถเปิดเบราว์เซอร์ของตัวเองเพื่อตรวจผลลัพธ์และแนบสกรีนช็อตใน PR ได้
รองรับการผสานกับ GitHub สำหรับการรีวิว PR อัตโนมัติและการเสนอแก้ไข
- สามารถขอรีวิวเฉพาะเจาะจงด้วยคำสั่ง “@codex review”
- ภายใน OpenAI เอง Codex ใช้ตรวจ PR ล่วงหน้าในงานส่วนใหญ่ และช่วยพบปัญหาหลายร้อยรายการตั้งแต่ระยะแรก

ความปลอดภัยและความมั่นคง

Codex ทำงานใน สภาพแวดล้อม sandbox โดยค่าเริ่มต้น จึงมีการจำกัดการเข้าถึงเครือข่าย
- สามารถควบคุมการรันคำสั่งที่มีความเสี่ยงด้วยการอนุมัติ และอนุญาตได้เฉพาะ trusted domain
นักพัฒนาสามารถปรับระดับความปลอดภัยให้เหมาะกับสภาพแวดล้อมได้ และ Codex จะให้ทั้งล็อกและผลการทดสอบในแต่ละงานเพื่อช่วยในการตรวจสอบ
แนะนำให้ใช้เป็น ผู้รีวิวเสริม ไม่ใช่ตัวแทนการรีวิวโดยมนุษย์ทั้งหมด
GPT-5-Codex ถูกจัดเป็นโมเดลที่มีความสามารถสูงในโดเมนชีววิทยาและเคมี จึงมี กลไกความปลอดภัย กำกับอยู่

ราคาและการให้บริการ

Codex รวมอยู่ในแพ็กเกจ ChatGPT Plus, Pro, Business, Edu, Enterprise
- Plus/Edu/Business เหมาะกับการใช้งานสัปดาห์ละ 1–2 เซสชัน ส่วน Pro รองรับ งานพัฒนาเต็มเวลาตลอดสัปดาห์
แพ็กเกจ Business สามารถซื้อเครดิตเพิ่มได้ ส่วน Enterprise ใช้ระบบเครดิตแบบพูลร่วมกัน
สำหรับผู้ใช้ Codex CLI API key ก็จะมี GPT-5-Codex ให้ใช้งานในเร็ว ๆ นี้
Codex กำลังพัฒนาไปเป็นพาร์ตเนอร์การเขียนโค้ดที่เร็วและเชื่อถือได้มากขึ้น และจะกลายเป็นเครื่องมือที่ช่วยให้ทีมทำ โปรเจกต์ที่มีความทะเยอทะยาน ได้สำเร็จ

6 ความคิดเห็น

aeolian21 2025-09-18

ความสามารถในการแก้ปัญหาสำหรับประเด็นที่ต้องพิจารณาหลายบริบทค่อนข้างด้อยลง และโดยรวมมักใช้โค้ด design pattern ที่ไม่จำเป็นเป็นจำนวนมาก ให้ความรู้สึกอย่างชัดเจนว่าการฝึกถูกป้อนด้วยโค้ดตัวอย่างเพื่อการสอนมากกว่าโค้ดใช้งานจริง
โดยสรุปแล้วมีความต่างด้านประสิทธิภาพจาก Gemini ค่อนข้างมาก

bluekai17 2025-09-18

ถ้าเทียบกับ Claude Code ตอนนี้ Claude Code ยังน่าใช้งานกว่านิดหน่อยไหม

kuthia 2025-09-18

ท้ายที่สุดแล้ว ประสบการณ์ผู้ใช้ที่ดีคือ AI tool ที่ดีควรคำนึงถึงระดับพื้นฐานความรู้(?)ของผู้ใช้ไปพร้อมกับรับประกันคุณภาพของผลลัพธ์ให้อยู่ในระดับหนึ่งด้วยหรือไม่?
ก็น่าสนใจนะที่ผู้ใช้ทุกระดับต่างคาดหวังสิ่งที่ดีกว่าจาก AI tool อย่างสม่ำเสมอ

slowandsnow 2025-09-17

Claude ใช้งานไม่สะดวกเกินไป เลยคิดว่าอาจจะลองย้ายไปใช้ตัวนี้ดูครับ

shakespeares 2025-09-18

มีจุดไหนที่คุณรู้สึกว่าไม่สะดวกบ้าง?

GN⁺ 2025-09-17

ความเห็นจาก Hacker News

ยืนยันได้ว่าขนาดพรอมป์ต์ของโมเดลใหม่ลดลงเกือบครึ่งเมื่อเทียบกับก่อนหน้า (10KB vs 23KB) (แหล่งอ้างอิงที่เกี่ยวข้อง: ตัวอย่างพรอมป์ต์ก่อนหน้า, ตัวอย่างพรอมป์ต์ที่เก่ากว่า)
ประสิทธิภาพตามเกณฑ์ SWE-bench ใกล้เคียงกับ gpt-5 เดิม แต่ดูเหมือนว่า gpt-5-codex จะถูกเสริมความสามารถหลักในด้านการรีแฟกเตอร์โค้ด (ตามเบนช์มาร์กภายใน 33.9% -> 51.3%)
ไม่นานมานี้ฉันลองทำรีแฟกเตอร์ขนาดใหญ่ โดยแยกไลบรารีภายในหลายตัวออกเป็นแพ็กเกจด้วย Codex CLI(gpt-5-high) แต่โมเดลมักเกิดบั๊กระหว่างขั้นตอนลบไฟล์แล้วเขียนใหม่บ่อยมาก (เช่น มีกรณีที่ไฟล์สำคัญหายไป)
โดยส่วนตัวฉันชอบวิธีคัดลอกไฟล์ไปก่อน แล้วค่อยแก้ตามแพ็กเกจมากกว่า และในการปรับปรุงรอบนี้ก็ดูเหมือนว่าจะมีการใช้ tool calling ที่ดีกว่าเดิม
นอกจากนี้ยังอ้างว่าโมเดลใหม่นั้น "Steerable" มากขึ้น (ควบคุมได้ชัดเจนขึ้น) แต่จากประสบการณ์ของฉัน Codex CLI(gpt-5) ก็ควบคุมได้ง่ายกว่า Claude Code มากอยู่แล้ว ดังนั้นการปรับปรุงเพิ่มก็ถือว่าน่ายินดีมาก
- เห็นด้วยว่าคะแนน SWE-bench ของ gpt-5 และ gpt-5-codex ใกล้เคียงกัน แต่การประเมินแบบ SWE-bench เองก็เป็นการทดสอบที่มีขอบเขตจำกัดมาก
  ถึงจะได้คะแนนเท่ากัน ประสบการณ์ใช้งานจริงก็อาจต่างกันมาก
  มีการแชร์เธรดบน X (ชื่อเดิม Twitter) ที่อธิบายรายละเอียดของสิ่งที่ SWE-bench วัดไม่ได้ไว้ด้วย: ลิงก์
- ความที่มัน "steerable มากขึ้น" อาจกลายเป็นข้อเสียได้เหมือนกัน
  เพราะมันอาจทำตามพรอมป์ต์แบบตรงตัวเกินไป
  สุดท้ายเลยต้องเข้าใจการเขียนพรอมป์ต์ที่ดีขึ้นและวิธีใช้โมเดลให้มากขึ้น
  เหมาะกับวิศวกรซอฟต์แวร์ระดับสูง แต่สำหรับนักพัฒนาสาย vibe-coder ที่เขียนแบบอาศัยเซนส์ อาจยากขึ้น
- จู่ๆ ก็มีความเห็นจำนวนมากว่า Codex CLI w/gpt-5-codex ดีกว่า Claude Code แล้ว ซึ่งเชื่อได้ยากเหมือนกัน
- สงสัยว่าบางส่วนของพรอมป์ต์อาจถูกย้ายไปอยู่ในเลเยอร์ที่สูงขึ้น หรือถูก bake เข้าไปด้วยวิธีอื่นหรือเปล่า
- เวลาย้ายโค้ดไประดับแพ็กเกจระหว่างรีแฟกเตอร์ แนะนำให้ย้ายไฟล์ด้วยตัวเองโดยตรง
  จากนั้นค่อยสั่ง Codex ว่า "ก่อนหน้านี้ไฟล์อยู่คนละตำแหน่ง ช่วยแก้ให้มันทำงานถูกต้องด้วย"
  ดูเหมือนว่า Codex กับ CLI อื่นๆ ยังจัดการแนวคิดเรื่องการย้ายไฟล์ได้ไม่ค่อยดี
  โดยเฉพาะการลบ/ย้ายไฟล์ แทบไม่เคยถูกติดตามได้ถูกต้องเวลาสร้าง git commit
ฉันเป็นแฟนพันธุ์แท้ของชุด claude-4-sonnet + Cursor มานาน แต่ในช่วง 2 เดือนหลังปริมาณการใช้งานพุ่งสูงมาก
สมัคร Cursor แบบพื้นฐานแล้วอัปเกรดเป็น Pro แต่ก็ยังชนเพดาน สุดท้ายเลยต้องใช้ Claude API key โดยตรงและจ่ายราว 70 ดอลลาร์ต่อสัปดาห์ (รู้สึกว่าไปต่อแบบนี้ไม่ได้)
จากนั้นพอ grok-code-fast-1 ออกมา ฉันก็เอามาต่อกับ Cursor ใช้ทุกวัน มันเร็ว ถูก (จนถึงตอนนี้ฟรี) และน่าพอใจมาก
ช่วงหลังยังได้ลอง GPT-5 ผ่าน Codex VSCode extension อย่างเป็นทางการด้วย ซึ่งยอดเยี่ยมแบบน่าตกใจจริงๆ
gpt-5-medium ช่วยรีแฟกเตอร์แอป React Native ครั้งใหญ่ ปรับทั้งโครงสร้างแอปและประสิทธิภาพเสร็จในคืนเดียว (ถ้าทำเองอย่างน้อยคงใช้ 2 วัน)
ตอนนี้กำลังให้ gpt-5-medium-codex รื้อโครงสร้างระบบ routing ของแอปใหม่ทั้งหมดอยู่ ซึ่งมีการเรียก tool จำนวนมาก และเข้าใจคำสั่งกับลงมือทำอย่างเป็นระบบมาก
ต่อจากนี้สแตกที่ฉันจะใช้คือ Cursor + grok-code-fast-1 (สำหรับงานประจำวัน) และใช้ Codex/GPT เมื่อต้องการ
เพิ่มเติมคือ ฉันใช้งาน gpt-5-medium หนักมากตลอดวัน แต่ด้วยบัญชี ChatGPT Plus ก็ยังไม่เคยชนลิมิตเลย เลยต้องขอบคุณทีม OpenAI
- อยากรู้ workflow ที่ใช้ลองรีแฟกเตอร์ด้วย gpt-5-medium
  ฉันยังไม่มีกรณีทดสอบที่ลองเองได้ เลยอยากรู้ว่าคุณป้อนพรอมป์ต์ให้โมเดลแบบไหน มันเสนออะไรกลับมา และความรู้ของฉันในฐานะนักพัฒนาช่วยได้มากแค่ไหน
  อยากรู้ว่าประสบการณ์ที่คนทั่วไปน่าจะเข้าถึงได้แบบนี้ เป็นระดับที่ SWE ทั่วไปหรือโปรแกรมเมอร์ทั่วไปก็ทำได้ไหม
- ใช้ Cursor มา 1 ปี เพิ่งเคยชนลิมิตการใช้งานครั้งแรก
  เคยชนลิมิตทั้ง Claude, GPT และ Grok มาแล้ว
  ตอนนี้เลยเลือกจ่ายเพิ่มภายในแพ็กเกจ Cursor Pro (25 ดอลลาร์ต่อเดือน คือ 20+5 ดอลลาร์) เพื่อใช้ Claude ต่อ เพราะมันเร็วกว่าของ Grok
- ฉันเองก็ตัดสินใจคล้ายๆ กัน
  grok-code-fast-1 ใช้งานได้ดีสำหรับงานเขียนโค้ดส่วนใหญ่
  ตอนนี้ใช้ผ่าน opencode และดูเหมือนจะมีโควตาฟรีให้ระดับหนึ่ง โดยฉันก็ยังไม่ได้เพิ่ม grok key แยกต่างหากแต่ก็ใช้งานได้
ประทับใจกับคุณภาพของ Codex CLI IDE มาก
ต่อให้เมื่อก่อนคิดว่ามันไม่ค่อยดี ถ้าลองใหม่ผ่านส่วนขยาย vscode ก็แนะนำเลย เพราะสำหรับสมาชิก Plus ปริมาณการใช้งานที่ให้มาถือว่าใจกว้างมาก
ฉันเลิกใช้แพ็กเกจ Claude code max แล้วเปลี่ยนมาเป็น ChatGPT pro แผน 200 ดอลลาร์
มันเร็วขึ้นมาก และจนถึงตอนนี้ก็ยังไม่เคยชนลิมิต
- ฉันใช้ aider ร่วมกับ gemini pro ในการพัฒนาโปรเจกต์
  ขอแชร์โปรเจกต์เครื่องมือที่ฉันทำไว้: aretecodex.tools
- ฉันใช้ Cursor แผน 20 ดอลลาร์ และชนลิมิตใน 15 วัน เลยต้องจ่ายเพิ่มสำหรับช่วงที่เหลือของเดือน
  อยากรู้ว่ามีวิธีรับมืออะไรที่แนะนำได้บ้าง
- สงสัยว่า CLI IDE หมายถึงอะไรกันแน่
- ตอนนี้มันใช้แบบสมัครสมาชิกเหมือน claude code ได้แล้ว หรือยังมีแค่ API อย่างเดียว สับสนอยู่
น่าสนใจที่ในเธรดนี้มีผู้ใช้จำนวนมากย้ายไปใช้ Codex หรือเลิกใช้ Claude Code
ปัญหาใหญ่สุดของ Claude Code คือ ถ้าสั่งงานเยอะเกินไป มันมักจะสร้าง mock implementation หรือโค้ดปลอมขึ้นมา ซึ่งในทางปฏิบัติกลับทำให้ปัญหาแย่ลง
ต่อให้พยายามปรับอินพุตพรอมป์ต์ก็แก้ได้ยาก สุดท้ายฉันเลยเปลี่ยนไปใช้ Codex
แม้ Codex จะได้เปรียบจากการทำงานบนโค้ดเบสที่เซ็ตพร้อมอยู่แล้ว แต่ในแง่ประสบการณ์ใช้งานจริง Codex ก็ดีกว่ามาก
- ตอนใช้ Claude วิธีที่ได้ผลที่สุดคือ 1) สร้างแผนใน plan-mode ก่อน และ 2) ค่อยสั่งให้มันลงมือทำตามแผน
  ระบบอื่นๆ ไม่มีโหมด "วางแผน" แยกต่างหาก เลยพยายามจะลงมือทำตั้งแต่ต้น ทำให้ต้องจูนพรอมป์ต์อย่างระมัดระวัง
  Claude รองรับโครงสร้างแบบ "วางแผน > ลงมือทำ" แยกชัดเจน ดังนั้นวิธีเข้าหาจึงต่างกัน
จากที่สังเกตมาในช่วง 2 สัปดาห์ล่าสุด Claude Code ทั้งประสิทธิภาพก็ตกลงมาก และโควตาการใช้งานก็ลดลงอย่างเห็นได้ชัด ในขณะที่ OpenAI Codex กลับเหมือนจะทั้งแรงขึ้นและให้โควตามากกว่ามาก
ถ้าใครไม่ได้ใช้ Codex CLI มานานกว่าหนึ่งเดือน แนะนำให้ลองทดสอบอีกครั้ง
- ในมุมของผู้ใช้ปลายทาง ฉันมองว่าสิ่งสำคัญที่สุดคือ "พร้อมย้ายออกได้ตลอดเวลา"
  ควรเปรียบเทียบบริการอยู่เสมอและเลือกตัวที่คุ้มค่าด้านราคา/ประสิทธิภาพที่สุด
  ตลอดปีที่ผ่านมา หลายบริษัทแข่งขันกันด้วยข้อดีข้อเสียที่ต่างกัน แต่ยังไม่มีบริการไหนปฏิวัติวงการอย่างชัดเจน
  ไม่มีเหตุผลให้ต้องยึดติดกับบริการใดบริการหนึ่ง มีแต่ผู้ให้บริการ SaaS ที่พยายามรั้งผู้ใช้ไว้
- สงสัยว่า Codex CLI ยังติดนิสัยทำงานแบบ "YOLO(ลองทำทุกอย่างไปก่อน)" ทันทีที่เจอว่าโปรเจกต์มี git อยู่หรือเปล่า
  สิ่งที่อยากได้จากเครื่องมือช่วยเขียนโค้ดแบบจำเป็นคือ

มี allowlist สำหรับอนุญาตการรันคำสั่ง
คำสั่งอันตรายอย่าง rm ต้องขออนุมัติทุกครั้ง
รองรับ custom slash command
จะไม่มี build hook หรือความสามารถแบบ sub-agent ก็ไม่เป็นไรนัก

มีเรื่องที่สงสัย คือใน Codex CLI จะใช้โหมดที่เทียบได้กับ "normal mode" ของ Claude ได้อย่างไร
Codex เหมือนจะรองรับแค่ vibe coding หรือไม่ก็ plan mode เท่านั้น และไม่มีโหมด interactive ตรงกลางที่ถามว่า "จะให้ทำงานนี้ (a/b) ไหม" เลยทำให้หงุดหงิด
จึงไม่ค่อยเข้าใจว่าทำไมถึงมีให้เลือกแค่ว่าจะคัดลอกโค้ดที่แก้ไขแล้วไปวางเอง หรือจะรับการแก้อัตโนมัติเท่านั้น
- ปกติฉันจะใส่ในพรอมป์ต์ชัดๆ ว่า "ให้วางแผนก่อน และห้ามเขียนโค้ดจนกว่าฉันจะอนุมัติ"
  หลังจากนั้นก็วนทบทวนแผนหลายรอบก่อนสั่งให้ลงมือทำ
  บางครั้ง LLM ก็ "ลืม" แผนไป เลยคัดลอกแผนออกมาเก็บแยกไว้
  ฉันยังให้มันส่งงานมาเป็นขั้นๆ หรือให้ตรวจสอบตามแต่ละ milestone เช่น build/unit test ไปพร้อมกันด้วย
รู้สึกว่าน่าประทับใจมาก
ฉันกำลังทดลองสร้างเว็บแอป "shared presence" animation (พื้นหลังเปลี่ยนตามตำแหน่งเคอร์เซอร์ของผู้ใช้ทุกคน) โดยลองใช้ทั้ง Claude และ Codex
จนถึงเมื่อวาน ทั้งสองโมเดลยังทำได้ลำบาก โดย Claude ดูจะนำอยู่นิดหน่อย
ในงานที่ต้อง "สร้างสรรค์" อะไรบางอย่าง ทั้งคู่ยังให้ผลลัพธ์ที่ค่อนข้างสำเร็จรูปและธรรมดา และการทำ simulation ก็ยาก
แต่พอวันนี้ลองงานเดียวกันกับ Codex ส่วนงานดีไซน์ยังจืดอยู่เหมือนเดิม ทว่าด้าน simulation ทำได้ดีกว่ามาก
- UI ที่ LLM สร้างมักออกมาธรรมดาและสำเร็จรูปเสมอ ถ้าไม่มีพรอมป์ต์ที่ละเอียดพอเป็นพิเศษ (เช่น ดีไซน์/โทนสี/แนวทางดีไซน์ที่ชอบ)
  ถ้าเพิ่มรายละเอียดของ UI หรือสั่งว่า "ให้ยึดดีไซน์ของแอปเดิมเป็นแนวทางแล้วทำให้เข้ากัน" ผลลัพธ์จะดีขึ้นมาก
อยากกลับมาลอง AI coding อีกครั้ง เลยสมัคร ChatGPT แล้วลองใช้ Codex แต่รู้สึกว่ามันช้ามาก
ทั้งที่เป็นงานง่ายในรีโพแทบว่างเปล่า โมเดลกลับใช้เวลา "คิด" นานถึง 20 นาที
ประสบการณ์ที่วิศวกรต้องนั่งรอเฉยๆ แบบนี้ทำให้สงสัยเรื่องประสิทธิผลจริง
ถ้าเป็น asynchronous agent ก็คงรันหลายตัวขนานกันได้ แต่ก็คงต้องมีโค้ดเบสที่มีโครงสร้างแล้ว และตอนนี้ฉันใช้เวลาไปหลายชั่วโมงแต่ยังสร้าง skeleton ไม่ได้เลย
อ่านเอกสารและดูวิดีโอหมดแล้ว แต่ระดับนี้รู้สึกว่าลงมือทำเองยังเร็วกว่าเยอะ
เลยสงสัยว่าฉันทำอะไรผิดไปหรือเปล่า หรือแค่เซิร์ฟเวอร์โอเวอร์โหลด หรือจริงๆ แล้วระดับของ AI ตอนนี้ก็เป็นแบบนี้เอง
- วิศวกรหลายคนที่ฉันเห็นมักพยายามรันแบบขนาน
  พอเริ่มคุ้นกับการให้เอเจนต์หลายตัวทำงานพร้อมกันแล้ว มันก็ค่อนข้างใช้ได้ทีเดียว
  ฉันเคยอ่านบทความที่เกี่ยวข้องมาก่อน แต่ตอนนี้หาไม่เจอแล้ว
สุดสัปดาห์ที่ผ่านมาได้ลอง Codex เป็นครั้งแรก แต่ผลลัพธ์ค่อนข้างแปลก
ฉันขอเพียงตัวอย่างง่ายๆ (รันแอป Rails ด้วย Docker Compose และเพิ่มหน้าแรก/Devise) แต่แทนที่จะสร้างไฟล์จริง มันกลับ hardcode เนื้อหาไฟล์ทั้งหมดไว้ใน bootstrap.sh
ต่อจากนี้คงต้องดูกันต่อว่ามันจะทำงานต่างไปในแบบอื่นหรือไม่
เดือนที่แล้วฉันซื้อ chatgpt มาใช้ และรู้สึกว่า OpenAI กำลังปรับปรุงประสบการณ์ผู้ใช้ได้ดีมากในช่วงนี้
ตัวอย่างเช่น โหมด voice ดีกว่า Claude มาก และชื่อโมเดลก็เมื่อก่อนเคยสับสน แต่ตอนนี้เรียบง่ายขึ้นจึงใช้งานง่าย
แม้ในฐานะผู้ช่วยทั่วไปก็ยังทำได้ดีกว่า Claude และ OpenAI ก็ยังออกเครื่องมือใหม่ๆ อย่างต่อเนื่อง ทำให้ดูเหนือกว่าในแง่ความน่าเชื่อถือ

GPT-5-Codex

GPT-5-Codex

อัปเดต Codex

ความปลอดภัยและความมั่นคง

ราคาและการให้บริการ

บทความที่เกี่ยวข้อง

6 ความคิดเห็น

ความเห็นจาก Hacker News