Opus 4.5 แตกต่างจาก AI เอเจนต์ที่เคยเจอมาก่อนอย่างสิ้นเชิง
(burkeholland.github.io)- Claude Opus 4.5 แสดงให้เห็นถึง ความสามารถในการพัฒนาแบบอัตโนมัติ ในระดับที่สามารถสร้างแอปพลิเคชันคุณภาพสูงได้โดยแทบไม่ต้องให้ผู้พัฒนาเข้ามาแทรกแซง ซึ่งแตกต่างจาก AI เอเจนต์สำหรับเขียนโค้ดแบบเดิม
- สามารถสร้างโปรเจกต์ที่ใช้งานได้จริงเสร็จในเวลาสั้น ๆ ตั้งแต่ ยูทิลิตีแปลงภาพบน Windows แบบง่าย ๆ ไปจนถึง เครื่องมือบันทึกและตัดต่อวิดีโอ, แอปโพสต์อัตโนมัติด้วย AI และ แอปติดตามคำสั่งซื้อและคำนวณเส้นทาง
- Opus 4.5 จัดการงานพัฒนาที่ซับซ้อนได้ด้วยตัวเอง เช่น การตั้งค่าแบ็กเอนด์ Firebase, การวิเคราะห์ error log และแก้ไขอัตโนมัติ, และ การตั้งค่าดีพลอยด้วย GitHub Actions
- ผู้เขียนระบุว่าตนเองไม่ได้เข้าใจโครงสร้างโค้ดทั้งหมด แต่ก็ยืนยันว่า Opus 4.5 สามารถ แก้บั๊กได้เองและเสนอแนวทางรีแฟกเตอร์ ได้
- ประสบการณ์นี้สะท้อนว่าโอกาสที่ AI จะเข้ามาแทนที่นักพัฒนาเริ่มกลายเป็นความจริง และเป็น จุดเปลี่ยนของยุคการพัฒนาที่มี AI เป็นศูนย์กลาง
การมาของ Opus 4.5 และความแตกต่างจาก AI เอเจนต์เดิม
- AI เอเจนต์รุ่นก่อนมักมีปัญหาเรื่อง การสร้างโค้ดที่ไม่มีประสิทธิภาพและการแก้ข้อผิดพลาดซ้ำ ๆ ทำให้ประสิทธิภาพการทำงานต่ำ
- หลายครั้งต้องคัดลอกและวางหลายรอบพร้อมแก้ error ไปมา จนสุดท้าย codebase เสียหาย
- Opus 4.5 แก้ปัญหาเหล่านี้ได้ โดย เขียนโค้ดส่วนใหญ่ได้ถูกต้องตั้งแต่แรก และเมื่อมีข้อผิดพลาดก็จะ บิลด์และแก้ไขเองผ่าน CLI แบบวนซ้ำ
- ผู้เขียนประเมินว่านี่คือ “โมเดลที่ทำให้คำสัญญาของ AI สำหรับการเขียนโค้ดเกิดขึ้นจริง”
โปรเจกต์ 1 – ยูทิลิตีแปลงภาพบน Windows
- Opus 4.5 สร้างยูทิลิตีที่มีฟังก์ชัน แปลงฟอร์แมตภาพจากเมนูคลิกขวาใน Windows Explorer ได้เสร็จจากการสั่งเพียงครั้งเดียว
- ใช้ dotnet CLI เพื่อทำบิลด์และแก้ข้อผิดพลาดโดยอัตโนมัติ
- มีเพียง error ของ XAML เท่านั้นที่ต้องเปิดดูใน Visual Studio แล้วคัดลอกส่งให้
- ยังตั้งค่าให้ครบทั้ง เว็บไซต์สำหรับดีพลอย, สคริปต์ติดตั้ง PowerShell และ pipeline ดีพลอยอัตโนมัติด้วย GitHub Actions
- การทำโลโก้ใช้ Figma AI ส่วน Opus เขียน สคริปต์แปลง SVG และฟอร์แมตไอคอน ให้
โปรเจกต์ 2 – เครื่องมือบันทึกหน้าจอและตัดต่อ
- เริ่มจาก ยูทิลิตีบันทึก GIF ที่คล้าย LICEcap แล้วต่อยอดไปถึงความสามารถด้านตัดต่อวิดีโอและรูปภาพ
- สร้าง ฟีเจอร์เพิ่มรูปทรง, ครอบตัด, เบลอ และฟังก์ชันตัดต่ออื่น ๆ ได้ภายในไม่กี่ชั่วโมง
- ซอร์สโค้ดถูกเปิดเผยไว้บน GitHub และผู้เขียนบอกว่า “พัฒนาไปได้ไกลมากภายในไม่กี่ชั่วโมง”
- สิ่งนี้ยืนยันว่า Opus 4.5 สามารถทำได้ไม่ใช่แค่ UI แต่รวมถึง งานเชื่อมต่อแบ็กเอนด์ ด้วย
โปรเจกต์ 3 – แอปโพสต์อัตโนมัติด้วย AI
- พัฒนา แอปมือถือที่ใช้ AI โพสต์ลง Facebook Page อัตโนมัติ ด้วย Opus 4.5
- หลังอัปโหลดรูป AI จะทำ การสร้างแคปชันและตั้งเวลาโพสต์ ให้
- Opus ตั้งค่า แบ็กเอนด์ Firebase, การยืนยันตัวตน, storage และ cloud functions ผ่าน CLI ด้วยตัวเอง
- ผู้เขียนเล่าว่าระหว่างที่ตนไปติดตั้งมู่ลี่ Opus ก็สร้างแอปเสร็จแล้ว
- Opus ยังสามารถ วิเคราะห์ error log แล้วแก้เองอัตโนมัติ และสร้าง แดชบอร์ดสำหรับการจัดการ ให้ได้ด้วย
- งานที่เดิมต้องใช้เวลาหลายเดือน กลับ เสร็จได้ภายในไม่กี่ชั่วโมง
โปรเจกต์ 4 – แอปติดตามคำสั่งซื้อและคำนวณเส้นทาง
- แยกวิเคราะห์อีเมลคำสั่งซื้อจาก Gmail เพื่อคำนวณ ตารางเวลา, เส้นทาง, เวลาขับรถ และบันทึกระยะทางสำหรับภาษี โดยอัตโนมัติ
- Opus 4.5 จัดการ การเชื่อม Google Authentication และการเชื่อมต่อ Firebase ได้ในครั้งเดียว
- ผู้เขียนประเมินว่า “งานที่ถ้าทำมือจะทรมานมาก Opus กลับทำได้อย่างสมบูรณ์แบบ”
ความเข้าใจโค้ดและประเด็นด้านคุณภาพ
- ผู้เขียนบอกว่าแม้ตนเอง ไม่รู้ Swift แอปก็ยัง ทำงานได้อย่างสมบูรณ์
- Opus 4.5 สามารถ หาบั๊กและแก้เองได้ ทำให้ผู้เขียนเดินหน้าพัฒนาได้โดยไม่จำเป็นต้องรู้โครงสร้างภายในทั้งหมดของโค้ด
- ต่อคำถามเรื่องคุณภาพโค้ด ผู้เขียนอธิบายว่า “ถ้าโค้ดนั้นเป็นโค้ดที่ AI จะอ่านและดูแลรักษาเอง ความสามารถในการอ่านของมนุษย์ก็ไม่สำคัญ”
- ใช้ พรอมป์ต์สำหรับเขียนโค้ดเฉพาะทางด้วย AI ภายใน VS Code เพื่อสร้างโค้ดที่เน้น โครงสร้างที่ LLM เข้าใจได้ง่าย
หลักการเขียนโค้ดที่มี AI เป็นศูนย์กลาง
- พรอมป์ต์ตั้งต้นอยู่บนสมมติฐานว่าเป็น “โค้ดที่ AI จะเขียนและดูแลรักษา”
- เน้น โครงสร้างเรียบง่าย, จุดเริ่มต้นชัดเจน, การทำ abstraction ให้น้อยที่สุด และ coupling ต่ำ
- ให้ความสำคัญกับ control flow ที่ชัดเจน, ฟังก์ชันที่เรียบง่าย, structured logging และความง่ายในการสร้างใหม่
- เมื่อต้องรีแฟกเตอร์โค้ด Opus จะจัดทำเอกสาร รายการสิ่งที่ควรปรับปรุงตามลำดับความสำคัญ (สูง·กลาง·ต่ำ)
- เมื่อตรวจสอบด้านความปลอดภัย จะมีการขอให้ตรวจ API key, การจัดการล็อกอิน และการจัดเก็บข้อมูลอ่อนไหว
- ผู้เขียนยอมรับว่าในแง่ความสมบูรณ์ด้านความปลอดภัย “ตอนนี้ยังมั่นใจแค่ประมาณ 80%”
การเปลี่ยนผ่านสู่ยุคพัฒนาด้วย AI
- ผู้เขียนบอกว่า “ความจริงที่ว่าสามารถสร้างสิ่งเหล่านี้ได้ในไม่กี่ชั่วโมง ทำให้รู้สึกทั้งตื่นเต้นและว่างเปล่าไปพร้อมกัน”
- ในอดีตเคยเชื่อว่า “AI ไม่สามารถแทนที่นักพัฒนาได้” แต่ตอนนี้ ไม่อาจปฏิเสธความเป็นไปได้นั้นได้อีกต่อไป
- บทสรุปคือ ในสภาพแวดล้อมการพัฒนาที่มี AI เป็นศูนย์กลาง อย่าลังเลและลงมือสร้างด้วยตัวเอง
- ท้ายที่สุดยังเตือนว่า “เรื่องการจัดการ API key ยังไงก็ต้องรับผิดชอบด้วยตัวเอง”
สรุป: Opus 4.5 ถูกประเมินว่าไม่ได้เป็นแค่ตัวช่วยเขียนโค้ด แต่เป็นโมเดลระดับ นักพัฒนา AI ที่สามารถออกแบบ พัฒนา และดีพลอยแอปพลิเคชันเต็มรูปแบบได้อย่างอัตโนมัติ ผู้เขียนระบุว่าประสบการณ์นี้ทำให้ตนได้สัมผัสโดยตรงถึง ความเป็นไปได้จริงที่ AI จะเข้ามาแทนที่นักพัฒนามนุษย์
3 ความคิดเห็น
พอลองให้ Opus 4.5 แก้โค้ดแค่บรรทัดเดียว กลับเห็นว่ามันลบโค้ดตั้งค่าที่อยู่เหนือขึ้นไปเองราว ๆ 10 บรรทัด พอถามว่าทำไมถึงลบ มันก็บอกว่าเหมือนเป็นโค้ดที่ไม่มีความหมายเลยลบออก..
ความคิดเห็นจาก Hacker News
งานที่วิศวกรระดับกลางรับผิดชอบไม่ใช่แค่การสร้างแอปใหม่ แต่คือการออกแบบโครงสร้างโดยคำนึงถึง ความสามารถในการขยายระบบและความเข้าใจได้ง่าย
Opus 4.5 จัดการคำขอระดับ “ช่วยสร้างแอปสักตัว” ได้ดี แต่พอให้เพิ่มฟีเจอร์ลงในโค้ดเดิมแบบงานจริง มักใช้ abstraction แปลก ๆ หรือไม่ก็ต้องแก้หลายรอบกว่าจะได้คุณภาพตามต้องการ
คนที่ไม่ใช่สายเทคนิคอาจคิดว่า “ใช้ได้ก็พอแล้ว” แต่วิศวกรรู้ว่านั่นยังไม่พอ
จำได้ว่าเมื่อก่อนในทีมเคยทะเลาะกันเรื่อง “คำตอบที่ถูก” แล้วสุดท้ายต้องมีคนนอกเข้ามาเตือนว่าอะไรสำคัญในมุมธุรกิจจริง ๆ
บางครั้งการทำแบบพอใช้ได้แต่เร็ว เพื่อพิสูจน์ว่าทิศทางถูกต้อง ก็อาจเป็นวิธีที่ ‘ถูกต้อง’ จริง ๆ
ปัญหาเกิดเมื่อออกแบบมากเกินไปตั้งแต่แรก หรือในทางกลับกันเมื่อผู้จัดการขัดขวางการรีแฟกเตอร์ สุดท้ายแล้วหัวใจคือ ความสมดุล
ถ้าระบุชัด ๆ ให้มันอ่านโค้ดใกล้เคียงก่อน มันจะทำงานดีขึ้นมาก แค่เพิ่มคำสั่งอีกประโยคสองประโยคก็พอ
แต่ส่วนตัวฉันยังชอบ GPT‑5.2 มากกว่า
วิศวกรจำนวนมากยัง ประเมินความสามารถปัจจุบันของเอเจนต์ LLM อย่าง Claude Code ต่ำเกินไป
ทีมของเราทำ automation ด้วย Claude Code ทั้ง code review, ESLint, PR checklist, การ sync เอกสาร และการตรวจสอบ test coverage
แม้แต่การจัดหมวดหมู่ ticket ก็ทำอัตโนมัติ ทำให้พอวิศวกรเริ่มงาน งานก็เสร็จไปแล้วครึ่งหนึ่ง
มีตัวอย่างรีโพอยู่ที่ claude-code-showcase
มั่นใจว่าราวปี 2026 สิ่งนี้จะกลายเป็น workflow มาตรฐานของอุตสาหกรรม
Opus 4.5 สร้างแอป JS ได้ดี แต่ถ้าให้ไปเขียนอัลกอริทึมเงาจากเปเปอร์ปี 2003 ด้วย C++ จะเละเทะทันที
ต่อให้ป้อน รีวิว threading ของ Doom3 BFG โดย Fabien Sanglard ให้ด้วย ก็ยังได้แต่โค้ดไร้ประโยชน์
สรุปคือไม่ใช่ว่าเราประเมิน LLM ต่ำไป แต่เป็นเพราะมัน ยังไม่ practical พอ เลยต้องรอ
แต่ Opus 4.5 ขยับขึ้นไปอีกขั้นจริง ๆ ข้อผิดพลาดน้อยลงมาก และส่วนใหญ่เป็นความพลาดเล็ก ๆ น้อย ๆ
ด้วย AI ทำให้โปรเจ็กต์ที่ปกติต้องใช้เวลา 2 สัปดาห์ เสร็จได้ใน 5 ชั่วโมง
ถ้าไม่มี AI ก็คงไม่คิดจะลองทำตั้งแต่แรก
treeก็ดูได้หมดแล้วฉันใช้ Opus 4.5 มาเยอะพอสมควร มันยอดเยี่ยมมากในเรื่อง การวิเคราะห์โค้ดที่ซับซ้อน แต่ก็ยังไม่ใช่ความสามารถแก้ปัญหาระดับมนุษย์
ตัวอย่างเช่น มันระบุอัลกอริทึมการจัด layout ของกราฟได้อย่างแม่นยำ แต่ไม่สามารถแก้บั๊กนั้นได้ด้วยตัวเอง
มันยอดเยี่ยมสำหรับการวิเคราะห์โค้ดและเสริมความรู้ แต่ การแก้ปัญหาแบบซับซ้อนหลายชั้น ยังเกินความสามารถอยู่
ถ้าอยากได้ประสิทธิภาพจริงต้องใช้ API โดยตรง และค่าใช้จ่ายอาจแตะเลขสามหลักต่อหนึ่ง PR
อ้างอิง: models.dev
การสร้างเอกสารก็ดีกว่ามนุษย์ และอัตราความผิดพลาดก็มักต่ำกว่ามนุษย์ด้วย
แนะนำให้ลองใช้ตรงใน VS Code หรือ Cursor ผ่านการสมัคร Claude Code
ช่วงวันหยุดฉันทำหลายโปรเจ็กต์ด้วย GPT‑5.x —
ทั้ง เครื่องมือ automation สำหรับ Swift, การรวม ARM JIT engine, โปรโตไทป์ซินธิไซเซอร์ ฯลฯ
GPT‑5.2 และสาย Codex ทรงพลังพอ ๆ กับ Opus ถึงขั้น จัด workflow ของ CI ทั้งชุดได้ในครั้งเดียว
สำหรับคนอย่างฉันที่ชอบวางแผนและรีวิวโค้ด มันคือ เครื่องมือเพิ่ม productivity แบบคูณสอง
ต้องไปคุ้ยดู source code จริงถึงจะยืนยันข้อผิดพลาดได้
ฉันทำไลบรารี binding ของ Ratatui สำหรับ Ruby เสร็จในเวลา 2 สัปดาห์
Antigravity รันหลายเอเจนต์แบบขนานเพื่อทำ context compression และการจัดการอัตโนมัติ
เครื่องมือระดับสูงพวกนี้ให้ประสบการณ์ที่ต่างจากเวอร์ชันฟรีโดยสิ้นเชิง
ถ้าใช้ร่วมกับเครื่องมือ Unix และ git CLI ก็จะคุมบริบทให้เล็กและเพิ่มประสิทธิภาพได้สูงสุด
มันเก่งกับ input/output ที่มีโครงสร้าง แต่ล้มเหลวกับงานที่ต้องการ “ความลงตัวเชิงสัมผัส”
ช่วงหลังรู้สึกว่าใน HN มี คอมเมนต์เชิงลบเกี่ยวกับ LLM ลดลงมาก
แต่โปรเจ็กต์ที่แชร์กันส่วนใหญ่ก็ยังหยุดอยู่แค่ระดับ technical demo
การสะสมบริบท หรือก็คือ การเข้าใจความต้องการของผู้ใช้ ยังเป็นหน้าที่ของมนุษย์อยู่ดี
คุณอาจสร้างแอปได้หลายตัวในสุดสัปดาห์เดียว แต่แทบไม่มีใครอยากดูแลมันต่อ
Karpathy ก็แชร์ประสบการณ์คล้ายกัน — ทำ prototype นั้นง่าย แต่ deploy จริงยาก
ถ้าเป็นเครื่องมือใช้ส่วนตัว การโฟกัสที่ การแก้ปัญหา มากกว่าความสมบูรณ์แบบก็เพียงพอแล้ว
ถ้าปล่อยให้ AI คิดแทนมากเกินไป ความสามารถในการคิดด้วยตัวเองก็จะอ่อนลง
ทดสอบไอเดียได้เร็วก็จริง แต่การไปให้ถึงผลิตภัณฑ์ที่สมบูรณ์ยังต้องอาศัยความอดทนของมนุษย์
Opus 4.5 ไม่ได้แค่มีความรู้มากขึ้น แต่ ความสามารถในการแก้ปัญหาแบบอัตโนมัติ ก็ดีขึ้นมาก
ถ้าเป็นปัญหาที่นิยามชัด มันแทบแก้ได้ทั้งหมด และยังทำ reverse engineering ได้ด้วย
ช่วงหลังฉันแทบไม่ค่อยเขียนโค้ดเองแล้ว แต่เขียนสเปกและคอยกำกับให้ Opus ลงมือทำและปรับปรุงแทน
โปรเจ็กต์ reverse engineering เกม C64
Claude Code ทรงพลังกว่าเพราะเห็นทั้งโค้ดเบส แต่ กินโควตาเร็วเกินไป
เลยกลับมาใช้เวอร์ชันเว็บ
ฉันเคยใช้ Opus 4.5 ลองทำทั้ง JavaScript interpreter ที่เขียนด้วย Python, WebAssembly runtime, และ การพอร์ต string search routine ของ Rust ไปเป็น C
ส่วนใหญ่ทดลองบนสมาร์ตโฟน และผลลัพธ์ก็น่าทึ่งมาก
อ้างอิง: micro-javascript
วิดีโอตัวอย่าง: ลิงก์ Mastodon
เหตุผลที่นักพัฒนายังถูกจ้างจริง ๆ คือเรื่อง ความรับผิดชอบ
แม้สมัยที่เราก๊อบโค้ดจาก StackOverflow หรือ GitHub ก็ยังมีเครื่องมืออยู่แล้ว
แต่เมื่อมีปัญหา คนที่ต้องรับผิดชอบสุดท้ายก็คือมนุษย์
ถ้ามีเพื่อนร่วมงานที่ไว้ใจได้และกล้าเอาชื่อไปค้ำโค้ดที่ AI เขียน ก็ถือว่าโอเค
งานบำรุงรักษาเลยมักถูกละเลย
สุดสัปดาห์ที่ผ่านมา ฉันทำ SaaS ไป 80% ด้วย AI และเขียนเฉพาะแกนสำคัญเอง
แค่เอาสเปกภาษาที่ฉันเขียนไว้เมื่อ 22 ปีก่อนมาแปะ Opus ก็สร้าง parser กับเทสต์เสร็จใน 3 นาที
สุดท้ายแล้วเรากำลังเข้าสู่ช่วงเวลาที่ต้อง ปรับตัวต่อการเปลี่ยนแปลงเหมือนอุตสาหกรรมเหมืองแร่
ฉันเขียนโค้ดเอง ส่วน AI ช่วยหาปัญหาและเสนอแนวทางการทดสอบ
Opus 4.5 กำลังช่วยฉันสร้าง ภาษาโปรแกรมใหม่
เราคุยกันถึงระดับ implementation ชั้นล่าง ร่วมงานกันเหมือน pair programming
แต่ในโค้ดเบสขนาดใหญ่ มนุษย์ก็ยังต้องมี อำนาจควบคุมเชิงระบบ อยู่ดี
ไม่อย่างนั้น Opus จะเปลี่ยนสเปกหรือเอาวิธีแก้เฉพาะหน้ามากลบปัญหา
มันไม่ใช่เครื่องมือสารพัดนึก แต่ก็ดูเหมือนว่าจะเป็น ปีที่ productive ที่สุด ในชีวิตฉัน
และในขณะเดียวกัน ถ้าเทคโนโลยีแบบนี้แพร่หลายจริง ก็หวังว่าจะได้เห็น การฟื้นคืนของชุมชนเว็บขนาดเล็ก ด้วย
ก่อนถึงวันนั้น ฉันคิดว่า ภาษาที่มนุษย์อ่านเข้าใจง่าย จะยิ่งสำคัญขึ้น
ฉันเคยให้ Opus 4.5 “ปรับปรุงทั้งโปรเจ็กต์” แล้วมันกลับสร้าง สถาปัตยกรรมเพี้ยน ๆ กับบั๊กจำนวนมาก
มันยอดเยี่ยมในงานเทสต์และตรวจจับบั๊ก แต่ถ้ามอบ การออกแบบโครงสร้างทั้งระบบ ให้แล้วจะเสียใจทีหลัง
คำสั่งแบบ “ลองปรับอะไรก็ได้ดู” คือพรอมป์ต์ที่แย่ที่สุด
ก่อนหน้านี้ก็เคยมีคนปล่อยให้เอเจนต์ปรับปรุงงานทั้งคืน แล้วตื่นมาเจอ โค้ดขยะ 100,000 บรรทัด
เพราะแบบนี้ การพัฒนาแบบมีแผน จึงสำคัญ
อ้างอิง: The Highest Quality Codebase
มันอาจเสนอให้แก้ต่อไปเรื่อย ๆ แบบไม่สิ้นสุดเหมือนลูปอนันต์ก็ได้