1. ลองใช้งานช่วงสั้น ๆ แล้วรู้สึกว่า hermes มีอาการหลุดความจำน้อยกว่า openclaw ซึ่งพอไปดูแล้วก็เป็นเพราะมีลอจิก session context replay รองรับสถานการณ์อย่างการรีสตาร์ตหรือ model fallback นั่นเอง ส่วน openclaw เองก็ยังพัฒนาฟีเจอร์ด้านหน่วยความจำกันต่อเนื่องอยู่ เลยคิดว่าต่อไปก็น่าจะดีขึ้นเหมือนกันครับ

  2. ฟังก์ชันปรับปรุงตัวเองก็น่าประทับใจเหมือนกัน เพราะเมื่อระบบตรวจพบว่ากระบวนการทำงานซับซ้อน ก็จะมีลอจิกที่สร้างเป็น skill ให้อัตโนมัติ และเพื่อใช้แก้ไข มันยังมีโครงสร้างที่รับซอร์สโค้ดมาไว้ใน workspace ของตัวเองด้วย git ทำให้เข้าถึงได้โดยตรงด้วยครับ แต่ปัญหาคือไม่มีการจัดการความเปลี่ยนแปลงระหว่างซอร์สโค้ด git ใน workspace กับรีโพซิทอรีทางการบน GitHub เลย พออัปเดตก็เกิดสถานการณ์ที่การแก้ไขในเครื่องถูกรีเซ็ต กำลังลองหาวิธีอุดช่องนี้ด้วย git worktree อยู่ แต่ก็ยังจัดให้เนียน ๆ ไม่ค่อยได้เท่าไรนัก... อืม...

 

จริง ๆ แล้วก็ถูกต้องที่ตอนนี้ยังไม่มีความแตกต่างที่ชัดเจนจนคนที่ไม่ใช่นักพัฒนาจะรู้สึกได้
ความแตกต่างระหว่าง hermes agent กับ openclaw มาจากโครงสร้าง memory และความสามารถในการแก้ไขตัวเอง แต่ในสภาพเริ่มต้นที่เพิ่งติดตั้งใหม่และยังเป็นกระดาษเปล่า สิ่งเหล่านี้จะยังไม่ปรากฏให้เห็น

 

ตอนที่ลองใช้ Claude Code ครั้งแรก ผมไปบอกเพื่อนต่างชาติว่า "ฉันเพิ่งลอง vibe coding ครั้งแรก!" แต่พอพวกเขาฟังที่ผมเล่า ก็กลับตอบว่า "ไม่สิ แบบนั้นไม่ใช่ vibe coding นะ vibe coding จริง ๆ คือการไม่เปิดดูโค้ดเลยต่างหาก" ดูเหมือนว่า 'vibe coding' ที่มักพูดกันในบ้านเราจะมีความหมายกว้างกว่านิยามที่ใช้กันในตะวันตกมาก สำหรับ vibe coding ที่พูดกันบน Hacker News นิยามว่าเป็น 'ไม่ทำ code review' น่าจะตรงที่สุด

 

หัวข้อกับเนื้อหาคนละเรื่องกัน...?

 

พออีเวนต์ 2 เท่าจบลง ผมก็รู้สึกได้ชัดเหมือนกัน แต่ที่แท้ก็ไม่ได้มีแค่ผมที่รู้สึกแบบนี้สินะ ไม่ใช่แค่เพราะอีเวนต์ 2 เท่าสิ้นสุดลงเท่านั้น แต่ความเร็วในการกินโควตาก็พุ่งขึ้นกว่าก่อนหน้าอย่างมากด้วย...

 

ผมใช้ Claude Code โดยต่อกับ Glm เลยไม่เคยเจอประสบการณ์แบบนั้นนะครับ
คิดว่าสาเหตุหลักน่าจะอยู่ฝั่งการตอบสนองของเซิร์ฟเวอร์ Anthropic

 

ต้องคอยกำกับแบบละเอียดแม้แต่ในส่วนเล็กน้อยมาก ๆ ถึงจะได้โค้ดที่คุณภาพพอดูดีขึ้นมา ผมคิดว่าการทำให้เป็นอัตโนมัติเต็มรูปแบบนั้นเป็นไปไม่ได้เลย นอกจากกรณีผลิตโค้ด boilerplate จำนวนมากจริง ๆ คนที่พูดถึงความเป็นอิสระเต็มรูปแบบมีอยู่สองแบบ ไม่ก็ไม่ค่อยรู้อะไรจริง หรือไม่ก็เป็นพวกต้มตุ๋น

 

ดูเหมือนเป็นการตำหนิแบบสรุปเอาเองว่า vibe coding เท่ากับไม่ทำ code review แล้วก็เอาเหตุผลต่าง ๆ มาปะติดปะต่อประกอบ

ยิ่งไปกว่านั้น การเอา Claude Code มาโยงก็ไม่มีเหตุผลเลย ถ้าจะเข้มงวดเรื่องคุณภาพในระดับนั้น เช่น ยึดหลักวิศวกรรมแบบวิศวกรระดับผู้ดูแล Linux จริง ๆ ก็จะไม่เข้าไปมองปัญหาคุณภาพโค้ดแบบฉาบฉวยเป็นชิ้น ๆ แบบนี้ ส่วนใหญ่แทบจะเป็นการเข้าหาเชิงโฆษณาชวนเชื่อ มากกว่าจะมาจากการได้ลองทดสอบด้วยตัวเอง แต่เป็นแนว ๆ ได้ยินเขาพูดต่อกันมาว่าเป็นแบบนั้น

มันคล้ายกับการบอกว่าดีไซน์ตึกของ Samsung ไม่ค่อยดี แล้วบอกว่ายังอีกไกลกว่าจะตาม Sony ทัน

 

นี่เป็นปัญหาที่เกิดขึ้นต่อเนื่องมาตั้งแต่หลังจบอีเวนต์คูณ 2 ไม่นานมานี้ ใน Reddit และคอมมูนิตี้ที่เกี่ยวข้องก็ยังเป็นประเด็นร้อนกันอยู่เรื่อย ๆ เลยแปลกใจเหมือนกันที่ที่นี่ยังไม่ได้ลงเป็นข่าว

 

ในหน้าเผยแพร่โมเดลของ huggingface ก็มีเบนช์มาร์กของตัวเองด้วยนะ...

https://huggingface.co/litert-community/gemma-4-E4B-it-litert-lm

 

บรรยากาศแบบที่ทำ FULL AUTO MATION ด้วย AI AGENT ให้สร้างโค้ด, merge, review, verify จนเป็นอัตโนมัติเต็มรูปแบบ แล้วทำให้ทุกอย่างประกอบเป็นโค้ดได้เอง แทบไม่ต้องใส่ใจอะไรเลย นาน ๆ ทีค่อยให้ดีเวลลอปเปอร์เข้าไปแทรกแซงตอนที่เอเจนต์ตีกันเอง แล้วก็ทำเหมือนว่ามันจบครบหมดแล้ว จนถึงขั้นมองนักพัฒนาที่ทำแบบนั้นไม่ได้ว่าเป็นพวกผิดปกติที่ตามเทรนด์ไม่ทัน มันถูกพูดกันจนเกลื่อน...พอมาดูพวกที่ปกติก็เอาแต่พ่นโค้ด boilerplate ซ้ำ ๆ เขียนแต่โค้ดแพตเทิร์นเดิมต่อเนื่องแล้วรับเงินเดือนสูงลิ่ว พอถึงเวลามาอ้าปากบอกว่าเดี๋ยวนี้ไม่ต้องเขียนโค้ดแล้วเพราะ AI ยิ่งดูน่าสมเพชสุด ๆ

 

ถ้าคิดว่าแม้แต่ LLM ก็แค่รวบรวมข้อมูลจำนวนมาก ผมก็พอเข้าใจได้ว่าทำไมถึงไม่มองว่านี่เป็นการกระทำที่ ‘ชั่วร้าย’ อะไรมากนัก แต่ก็ไม่แน่ใจเหมือนกันว่านี่เป็นเรื่องที่ควรทำกันอย่างเปิดเผยขนาดนี้หรือเปล่า

 

เห็นอันนี้แล้วก็เลยลองเขียนอย่างขยันขันแข็งดูครับ.. แล้วก็ได้เอาบทความเรื่องว่าทำไมมันถึงใช้ไม่ได้.. มาลงใน GeekNews ด้วย ฮ่าๆ
ตรงส่วนบทความแนะนำให้อ่านต่อใน GeekNews ดึงมาให้อัตโนมัติเลย ดีมากครับ! :)
ทำไมการประสานงานแบบมัลติเอเจนต์ถึงมักไปได้ไม่ดี?

 

ฮิฮิ ตอนนี้ฉันจะทำอะไรดีนะ

 

"คำนวณเงินเดือนขั้นต่ำที่ผู้สมัครจะยอมรับ"
ก็คล้ายกับร้านแถวบ้านที่ฮั้วกันกำหนดเพดานค่าจ้างรายชั่วโมงเวลาหาคนทำงานพาร์ตไทม์นั่นแหละ