- ‘Momo’ สุนัขสายพันธุ์คาวาพู ถูกฝึกให้สร้างเกมที่เล่นได้จริงด้วย Claude Code และ Godot Engine
- อินพุตถูกส่งผ่าน Raspberry Pi และแอป DogKeyboard และเมื่อพิมพ์ครบตามจำนวนอักษรที่กำหนด เครื่องให้อาหารอัจฉริยะ จะจ่ายขนมอัตโนมัติ
- มีการตั้งพรอมป์ต์ให้ Claude Code เป็น “นักออกแบบเกมอัจฉริยะที่สั่งงานด้วยภาษารหัสลับ” เพื่อให้ ตีความอินพุตไร้ความหมายให้กลายเป็นไอเดียเกมที่มีความหมาย
- เพิ่ม เครื่องมือฟีดแบ็กอัตโนมัติ (จับภาพหน้าจอ, ทดสอบลำดับอินพุต, linter ฯลฯ) เพื่อให้ Claude ทดสอบและแก้เกมได้ด้วยตัวเอง
- โปรเจกต์นี้เป็นการทดลองที่แสดงให้เห็นว่า หัวใจของการพัฒนา AI อยู่ที่คุณภาพของวงจรฟีดแบ็กมากกว่าไอเดีย และได้เปิดซอร์สเครื่องมือกับโค้ดทั้งหมด
ภาพรวมโปรเจกต์
- Momo ส่งอินพุตผ่าน คีย์บอร์ด Bluetooth และ DogKeyboard จะส่งต่อไปยัง Claude Code
- เมื่อมีอินพุตสะสมถึงระดับหนึ่ง เครื่องให้อาหารอัจฉริยะ Aqara C1 จะจ่ายขนมผ่านคำสั่ง Zigbee
- ระหว่างที่ Claude กำลังทำงาน ระบบจะบล็อกอินพุตไว้ และจะส่งให้อัตโนมัติเมื่อเข้าสู่สถานะรอ
- การสร้างเกมทำด้วย Godot 4.6 และ C# โดยเกมหนึ่งใช้เวลาสร้างประมาณ 1~2 ชั่วโมง
การออกแบบพรอมป์ต์
- ตั้งค่า สถานการณ์ “อัจฉริยะนักออกแบบเชิงรหัสลับ” เพื่อให้ Claude Code ตีความอินพุตสุ่มให้เป็นคำสั่งที่มีความหมาย
- จัดเช็กลิสต์ให้มีองค์ประกอบขั้นต่ำคือ เสียง, ปุ่มควบคุม (WASD/ปุ่มลูกศร), ศัตรูหรืออุปสรรค, ตัวละครผู้เล่น
- ตัวอย่างอินพุต “y7u8888888ftrg34BC” ถูกตีความเป็นเกม 3D จับแมลงของกบชื่อ “Swamp Snacker”
การขยายระบบ
- เปรียบเทียบ Bevy, Unity, Godot แล้วเลือก Godot
- ด้วยโครงสร้างไฟล์
.tscn แบบข้อความ Claude จึงอ่านและแก้ไขได้โดยตรง
- DogKeyboard ทำหน้าที่ กรองการกดคีย์, เฝ้าติดตามสถานะของ Claude, ส่งอัตโนมัติ, วิดีโอโอเวอร์เลย์
- ใช้ สคริปต์ควบคุม Zigbee เพื่อควบคุมเครื่องให้อาหารจากระยะไกล โดยทำงานผ่านคำสั่ง JSON แบบง่าย
เครื่องมืออัตโนมัติและการปรับปรุงคุณภาพ
- ใช้ สคริปต์จับภาพหน้าจอ เพื่อตรวจสอบหน้าจอเกม และให้ Claude ตรวจดูฟีดแบ็กเชิงภาพได้เอง
- ใช้ เครื่องมือทดสอบลำดับอินพุต เพื่อให้ Claude เล่นเกมเองและแก้ข้อผิดพลาด
- เพิ่ม Scene linter, Shader linter, Input action mapper เพื่อป้องกันข้อผิดพลาดตอนบิลด์และปัญหาการแมปอินพุตล่วงหน้า
- มีกรณีที่ Claude ทดสอบเองไปจนถึงบอสไฟต์ 6 ด่านและทำหน้าที่ QA อัตโนมัติ
กระบวนการฝึกของ Momo
- ฝึกประมาณ 2 สัปดาห์ วันละ 2 ครั้ง ครั้งละ 10 นาที
- ช่วงแรกใช้ ขนมมูลค่าสูง (แซลมอนฟรีซดราย) เพื่อสร้างความเชื่อมโยงเชิงบวกกับคีย์บอร์ด
- หลังจากนั้นเปลี่ยนเป็น ระบบให้รางวัลอัตโนมัติ โดยจะให้ขนมเมื่อพิมพ์เกิน 16 ตัวอักษร
- ระหว่างทดสอบ เมื่อมีบั๊กที่ทำให้ขนมถูกจ่ายต่อเนื่อง Momo ก็เรียนรู้พฤติกรรมการพิมพ์ซ้ำ
- หลังฝึกเสร็จ วงจรอินพุต-รางวัล ถูกทำให้เป็นอัตโนมัติทั้งหมด
เกมที่สร้างขึ้น
- DJ Smirk: เกมทดลองดนตรีที่แต่ละปุ่มให้เสียงต่างกัน
- Munch: เกมแข่งขันเก็บวัตถุดิบเพื่อทำสลัดให้เสร็จ
- Zaaz: เกมพัซเซิลที่เคลื่อนที่เป็นช่องและระบายสีหน้าจอ
- The Oracle Frog of Rome: เกมเก็บโซ่ทองคำพร้อมหลบหนวดของ Kraken
- Octogroove: เกมจังหวะที่ตีกลองด้วยแขนทั้งสี่
- Ewe Heard Me!: เกมต้อนแกะเข้าคอก (มีปัญหาที่ทำให้ชนะไม่ได้)
- Quasar Saz: เกมแอ็กชัน 6 ด่าน+บอสไฟต์ ที่ใช้เครื่องดนตรีอวกาศต่อสู้กับเสียงที่เสื่อมสลาย
บทสรุป
- โปรเจกต์นี้พิสูจน์เชิงทดลองถึง ความสำคัญของการออกแบบระบบ AI และการทำฟีดแบ็กอัตโนมัติ
- แก่นของผลลัพธ์ไม่ได้อยู่ที่อินพุตของ Momo แต่คือ การผสมกันของพรอมป์ต์, guardrail และเครื่องมือตรวจสอบอัตโนมัติ
- ให้บทเรียนว่า คอขวดของการพัฒนา AI ไม่ใช่ไอเดีย แต่คือคุณภาพของวงจรฟีดแบ็ก
- โค้ดและเครื่องมือทั้งหมดเปิดซอร์สไว้ ทำให้ ทั้งมนุษย์ สัตว์ และอินพุตแบบสุ่มสามารถนำไปทดลองได้
8 ความคิดเห็น
โอ๊ย ตายกันหมดแน่
ถึงยุคที่แม้แต่หมาหรือวัวก็เขียนโค้ดกันได้แล้วจริง ๆ
ไอเดียแบบนี้คิดขึ้นมาได้ยังไงกัน... น่านับถือจริง ๆ
ไอเดียน่าสนุกดีนะครับ ถ้าสั่งพรอมป์ต์ได้ดี ก็น่าจะเข้าใจพฤติกรรมของสัตว์ได้หลายรูปแบบ
แบบนี้อีกไม่นานจะถึงยุคที่เราคุยกับสัตว์ได้จริง ๆ หรือเปล่า?
ผมอยากลองคุยกับแมวดู
ตอนนี้เป็นยุคที่แม้แต่น้องหมาก็ยังเก่งกว่าเรา... แถมเจ้านี่ยังน่ารักอีกต่างหาก...
นี่มันไม่ใช่การทดลองลิงอะไรสักอย่างนั่นหรอกเหรอ 555
โอ้.. อันนี้ดูเหมือนจะเป็นวิธีที่คล้ายกับ diffusion อยู่นะ
ความคิดเห็นจาก Hacker News
ตอนนี้หมาก็ทำ vibe-coding ได้แล้ว
แอปส่วนใหญ่ทำงานได้แบบพอถูไถ คล้ายแอปที่มนุษย์ทำขึ้นเอง
ทำให้นึกถึงการ์ตูนเก่า “On the Internet, nobody knows you’re a dog”
ตอนนี้เหมือนจะกลายเป็นเวอร์ชันว่า “AI ไม่สนแล้ว ว่าคุณเป็นหมาหรือไม่ ขอแค่พิมพ์คีย์บอร์ดได้ก็พอ”
ผมว่ามันเป็น การเสียดสีสังคม ที่ยอดเยี่ยมมาก
ทั้งโปรเจกต์มีสารทางสังคมอยู่ก็จริง แต่ผมอยากให้แต่ละคนตีความกันเอง
แม้แต่ซอฟต์แวร์ซับซ้อนก็ยังมีจุดให้ปรับปรุงอีกมาก คนที่ทำมันมาหลายปีคงอยากตะโกนว่า “พวกเราใช้เวลาตั้งหลายสิบปีนะ!”
สุดท้ายแล้วคนส่วนใหญ่ก็แค่อาศัยเอกสารเทคนิคแล้ว เขียนโค้ดตามความรู้สึก เท่านั้นเอง
ชอบบทความนี้มาก
พรุ่งนี้เช้าน่าจะมี Karpathy พูดว่า “อินเทอร์เฟซ LLM ที่ขับเคลื่อนด้วยสุนัขคืออนาคต” แล้วขึ้นอันดับ 1 บน HN
และผมก็แอบกังวลนิด ๆ ว่าหัวหน้าจะพูดว่า “งั้นเราต้องทำเดี๋ยวนี้เลย”
หมาเป็นคนป้อนพรอมป์ต์ให้ Claude, มนุษย์เป็นคนให้อาหารหมา, แล้วหมาก็คอยกันไม่ให้มนุษย์ปิดคอมพิวเตอร์
หมาเป็นสัตว์ที่ซื่อสัตย์ กระตือรือร้น และ กินพื้นที่สำนักงานน้อยกว่า
อุตสาหกรรมเกมคงถูกหมายึด ส่วนอุตสาหกรรมการเงินคงเป็นของแมว
หวังว่าโน้ตบุ๊กจะกันน้ำได้นะ
หมาเป็นสัตว์ฉลาด ถ้ามีอุปกรณ์อินพุตที่เหมาะสม มันอาจจะทำ vibe-coding ได้จริงก็ได้
ทำให้นึกถึง การทดลองให้ต้นกระบองเพชรเล่นหุ้น ที่เคยมีมาก่อน
แก่นจริง ๆ คือประโยคที่ว่า “เวทมนตร์ไม่ได้อยู่ที่อินพุต แต่อยู่ที่ตัวระบบ”
การที่สร้างเกมได้จากอินพุตแบบสุ่ม หมายความว่าความสำคัญของอินพุตลดลงแล้ว
ตอนนี้แก่นของวิศวกรรมอยู่ที่ การออกแบบสถาปัตยกรรม ไม่ใช่พรอมป์ต์
โครงสร้างระบบ อย่าง persistent memory, ข้อจำกัดของการกระทำ, และ feedback loop สำคัญกว่าการปรับพรอมป์ต์มาก
การทดลองกับหมาก็คือตัวอย่างที่ผลักตรรกะนั้นไปจนสุด — ท้ายที่สุด ความสามารถของ AI อยู่ที่โครงสร้างนั่นเอง
วิศวกรรมเป็นเรื่องของ การคิดเชิงระบบ โดยรวม
เมื่อ AI พัฒนาไป ทักษะด้านพรอมป์ต์จะ ไร้ความหมาย อย่างรวดเร็ว
สุดท้ายเราก็กำลังฝึกสิ่งที่จะมาแทนตัวเราเอง
ถ้าเทคโนโลยีพัฒนาเต็มที่แล้ว แม้แต่หมาก็ทำได้
แน่นอนว่า LLM คงขยายได้ไม่สิ้นสุดไม่ได้ และอาจเจอ ผลตอบแทนที่ลดลง แต่ถ้าฟองสบู่ AI แตก พวกเราอาจตกงานกันหมด
ชื่อเรื่อง เรียกคลิก มาก แต่ก็น่าชื่นชมที่มันอธิบายเนื้อหาของบทความได้ตรงตัวจริง ๆ
ผู้เขียนไม่ได้สอนให้หมา vibe-coding ได้จริง แค่สอน การตอบสนองแบบวางเงื่อนไขว่ากดคีย์บอร์ดแล้วได้ขนม เท่านั้น
ถ้าทำให้หมาตอบสนองต่อฟีดแบ็กจากเกมได้จริง เมื่อนั้นถึงจะเลิกเป็นคลิกเบต
“นักประวัติศาสตร์เรียกช่วงราวปี 2026 ว่าเป็นยุคที่สุนัขซึ่งเคยเป็นเพื่อนมนุษย์ เริ่มวิวัฒน์เป็นเพื่อนร่วมงาน ‘Dog Days’… โฮ่ง” — Puppers Domingo, Good Boy, Esquire
อีกไม่นานเราอาจได้เห็นหลักฐานของ ทฤษฎีลิงพิมพ์ไม่รู้จบ ในโลกความจริง
ต้องปรับวิธีรับอินพุตใหม่
ถ้ามี อินเทอร์เฟซแบบใช้กล้อง ที่ตรวจจับการแกว่งหางหรือความสนใจทางสายตาได้ ก็ดูเป็นไปได้ที่หมาจะสร้างเกมตามรสนิยมของตัวเองจริง ๆ
คีย์บอร์ดเป็นอุปกรณ์อินพุตที่ไม่เหมาะ
กำลังคิดอยู่ว่าจะเอาไปรวมกับ nanobana เพื่อให้มันเลือกตัวเลือกดูไหม
น่าจะลองในเวอร์ชันถัดไป
“ใครเป็น นักพัฒนาซอฟต์แวร์ ที่ดีเด็กที่สุดกันนะ?” [ลูบหัว]
ผู้เขียนควรเปลี่ยนคีย์บอร์ดเป็น Dvorak layout
แบบนั้นน่าจะสร้างอินพุตสุ่มที่น่าสนใจกว่าได้มาก