DeepMind เปิดซอร์สโอเพนของแกนหลักใน AlphaGo และ AlphaZero
(twitter.com/DrJimFan)- อยู่ภายในรีโปที่ใช้ชื่อว่า Mctx(MCTS-in-JAX)
- ไลบรารีความเร็วสูงมากที่นำอัลกอริทึม Monte Carlo Tree Search (MCTS) มาทำให้เป็นจริงแบบ JAX-native
- อัลกอริทึมค้นหาที่เลือกการเดินที่ดีที่สุดในเกมแบบผลัดตาเดิน ด้วยกระบวนการ "เลือก→ขยาย→จำลอง→อัปเดตโหนดในต้นไม้เชิงกลยุทธ์"
- เป็นคอมโพเนนต์ที่ซับซ้อนที่สุดของ AlphaGo และการทำให้ส่วนนี้มีประสิทธิภาพเป็นเรื่องสำคัญมาก
- ไม่ได้ใช้แค่กับ AlphaGo เท่านั้น แต่ยังใช้ใน AlphaZero (Go, Chess, Shogi) และ MuZero (AlphaZero + เกม Atari) ด้วย
1 ความคิดเห็น
ผมเห็นทวีตนี้มาจาก HN เองนี่แหละ https://news.ycombinator.com/item?id=34801636
จริง ๆ แล้ว Repo นี้ถูกเปิดเผยมาได้ราว 1 ปีแล้ว และก็มีคอมเมนต์ที่วิจารณ์ด้วยว่านี่ไม่ใช่ AlphaGo ทั้งหมด แบบนี้เข้าข่ายพาดหัวล่อคลิกหรือเปล่า
เขายังบอกอีกว่าตัว implementation ดั้งเดิมของ AlphaGo ใช้ tensorflow/TPU และอันนี้ก็เป็นแค่การนำมาเขียนใหม่ด้วย JAX เท่านั้น