DeepMind เปิดซอร์สโอเพนของแกนหลักใน AlphaGo และ AlphaZero

xguru · 2023-02-17T14:33:34+09:00

อยู่ภายในรีโปที่ใช้ชื่อว่า Mctx(MCTS-in-JAX) ไลบรารีความเร็วสูงมากที่นำอัลกอริทึม Monte Carlo Tree Search (MCTS) มาทำให้เป็นจริงแบบ JAX-native อัลกอริทึมค้นหาที่เลือกการเดินที่ดีที่สุดในเกมแบบผลัดตาเดิน ด้วยกระบวนการ "เลือก→ขยาย→จำลอง→อัปเดตโหนดในต้นไม้เชิงกลยุทธ์" เป็นคอมโพเนนต์ที่ซับซ้อนที่สุดของ AlphaGo และการทำให้ส่วนนี้มีประสิทธิภาพเป็นเรื่องสำคัญมาก ไม่ได้ใช้แค่กับ AlphaGo เท่านั้น แต่ยังใช้ใน AlphaZero (Go, Chess, Shogi) และ MuZero (AlphaZero + เกม Atari) ด้วย

(twitter.com/DrJimFan)

8 คะแนน โดย xguru 2023-02-17 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

อยู่ภายในรีโปที่ใช้ชื่อว่า Mctx(MCTS-in-JAX)
ไลบรารีความเร็วสูงมากที่นำอัลกอริทึม Monte Carlo Tree Search (MCTS) มาทำให้เป็นจริงแบบ JAX-native
- อัลกอริทึมค้นหาที่เลือกการเดินที่ดีที่สุดในเกมแบบผลัดตาเดิน ด้วยกระบวนการ "เลือก→ขยาย→จำลอง→อัปเดตโหนดในต้นไม้เชิงกลยุทธ์"
เป็นคอมโพเนนต์ที่ซับซ้อนที่สุดของ AlphaGo และการทำให้ส่วนนี้มีประสิทธิภาพเป็นเรื่องสำคัญมาก
ไม่ได้ใช้แค่กับ AlphaGo เท่านั้น แต่ยังใช้ใน AlphaZero (Go, Chess, Shogi) และ MuZero (AlphaZero + เกม Atari) ด้วย

1 ความคิดเห็น

xguru 2023-02-17

ผมเห็นทวีตนี้มาจาก HN เองนี่แหละ https://news.ycombinator.com/item?id=34801636
จริง ๆ แล้ว Repo นี้ถูกเปิดเผยมาได้ราว 1 ปีแล้ว และก็มีคอมเมนต์ที่วิจารณ์ด้วยว่านี่ไม่ใช่ AlphaGo ทั้งหมด แบบนี้เข้าข่ายพาดหัวล่อคลิกหรือเปล่า
เขายังบอกอีกว่าตัว implementation ดั้งเดิมของ AlphaGo ใช้ tensorflow/TPU และอันนี้ก็เป็นแค่การนำมาเขียนใหม่ด้วย JAX เท่านั้น

DeepMind เปิดซอร์สโอเพนของแกนหลักใน AlphaGo และ AlphaZero

บทความที่เกี่ยวข้อง

1 ความคิดเห็น