8 คะแนน โดย xguru 2023-02-17 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • อยู่ภายในรีโปที่ใช้ชื่อว่า Mctx(MCTS-in-JAX)
  • ไลบรารีความเร็วสูงมากที่นำอัลกอริทึม Monte Carlo Tree Search (MCTS) มาทำให้เป็นจริงแบบ JAX-native
    • อัลกอริทึมค้นหาที่เลือกการเดินที่ดีที่สุดในเกมแบบผลัดตาเดิน ด้วยกระบวนการ "เลือก→ขยาย→จำลอง→อัปเดตโหนดในต้นไม้เชิงกลยุทธ์"
  • เป็นคอมโพเนนต์ที่ซับซ้อนที่สุดของ AlphaGo และการทำให้ส่วนนี้มีประสิทธิภาพเป็นเรื่องสำคัญมาก
  • ไม่ได้ใช้แค่กับ AlphaGo เท่านั้น แต่ยังใช้ใน AlphaZero (Go, Chess, Shogi) และ MuZero (AlphaZero + เกม Atari) ด้วย

1 ความคิดเห็น

 
xguru 2023-02-17

ผมเห็นทวีตนี้มาจาก HN เองนี่แหละ https://news.ycombinator.com/item?id=34801636
จริง ๆ แล้ว Repo นี้ถูกเปิดเผยมาได้ราว 1 ปีแล้ว และก็มีคอมเมนต์ที่วิจารณ์ด้วยว่านี่ไม่ใช่ AlphaGo ทั้งหมด แบบนี้เข้าข่ายพาดหัวล่อคลิกหรือเปล่า
เขายังบอกอีกว่าตัว implementation ดั้งเดิมของ AlphaGo ใช้ tensorflow/TPU และอันนี้ก็เป็นแค่การนำมาเขียนใหม่ด้วย JAX เท่านั้น