วิชาการคอมพิวเตอร์ > การเรียนรู้ของเครื่อง
- ชื่อเรื่อง: Adversarial Policies Beat Superhuman Go AIs
- ผู้เขียน: Tony T. Wang, Adam Gleave, Tom Tseng, Kellin Pelrine, Nora Belrose, Joseph Miller, Michael D. Dennis, Yawen Duan, Viktor Pogrebniak, Sergey Levine, Stuart Russell
- วันส่ง: 1 พฤศจิกายน 2022 (v1), แก้ไขล่าสุด 13 กรกฎาคม 2023 (v4)
สรุป
- ทีมวิจัยฝึกนโยบายเชิงปรปักษ์ต่อระบบ AI Go ระดับสูงสุดอย่าง KataGo และทำได้อัตราชนะมากกว่า 97% เมื่อทำงานในโหมดเหนือมนุษย์
- นโยบายเชิงปรปักษ์ไม่ได้เอาชนะด้วยการเล่นโกะที่ดีกว่า แต่ทำให้ KataGo ตัดสินใจผิดพลาดอย่างรุนแรง
- การโจมตีนี้สามารถถ่ายทอดแบบ zero-shot ไปยัง AI Go ระดับเหนือมนุษย์ตัวอื่นได้ และแม้แต่ผู้เชี่ยวชาญมนุษย์ยังสามารถเอาชนะ AI ระดับเหนือมนุษย์อย่างสม่ำเสมอได้โดยไม่ต้องใช้ความช่วยเหลือของอัลกอริทึม
- แม้กับเอเจนต์ KataGo ที่ได้รับการฝึกเชิงปรปักษ์เพื่อตอบโต้การโจมตีแล้ว จุดอ่อนสำคัญยังคงปรากฏ
- ผลการศึกษาชี้ให้เห็นว่า AI ระดับเหนือมนุษย์ยังสามารถมีโหมดความล้มเหลวที่น่าทึ่งได้
ข้อมูลเพิ่มเติม
- สถานะเอกสาร: ได้รับการยอมรับที่ ICML 2023
- หัวข้อ: การเรียนรู้ของเครื่อง (cs.LG); ปัญญาประดิษฐ์ (cs.AI); การเข้ารหัสลับและความมั่นคงปลอดภัย (cs.CR); การเรียนรู้ของเครื่อง (stat.ML)
- การจัดประเภท ACM: I.2.6
- การอ้างอิง: arXiv:2211.00241 [cs.LG] (หรือเวอร์ชัน arXiv:2211.00241v4 [cs.LG] นี้)
- ประวัติการส่ง:
- [v1] 1 พฤศจิกายน 2022
- [v2] 9 มกราคม 2023
- [v3] 18 กุมภาพันธ์ 2023
- [v4] 13 กรกฎาคม 2023
วิธีการเข้าถึง
- เข้าถึงงานวิจัยได้ในรูปแบบ PDF และรูปแบบอื่น ๆ
- มีเอกสารอ้างอิงและเครื่องมืออ้างอิงที่เกี่ยวข้อง
ข้อมูล arXiv
- arXiv คือแพลตฟอร์มสำหรับแชร์งานวิจัยที่รวบรวมบทความในหลายสาขา
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ผู้ใช้คนหนึ่งกล่าวว่ากระดาษชิ้นนี้ดูน่าทึ่งในตอนแรก แต่ยากต่อการเข้าใจ ถึงแม้จะรู้จัก Go และ Go AI ค่อนข้างดี และรู้จักหมากรุกกับ AI หมากรุกมากพอสมควร แต่ก็รู้สึกว่าคำอธิบายไม่เพียงพอและมีศัพท์ทางเทคนิคมากเกินไป
ผู้เขียนยกตัวอย่างกรณีขอบเขตของหมากรุกและเปรียบเทียบการประเมินระหว่าง Stockfish และ Lc0
มีการกล่าวว่าใน Go ผู้เล่นสมัครเล่นอาจเป็นคู่ต่อสู้ที่ท้าทายได้เนื่องจากการเดินที่คาดเดาไม่ได้
ถูกยกเตือนว่าหลังจาก Deep Blue ผู้เล่นหมากรุกได้พัฒนากลยุทธ์ในการรับมือกับคอมพิวเตอร์มากขึ้น
มีการพูดถึงว่าหมากรุกยังคงชนะจากการคำนวณที่มากขึ้น
ระบุว่าบทความมีการแก้ไขตั้งแต่ปี 2022 ถึง 2023 และอาจเคยเห็นมาก่อน
มีการพูดถึงว่ามนุษย์ก็ยังมีความหวัง
มีการกล่าวว่าบทความนี้จะถูกนำไปใช้เพื่อผสานการป้องกันการโจมตีแบบก้าวร้าว (adversarial) ใน AI ของ Go
ระบุว่าข้อสรุปที่ว่า "ผลลัพธ์ของเราแสดงให้เห็นว่าระบบ AI ระดับเหนือมนุษย์ก็สามารถมีโหมดความล้มเหลวที่น่าประหลาดใจได้" เป็นข้อสรุปที่ว่างเปล่า