-
ACM A.M. Turing Award Honors Two Researchers Who Led the Development of Cornerstone AI Technology
-
Andrew Barto and Richard Sutton ได้รับการยกย่องในฐานะผู้บุกเบิก Reinforcement Learning
- ACM ได้ประกาศให้ Andrew G. Barto และ Richard S. Sutton เป็นผู้ได้รับรางวัล ACM A.M. Turing Award ประจำปี 2024 โดยทั้งสองได้พัฒนารากฐานเชิงแนวคิดและเชิงอัลกอริทึมของ Reinforcement Learning
- Barto เป็นศาสตราจารย์กิตติคุณด้าน Information and Computer Sciences แห่ง University of Massachusetts Amherst ส่วน Sutton เป็นศาสตราจารย์ด้าน Computer Science ที่ University of Alberta
- รางวัล Turing Award ได้รับการขนานนามว่าเป็นรางวัลโนเบลแห่งวงการคอมพิวติ้ง และมอบเงินรางวัล 1 ล้านดอลลาร์สหรัฐ โดยได้รับการสนับสนุนทางการเงินจาก Google
-
Reinforcement Learning คืออะไร?
- สาขาปัญญาประดิษฐ์ (AI) มุ่งเน้นหลักไปที่การสร้างเอเจนต์ที่สามารถรับรู้และลงมือกระทำได้ โดย Reinforcement Learning (RL) คือกระบวนการที่เอเจนต์เหล่านี้เรียนรู้การกระทำที่ดีขึ้นผ่านสัญญาณรางวัล
- พื้นฐานของ Reinforcement Learning เริ่มต้นขึ้นในช่วงต้นทศวรรษ 1980 เมื่อ Barto และ Sutton ได้ทำให้ Reinforcement Learning เป็นกรอบปัญหาทั่วไปอย่างเป็นทางการ โดยอาศัยข้อสังเกตจากจิตวิทยา
- ทั้งสองได้พัฒนาอัลกอริทึม Reinforcement Learning โดยใช้รากฐานทางคณิตศาสตร์ที่อิงกับ Markov Decision Process (MDP)
-
ผลงานสำคัญ
- Barto และ Sutton ได้พัฒนาแนวทางอัลกอริทึมพื้นฐานของ Reinforcement Learning โดยเฉพาะ temporal-difference learning, policy gradient methods และการแทนฟังก์ชันการเรียนรู้ด้วยโครงข่ายประสาทเทียม
- ตำราเรียนของทั้งคู่ "Reinforcement Learning: An Introduction" ยังคงถูกใช้เป็นหนังสืออ้างอิงมาตรฐานของสาขานี้ และถูกอ้างอิงมากกว่า 75,000 ครั้ง
-
การประยุกต์ใช้ Reinforcement Learning ในโลกจริง
- Reinforcement Learning ได้ก้าวหน้าอย่างมากในช่วง 15 ปีที่ผ่านมา จากการผสานเข้ากับอัลกอริทึม deep learning โดยตัวอย่างเด่นคือชัยชนะของ AlphaGo ในเกมโกะ และการพัฒนา ChatGPT
- Reinforcement Learning ประสบความสำเร็จในหลากหลายสาขา เช่น การเรียนรู้ทักษะการเคลื่อนไหวของหุ่นยนต์, การควบคุมความหนาแน่นของเครือข่าย, การออกแบบชิป และการเพิ่มประสิทธิภาพโฆษณาบนอินเทอร์เน็ต
-
แรงบันดาลใจทางประสาทวิทยาของ Reinforcement Learning
- งานวิจัยล่าสุดชี้ว่า อัลกอริทึม Reinforcement Learning บางประเภทที่พัฒนาขึ้นใน AI เหมาะสมที่สุดสำหรับการอธิบายระบบโดพามีนในสมองมนุษย์
-
คำอธิบายเกี่ยวกับ ACM A.M. Turing Award
- รางวัล Turing Award มอบมาตั้งแต่ปี 1966 เพื่อเชิดชูนักวิทยาการคอมพิวเตอร์และวิศวกรที่มีส่วนในการพัฒนาอุตสาหกรรมเทคโนโลยีสารสนเทศ
-
ผู้ได้รับรางวัล 2024 ACM A.M. Turing Award
- Andrew Barto เป็นศาสตราจารย์กิตติคุณด้าน Information and Computer Sciences แห่ง University of Massachusetts Amherst และเคยได้รับรางวัลมาแล้วหลากหลายรายการ
- Richard Sutton เป็นศาสตราจารย์ด้าน Computer Science ที่ University of Alberta โดยทำงานร่วมกับสถาบันวิจัยหลายแห่งและได้รับรางวัลหลายรายการ
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
เจ๋งมาก ภรรยาของผมกับผมซื้อบ้านของ Andy Barto กับภรรยาของเขา
prime number)ยอดเยี่ยม! เป็นคนที่เหมาะสมกับรางวัลนี้อย่างมาก พวกเขาแจกหนังสือเรียน RL สองฉบับเป็น PDF ฟรี
นี่เป็นช่วงเวลาที่ดีที่จะกลับไปอ่าน The Bitter Lesson อีกครั้ง
Sutton เป็นพวกสืบทอดแนวคิดที่ให้มนุษย์ถูกแทนที่ และไม่สนใจแม้ว่ามนุษย์จะตายหมด เขาไม่น่าไว้วางใจและไม่ใช่คนที่ควรได้รับการเฉลิมฉลอง
คงจะดีกว่านี้ถ้าให้รางวัลกับนักฟิสิกส์
น่าแปลกที่ Sutton อาศัยอยู่ที่เอดมันตัน ประเทศแคนาดา แทนที่จะอยู่สหรัฐฯ
คนเหล่านี้ยอดเยี่ยม แต่โชคร้ายที่หนังสือ AI ของ Sutton และ Barto แย่มากจริง ๆ
ผมเคยใช้หนังสือ RL ของพวกเขาในวิชาที่ผมสอน
ขอแสดงความยินดีอย่างจริงใจกับ Andrew Barto และ Richard Sutton สำหรับการได้รับรางวัล Turing Award
เป็นสิ่งที่ใช้เวลานานมากกว่าจะมาถึงจุดนี้ พวกเขาผลักดันแนวคิดนี้ตั้งแต่ต้นจนจบ และขยายมันจากการเป็นเพียงหัวข้อย่อยในหนังสือ dynamic programming ให้กลายเป็นทั้งสาขา