1 คะแนน โดย GN⁺ 2025-03-06 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ACM A.M. Turing Award Honors Two Researchers Who Led the Development of Cornerstone AI Technology

  • Andrew Barto and Richard Sutton ได้รับการยกย่องในฐานะผู้บุกเบิก Reinforcement Learning

    • ACM ได้ประกาศให้ Andrew G. Barto และ Richard S. Sutton เป็นผู้ได้รับรางวัล ACM A.M. Turing Award ประจำปี 2024 โดยทั้งสองได้พัฒนารากฐานเชิงแนวคิดและเชิงอัลกอริทึมของ Reinforcement Learning
    • Barto เป็นศาสตราจารย์กิตติคุณด้าน Information and Computer Sciences แห่ง University of Massachusetts Amherst ส่วน Sutton เป็นศาสตราจารย์ด้าน Computer Science ที่ University of Alberta
    • รางวัล Turing Award ได้รับการขนานนามว่าเป็นรางวัลโนเบลแห่งวงการคอมพิวติ้ง และมอบเงินรางวัล 1 ล้านดอลลาร์สหรัฐ โดยได้รับการสนับสนุนทางการเงินจาก Google
  • Reinforcement Learning คืออะไร?

    • สาขาปัญญาประดิษฐ์ (AI) มุ่งเน้นหลักไปที่การสร้างเอเจนต์ที่สามารถรับรู้และลงมือกระทำได้ โดย Reinforcement Learning (RL) คือกระบวนการที่เอเจนต์เหล่านี้เรียนรู้การกระทำที่ดีขึ้นผ่านสัญญาณรางวัล
    • พื้นฐานของ Reinforcement Learning เริ่มต้นขึ้นในช่วงต้นทศวรรษ 1980 เมื่อ Barto และ Sutton ได้ทำให้ Reinforcement Learning เป็นกรอบปัญหาทั่วไปอย่างเป็นทางการ โดยอาศัยข้อสังเกตจากจิตวิทยา
    • ทั้งสองได้พัฒนาอัลกอริทึม Reinforcement Learning โดยใช้รากฐานทางคณิตศาสตร์ที่อิงกับ Markov Decision Process (MDP)
  • ผลงานสำคัญ

    • Barto และ Sutton ได้พัฒนาแนวทางอัลกอริทึมพื้นฐานของ Reinforcement Learning โดยเฉพาะ temporal-difference learning, policy gradient methods และการแทนฟังก์ชันการเรียนรู้ด้วยโครงข่ายประสาทเทียม
    • ตำราเรียนของทั้งคู่ "Reinforcement Learning: An Introduction" ยังคงถูกใช้เป็นหนังสืออ้างอิงมาตรฐานของสาขานี้ และถูกอ้างอิงมากกว่า 75,000 ครั้ง
  • การประยุกต์ใช้ Reinforcement Learning ในโลกจริง

    • Reinforcement Learning ได้ก้าวหน้าอย่างมากในช่วง 15 ปีที่ผ่านมา จากการผสานเข้ากับอัลกอริทึม deep learning โดยตัวอย่างเด่นคือชัยชนะของ AlphaGo ในเกมโกะ และการพัฒนา ChatGPT
    • Reinforcement Learning ประสบความสำเร็จในหลากหลายสาขา เช่น การเรียนรู้ทักษะการเคลื่อนไหวของหุ่นยนต์, การควบคุมความหนาแน่นของเครือข่าย, การออกแบบชิป และการเพิ่มประสิทธิภาพโฆษณาบนอินเทอร์เน็ต
  • แรงบันดาลใจทางประสาทวิทยาของ Reinforcement Learning

    • งานวิจัยล่าสุดชี้ว่า อัลกอริทึม Reinforcement Learning บางประเภทที่พัฒนาขึ้นใน AI เหมาะสมที่สุดสำหรับการอธิบายระบบโดพามีนในสมองมนุษย์
  • คำอธิบายเกี่ยวกับ ACM A.M. Turing Award

    • รางวัล Turing Award มอบมาตั้งแต่ปี 1966 เพื่อเชิดชูนักวิทยาการคอมพิวเตอร์และวิศวกรที่มีส่วนในการพัฒนาอุตสาหกรรมเทคโนโลยีสารสนเทศ
  • ผู้ได้รับรางวัล 2024 ACM A.M. Turing Award

    • Andrew Barto เป็นศาสตราจารย์กิตติคุณด้าน Information and Computer Sciences แห่ง University of Massachusetts Amherst และเคยได้รับรางวัลมาแล้วหลากหลายรายการ
    • Richard Sutton เป็นศาสตราจารย์ด้าน Computer Science ที่ University of Alberta โดยทำงานร่วมกับสถาบันวิจัยหลายแห่งและได้รับรางวัลหลายรายการ

1 ความคิดเห็น

 
GN⁺ 2025-03-06
ความคิดเห็นจาก Hacker News
  • เจ๋งมาก ภรรยาของผมกับผมซื้อบ้านของ Andy Barto กับภรรยาของเขา

    • ตอนซื้อมีสงครามการประมูลกันด้วย
    • พอรู้ว่าเขาเป็นนักคณิตศาสตร์ ก็เลยยื่นข้อเสนอเป็นเลขจำนวนเฉพาะ (prime number)
    • ดีใจจริง ๆ ที่ได้เห็นผลงานของเขาได้รับการยอมรับ
  • ยอดเยี่ยม! เป็นคนที่เหมาะสมกับรางวัลนี้อย่างมาก พวกเขาแจกหนังสือเรียน RL สองฉบับเป็น PDF ฟรี

    • ผมทำงานสาย AI ภาคปฏิบัติมาตั้งแต่ปี 1982 และ RL เป็นหัวข้อที่โดยส่วนตัวแล้วเข้าใจจนเชี่ยวชาญได้ยาก
    • หนังสือของ Sutton/Barto และคอร์ส RL บน Coursera ของศาสตราจารย์ White ช่วยได้มาก: แนะนำเลย
    • โปรแกรมตัวอย่างในหนังสือของพวกเขามีให้ทั้ง Common Lisp และ Python
  • นี่เป็นช่วงเวลาที่ดีที่จะกลับไปอ่าน The Bitter Lesson อีกครั้ง

  • Sutton เป็นพวกสืบทอดแนวคิดที่ให้มนุษย์ถูกแทนที่ และไม่สนใจแม้ว่ามนุษย์จะตายหมด เขาไม่น่าไว้วางใจและไม่ใช่คนที่ควรได้รับการเฉลิมฉลอง

  • คงจะดีกว่านี้ถ้าให้รางวัลกับนักฟิสิกส์

  • น่าแปลกที่ Sutton อาศัยอยู่ที่เอดมันตัน ประเทศแคนาดา แทนที่จะอยู่สหรัฐฯ

    • เรื่องนี้แสดงให้เห็นว่าเขาให้ความสำคัญกับความจริงใจและความซื่อสัตย์มากกว่าชื่อเสียงและเงินทอง
  • คนเหล่านี้ยอดเยี่ยม แต่โชคร้ายที่หนังสือ AI ของ Sutton และ Barto แย่มากจริง ๆ

    • Grokking Machine Learning ของ Trask กับการลงมือ implement งานวิจัย ML อยู่หลายเดือนน่าจะดีกว่า
  • ผมเคยใช้หนังสือ RL ของพวกเขาในวิชาที่ผมสอน

    • เขียนได้สวยงามและเปิดให้อ่านฟรี
    • ผมมักจะมัวแต่สนใจกับงานเขียนที่สวยงามจนพลาดเนื้อหาจริงไปบ่อย ๆ
  • ขอแสดงความยินดีอย่างจริงใจกับ Andrew Barto และ Richard Sutton สำหรับการได้รับรางวัล Turing Award

    • ตอนเป็นนักศึกษา หนังสือเรียนของพวกเขา Reinforcement Learning: An Introduction เป็นจุดเริ่มต้นที่พาผมเข้าสู่สาขานี้
    • บทที่ 6 ว่าด้วย 'Temporal Difference Learning' เปลี่ยนวิธีคิดของผมเกี่ยวกับการตัดสินใจแบบลำดับอย่างสิ้นเชิง
    • จนถึงทุกวันนี้ก็ยังเป็นงานคลาสสิกที่อยากแนะนำให้อ่านอย่างยิ่ง
  • เป็นสิ่งที่ใช้เวลานานมากกว่าจะมาถึงจุดนี้ พวกเขาผลักดันแนวคิดนี้ตั้งแต่ต้นจนจบ และขยายมันจากการเป็นเพียงหัวข้อย่อยในหนังสือ dynamic programming ให้กลายเป็นทั้งสาขา

    • อยากให้มีเกมที่ใช้ RL จริง ๆ มากกว่านี้ — นั่นคือจุดเริ่มต้นของทั้งหมดนี้ — คงจะเจ๋งมาก