1 คะแนน โดย GN⁺ 2025-03-12 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ปัญญาประดิษฐ์เชิงความน่าจะเป็น

  • ปัญญาประดิษฐ์หมายถึงศาสตร์และวิศวกรรมของระบบประดิษฐ์ที่สามารถทำงานซึ่งต้องอาศัยสติปัญญาของมนุษย์ได้ ในช่วงไม่กี่ปีที่ผ่านมา มีความก้าวหน้าที่น่าสนใจในแนวทางที่ขับเคลื่อนด้วยข้อมูลและอิงการเรียนรู้ โดย machine learning และ deep learning ทำให้ระบบคอมพิวเตอร์สามารถรับรู้โลกได้ในรูปแบบใหม่ Reinforcement learning ได้สร้างความก้าวหน้าแบบก้าวกระโดดในเกมที่ซับซ้อนอย่างโกะและในงานด้านหุ่นยนต์

  • แก่นสำคัญของความฉลาดไม่ได้มีเพียงการคาดการณ์เท่านั้น แต่ยังรวมถึงการเข้าใจความไม่แน่นอนของการคาดการณ์เหล่านี้ และการนำความไม่แน่นอนดังกล่าวมาพิจารณาเมื่อทำการตัดสินใจ บทความนี้ว่าด้วย "ปัญญาประดิษฐ์เชิงความน่าจะเป็น"

แนวทางเชิงความน่าจะเป็น

  • ในส่วนแรกกล่าวถึงแนวทางเชิงความน่าจะเป็นต่อ machine learning โดยอภิปรายความแตกต่างระหว่างความไม่แน่นอนแบบ "epistemic" ที่เกิดจากข้อมูลไม่เพียงพอ กับความไม่แน่นอนแบบ "aleatoric" ที่เกิดจากตัวอย่างเช่น การสังเกตและผลลัพธ์ที่มีสัญญาณรบกวน นอกจากนี้ยังกล่าวถึงแนวทางที่เป็นรูปธรรมสำหรับการอนุมานเชิงความน่าจะเป็น และแนวทางสมัยใหม่สำหรับการอนุมานแบบประมาณอย่างมีประสิทธิภาพ

การพิจารณาความไม่แน่นอนในงานตัดสินใจแบบลำดับ

  • ในส่วนที่สองกล่าวถึงการพิจารณาความไม่แน่นอนในงานตัดสินใจแบบลำดับ โดยพิจารณา active learning และ Bayesian optimization ซึ่งเป็นแนวทางในการเก็บรวบรวมข้อมูลด้วยการเสนอการทดลองที่ให้ข้อมูลเพื่อช่วยลดความไม่แน่นอนแบบ epistemic นอกจากนี้ยังพิจารณา reinforcement learning และแนวทาง deep RL สมัยใหม่ที่ใช้การประมาณฟังก์ชันด้วยโครงข่ายประสาทเทียม พร้อมทั้งอภิปรายแนวทางสมัยใหม่ของ model-based RL ซึ่งใช้ประโยชน์จากความไม่แน่นอนแบบ epistemic และ aleatoric เพื่อชี้นำการสำรวจและคำนึงถึงความปลอดภัย

1 ความคิดเห็น

 
GN⁺ 2025-03-12
ความคิดเห็นจาก Hacker News
  • ในบทความมีไดอะแกรมอธิบายที่ยอดเยี่ยม และดูเหมือนจะเป็นภาพรวมของแมชชีนเลิร์นนิงจากมุมมองของความน่าจะเป็นที่มีคุณภาพสูง

    • ไม่นานมานี้ประทับใจกับตำราเรียนฟรีและวิดีโอบรรยายบน YouTube ของ Zhao ชื่อ "Mathematical Foundation of Reinforcement Learning" มาก
    • ถ้ามีเวลาไม่มาก แนะนำให้ลองไล่ดูไดอะแกรมสรุปเนื้อหาของ Zhao สักรอบ เพราะเป็นแผนที่เชิงแนวคิดที่ดีของทั้งสาขา
    • และแนะนำให้ดูวิดีโอแนะนำด้วย
  • เจอเนื้อหานี้เมื่อไม่กี่วันก่อน และกำลังหาข้ออ้างที่จะดูมันอย่างจริงจัง เพราะ Andreas Krause ทำงานวิจัยเชิงลึกและน่าสนใจเกี่ยวกับ Gaussian Processes และ Bandits

  • ความเป็นจริงเชิงภาวะมีอยู่ในรูปของการกระจายศักย์ ไม่ใช่อาร์เรย์ของสถานะ

    • ศักย์มีอยู่จริง และความน่าจะเป็นคือคำอธิบายทางคณิตศาสตร์ของการกระจายนั้น คุณสมบัติทั้งหมดคือมิติ (เวกเตอร์)
    • สถานะเป็นเพียงการวัดชั่วขณะของการคลี่คลาย ศักย์มีปฏิสัมพันธ์กันผ่านการแทรกสอดแบบเสริมกันและหักล้างกัน
    • การแทรกสอดแบบเสริมกันและหักล้างกันจะถูกคลี่คลายออกมาเป็นสถานะของ "ตอนนี้" ในฐานะการวัดชั่วขณะ
  • มีคำถามว่า LLM (กล่าวคือ โครงข่ายประสาทเทียม) สามารถบอกความน่าจะเป็นของคำตอบที่มันเพิ่งพ่นออกมาได้หรือไม่

    • สมัยเรียนมหาวิทยาลัยนานมาแล้วเคยเรียนเรื่องพวกนี้ และเคยสร้างตัวแปลความ Prolog ที่มีค่าความน่าจะเป็นและค่าสัมประสิทธิ์ความเชื่อมั่นสำหรับแต่ละเทอม
  • คิดว่าเราต้องมี GUI เพื่อทำให้การตีความโมเดลเป็นประชาธิปไตยมากขึ้น และให้เหล่าเกมเมอร์เข้ามาสำรวจได้ด้วย

    • โดยพื้นฐานคือฝึกอีกโมเดลหนึ่งให้แปลง LLM เป็นรูปแบบ 3D แล้ววางมันไว้ในโลก 3D ที่มนุษย์เข้าใจได้
    • ตัวอย่างง่าย ๆ คือแสดง LLM เป็นทุ่งหญ้าสีเขียวกับวัตถุต่าง ๆ และตั้งให้มนุษย์เป็นเอเจนต์เพียงหนึ่งเดียว
  • คิดว่า Gaussian Processes ที่มีเคอร์เนลเหมาะสมทรงพลังมาก แม้ใช้ข้อมูลเพียงไม่กี่จุดและชุดพารามิเตอร์ขนาดเล็ก

    • เคยใช้มันในงานคอมพิวเตอร์วิทัศน์เป็นกระบวนการไม่เชิงเส้นที่คาดเดาได้สำหรับปรับอินพุต และผลลัพธ์ดีมาก
  • ดูเหมือนจะทับซ้อนบางส่วนกับแหล่งอ้างอิงที่ดีที่สุดเกี่ยวกับหัวข้อนี้ กล่าวถึง "An Introduction to Statistical Learning" ของ Gareth James และคณะ

    • สงสัยว่าเนื้อหานี้จะเข้าถึงง่ายกว่าหรือไม่ และตัวอย่าง R/Python น่าจะช่วยได้
  • Kevin Murphy กำลังเปลี่ยนชื่อซีรีส์ Probabilistic Machine Learning ของเขา

  • Gemini 2.0 Experimental 02-05 มองสิ่งนี้เป็น "แค่" 107K โทเค็น

    • ถ้าต้องการความช่วยเหลือในการแยกย่อยมัน ก็อาจมีประโยชน์
  • Laplace Approximation เป็นวิธี "เร็วและง่าย" ในการแปลงการกระจายความน่าจะเป็นที่ซับซ้อนให้เป็น Gaussian (เส้นโค้งระฆัง) แบบง่าย

    • มันทำงานโดยหาจุดสูงสุดแล้วปรับความโค้งให้ตรงกับจุดนั้น
    • มันเร็วและง่าย แต่ถ้าการกระจายจริงไม่เหมือนเส้นโค้งระฆัง ก็อาจคลาดเคลื่อนมากและมั่นใจเกินไปได้
  • เคยเรียนวิชานี้ที่ ETH Zurich และเป็นหนึ่งในวิชาที่ชอบที่สุด

    • ประทับใจเป็นพิเศษกับวิธีการทำให้ความไม่แน่นอนวัดเชิงปริมาณได้ และวิธีสร้างบล็อกตั้งต้นของการเรียนรู้แบบเสริมกำลัง
    • เป็นเอกสารอ่านที่ยอดเยี่ยมสำหรับนักวิทยาศาสตร์ข้อมูลและวิศวกร ML เอกสารนี้คือบันทึกการบรรยาย