เทคโนโลยีปัญญาประดิษฐ์เชิงความน่าจะเป็น
(arxiv.org)ปัญญาประดิษฐ์เชิงความน่าจะเป็น
-
ปัญญาประดิษฐ์หมายถึงศาสตร์และวิศวกรรมของระบบประดิษฐ์ที่สามารถทำงานซึ่งต้องอาศัยสติปัญญาของมนุษย์ได้ ในช่วงไม่กี่ปีที่ผ่านมา มีความก้าวหน้าที่น่าสนใจในแนวทางที่ขับเคลื่อนด้วยข้อมูลและอิงการเรียนรู้ โดย machine learning และ deep learning ทำให้ระบบคอมพิวเตอร์สามารถรับรู้โลกได้ในรูปแบบใหม่ Reinforcement learning ได้สร้างความก้าวหน้าแบบก้าวกระโดดในเกมที่ซับซ้อนอย่างโกะและในงานด้านหุ่นยนต์
-
แก่นสำคัญของความฉลาดไม่ได้มีเพียงการคาดการณ์เท่านั้น แต่ยังรวมถึงการเข้าใจความไม่แน่นอนของการคาดการณ์เหล่านี้ และการนำความไม่แน่นอนดังกล่าวมาพิจารณาเมื่อทำการตัดสินใจ บทความนี้ว่าด้วย "ปัญญาประดิษฐ์เชิงความน่าจะเป็น"
แนวทางเชิงความน่าจะเป็น
- ในส่วนแรกกล่าวถึงแนวทางเชิงความน่าจะเป็นต่อ machine learning โดยอภิปรายความแตกต่างระหว่างความไม่แน่นอนแบบ "epistemic" ที่เกิดจากข้อมูลไม่เพียงพอ กับความไม่แน่นอนแบบ "aleatoric" ที่เกิดจากตัวอย่างเช่น การสังเกตและผลลัพธ์ที่มีสัญญาณรบกวน นอกจากนี้ยังกล่าวถึงแนวทางที่เป็นรูปธรรมสำหรับการอนุมานเชิงความน่าจะเป็น และแนวทางสมัยใหม่สำหรับการอนุมานแบบประมาณอย่างมีประสิทธิภาพ
การพิจารณาความไม่แน่นอนในงานตัดสินใจแบบลำดับ
- ในส่วนที่สองกล่าวถึงการพิจารณาความไม่แน่นอนในงานตัดสินใจแบบลำดับ โดยพิจารณา active learning และ Bayesian optimization ซึ่งเป็นแนวทางในการเก็บรวบรวมข้อมูลด้วยการเสนอการทดลองที่ให้ข้อมูลเพื่อช่วยลดความไม่แน่นอนแบบ epistemic นอกจากนี้ยังพิจารณา reinforcement learning และแนวทาง deep RL สมัยใหม่ที่ใช้การประมาณฟังก์ชันด้วยโครงข่ายประสาทเทียม พร้อมทั้งอภิปรายแนวทางสมัยใหม่ของ model-based RL ซึ่งใช้ประโยชน์จากความไม่แน่นอนแบบ epistemic และ aleatoric เพื่อชี้นำการสำรวจและคำนึงถึงความปลอดภัย
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ในบทความมีไดอะแกรมอธิบายที่ยอดเยี่ยม และดูเหมือนจะเป็นภาพรวมของแมชชีนเลิร์นนิงจากมุมมองของความน่าจะเป็นที่มีคุณภาพสูง
เจอเนื้อหานี้เมื่อไม่กี่วันก่อน และกำลังหาข้ออ้างที่จะดูมันอย่างจริงจัง เพราะ Andreas Krause ทำงานวิจัยเชิงลึกและน่าสนใจเกี่ยวกับ Gaussian Processes และ Bandits
ความเป็นจริงเชิงภาวะมีอยู่ในรูปของการกระจายศักย์ ไม่ใช่อาร์เรย์ของสถานะ
มีคำถามว่า LLM (กล่าวคือ โครงข่ายประสาทเทียม) สามารถบอกความน่าจะเป็นของคำตอบที่มันเพิ่งพ่นออกมาได้หรือไม่
คิดว่าเราต้องมี GUI เพื่อทำให้การตีความโมเดลเป็นประชาธิปไตยมากขึ้น และให้เหล่าเกมเมอร์เข้ามาสำรวจได้ด้วย
คิดว่า Gaussian Processes ที่มีเคอร์เนลเหมาะสมทรงพลังมาก แม้ใช้ข้อมูลเพียงไม่กี่จุดและชุดพารามิเตอร์ขนาดเล็ก
ดูเหมือนจะทับซ้อนบางส่วนกับแหล่งอ้างอิงที่ดีที่สุดเกี่ยวกับหัวข้อนี้ กล่าวถึง "An Introduction to Statistical Learning" ของ Gareth James และคณะ
Kevin Murphy กำลังเปลี่ยนชื่อซีรีส์ Probabilistic Machine Learning ของเขา
Gemini 2.0 Experimental 02-05 มองสิ่งนี้เป็น "แค่" 107K โทเค็น
Laplace Approximation เป็นวิธี "เร็วและง่าย" ในการแปลงการกระจายความน่าจะเป็นที่ซับซ้อนให้เป็น Gaussian (เส้นโค้งระฆัง) แบบง่าย
เคยเรียนวิชานี้ที่ ETH Zurich และเป็นหนึ่งในวิชาที่ชอบที่สุด