MIT 6.S184: บทนำสู่ Flow Matching และ Diffusion Models
(diffusion.csail.mit.edu)บทนำสู่ Flow Matching และ Diffusion Models
- วิชา 6.S184 ของ MIT เป็นคอร์สด้าน Generative AI ที่ใช้สมการเชิงอนุพันธ์สุ่ม
- โมเดลแบบ diffusion และ flow-based ได้กลายเป็นเทคโนโลยีล้ำสมัยของ Generative AI สำหรับข้อมูลหลายโมดาลิตี เช่น ภาพ วิดีโอ และดนตรี
- คอร์สนี้มีเป้าหมายเพื่อปูพื้นฐานทางคณิตศาสตร์ของโมเดลเหล่านี้ตั้งแต่ต้น และเมื่อเรียนจบ นักศึกษาจะได้สร้างโมเดล diffusion สำหรับภาพแบบของเล่นด้วยตนเอง
- หลักสูตรนี้เหมาะอย่างยิ่งสำหรับนักศึกษาที่ต้องการเข้าใจทั้งทฤษฎีและภาคปฏิบัติของ Generative AI อย่างเป็นระบบ
เอกสารประกอบการบรรยาย
- เอกสารประกอบการบรรยายเป็นแกนหลักของคอร์ส และให้คำอธิบายที่สมบูรณ์ในตัวสำหรับเนื้อหาทั้งหมด
- สไลด์การบรรยายจัดไว้เป็นสื่อช่วยด้านภาพ และไม่ใช่เอกสารที่สมบูรณ์ในตัว
บทเรียน
-
บทที่ 1: โมเดล flow และ diffusion
- บทนำสู่โมเดลเชิงกำเนิด
- สมการเชิงอนุพันธ์ทั่วไปและสมการเชิงอนุพันธ์สุ่ม
- การสุ่มตัวอย่างในโมเดล flow และ diffusion
-
บทที่ 2: การสร้างวัตถุประสงค์การฝึก
- เส้นทางความน่าจะเป็นแบบมีเงื่อนไขและแบบมาร์จินัล
- สมการความต่อเนื่องและสมการ Fokker-Planck
- เวกเตอร์ฟิลด์แบบมาร์จินัลและฟังก์ชันคะแนนแบบมาร์จินัล
-
บทที่ 3: การฝึกโมเดล flow และ diffusion
- Flow Matching
- Score Matching
- แนวทางต่าง ๆ ของ diffusion models
-
บทที่ 4: การสร้างตัวสร้างภาพ
- การกำกับและการสร้างแบบมีเงื่อนไข
- สถาปัตยกรรมโครงข่ายประสาท
- สำรวจโมเดลล้ำสมัย
-
บทที่ 5: Generative Robotics
- บรรยายรับเชิญโดย Benjamin Burchfiel
- Large Behavior Models
- diffusion models สำหรับหุ่นยนต์
-
บทที่ 6: การออกแบบโปรตีนเชิงกำเนิด
- บรรยายรับเชิญโดย Jason Yim
- การออกแบบโปรตีนใหม่ด้วย AI
- Flow Matching สำหรับการสร้างโครงสร้างโปรตีน
แบบฝึกปฏิบัติ
- คอร์สนี้มีแบบฝึกปฏิบัติ 3 ชุดที่ให้ผู้เรียนค่อย ๆ สร้างโมเดล Flow Matching และ diffusion ทีละขั้นตอน
- สามารถเปิดและทำแบบฝึกปฏิบัติบน Google Colab ได้
ผู้สอน
- Peter และ Ezra เป็นผู้สอนร่วม โดยมี Tommi Jaakkola ทำหน้าที่เป็นผู้สนับสนุนและที่ปรึกษา
- Peter Holderrieth เป็นนักศึกษาปริญญาเอก และ Ezra Erives เป็นนักศึกษาปริญญาโทวิศวกรรมศาสตร์
ข้อกำหนดเบื้องต้น
- ต้องมีพื้นฐานด้านพีชคณิตเชิงเส้น การวิเคราะห์เชิงจริง และทฤษฎีความน่าจะเป็นเบื้องต้น รวมถึงมีประสบการณ์กับ Python และ PyTorch
ข้อควรทราบ
- คอร์สนี้ไม่ได้ครอบคลุม Large Language Models (LLM) โดย LLM เกี่ยวข้องกับข้อมูลไม่ต่อเนื่อง เช่น ข้อความ แต่คอร์สนี้มุ่งเน้นข้อมูลในปริภูมิต่อเนื่อง เช่น ภาพ วิดีโอ และโครงสร้างโปรตีน
คำขอบคุณ
- คอร์สนี้คงเกิดขึ้นไม่ได้หากปราศจากการสนับสนุนจากบุคคลและองค์กรจำนวนมาก
- ขอขอบคุณศาสตราจารย์ Tommi Jaakkola, Lisa Bella และ Ellen Reid จาก MIT EECS ตลอดจนอีกหลายท่าน
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
คลาสของ MIT "6.S184: Introduction to Flow Matching and Diffusion Models" ถูกเผยแพร่บน YouTube
conditional normalizing flows เป็นหนึ่งในวิธีแก้ปัญหา inverse design ที่สวยงามที่สุดวิธีหนึ่ง
ช่วง 10 ปีที่ผ่านมาเป็นยุคทองของการศึกษาด้าน deep learning
เป็นคอร์สที่ยอดเยี่ยม อยากเรียนให้เร็วที่สุด
สงสัยว่ามีคอลเลกชันที่รวบรวมคอร์สสาธารณะทั้งหมดเกี่ยวกับเทคโนโลยี AI ล่าสุดหรือไม่
ขอบคุณ MIT OCW และผู้ร่วมงานอย่างมาก
ดูเหมือนว่า LLMs จะดึงความสนใจไปมาก ทั้งที่เทคโนโลยีนี้มีประโยชน์อย่างยิ่ง
เป็นเรื่องยอดเยี่ยมที่ MIT มอบคอนเทนต์ที่ทันเวลาและเกี่ยวข้องให้ฟรี
ขอบคุณมากจริงๆ สงสัยว่ามีคอร์ส OCW อื่นเกี่ยวกับ AI สมัยใหม่อีกหรือไม่
ทำได้ดีมาก ขอแสดงความยินดี