Machine Learning ในสภาพแวดล้อมการใช้งานจริง (คอร์สของ CMU)
(mlip-cmu.github.io)กระบวนการนำแมชชีนเลิร์นนิงไปใช้จริงของมหาวิทยาลัยคาร์เนกีเมลลอน
-
ภาพรวมของหลักสูตร
- หลักสูตรนี้ครอบคลุมวิธีสร้าง ปรับใช้ และดูแลรักษาโมเดลแมชชีนเลิร์นนิงให้เป็นผลิตภัณฑ์ซอฟต์แวร์
- ครอบคลุมตลอดทั้งวงจรชีวิต รวมถึง Responsible AI, MLOps, ความปลอดภัย ความมั่นคงปลอดภัย ความเป็นธรรม และความสามารถในการอธิบายผลลัพธ์
- เหมาะสำหรับนักศึกษาที่มีประสบการณ์ด้าน data science และมีทักษะการเขียนโปรแกรมพื้นฐาน
-
เป้าหมายของหลักสูตร
- เรียนรู้วิธีเปลี่ยนโมเดลแมชชีนเลิร์นนิงให้เป็นผลิตภัณฑ์ รับประกันคุณภาพ และนำไปใช้งานพร้อมดูแลรักษาในระดับขนาดใหญ่
- ส่งเสริมความร่วมมือระหว่างวิศวกรซอฟต์แวร์และนักวิทยาศาสตร์ข้อมูล เพื่อสร้างความเข้าใจร่วมกันที่จำเป็นต่อการพัฒนาระบบ ML
- เหมาะสำหรับนักศึกษาที่กำลังพิจารณาเส้นทางอาชีพเป็น ML Engineer
-
หัวข้อสำคัญ
- การออกแบบสำหรับกรณีที่การคาดการณ์ผิดพลาด และวิธีรับประกันความปลอดภัยกับความมั่นคงปลอดภัย
- การออกแบบส่วนติดต่อผู้ใช้และระบบที่สามารถทำงานได้ในสภาพแวดล้อมจริง
- วิธีการปรับใช้และอัปเดตโมเดลอย่างน่าเชื่อถือ
- วิธีตรวจจับปัญหาคุณภาพข้อมูล, concept drift และ feedback loop
- วิธีออกแบบและทดสอบระบบ ML ขนาดใหญ่
- วิธีระบุและวัดข้อกำหนดด้านคุณภาพสำคัญของโมเดลนอกเหนือจากความแม่นยำของการคาดการณ์ เช่น ความเป็นธรรม ความสามารถในการอธิบายผล ความเป็นส่วนตัว ความทนทาน และความปลอดภัย
-
ผลลัพธ์การเรียนรู้
- วิเคราะห์ trade-off เมื่อต้องออกแบบระบบ production ที่มีองค์ประกอบ ML
- วางแผนรับมือความผิดพลาดขององค์ประกอบ ML และนำระบบที่ทนทานไปใช้งานจริง
- ออกแบบ data infrastructure และออกแบบระบบสำหรับการทดลอง
- รับประกันคุณภาพของ ML pipeline ทั้งหมด
- คำนึงถึงข้อกำหนดระดับระบบเมื่อต้องสร้างผลิตภัณฑ์ ML ที่ซับซ้อน
- สื่อสารได้อย่างมีประสิทธิภาพในทีมสหสาขาวิชา
-
ภาคปฏิบัติและโปรเจกต์
- นักศึกษาจะเข้าร่วมโปรเจกต์สร้าง ปรับใช้ ประเมินผล และดูแลรักษาบริการแนะนำภาพยนตร์สำหรับผู้ใช้ 1 ล้านคน
-
การเรียนการสอนและภาคปฏิบัติ
- การบรรยายจัดขึ้นในวันจันทร์และวันพุธ ส่วนภาคปฏิบัติจัดในวันศุกร์ตามช่วงเวลาต่าง ๆ
- สามารถเข้าร่วมกิจกรรมระหว่างเรียนผ่าน Slack และวิดีโอบันทึกการบรรยายมีให้บน Canvas
-
การประเมินผลและงานที่มอบหมาย
- ประเมินจากงานเดี่ยว โปรเจกต์กลุ่ม สอบกลางภาค การมีส่วนร่วม ภาคปฏิบัติ และแบบทดสอบจากการอ่าน
- งานแต่ละชิ้นมีสเปกและสัดส่วนคะแนนที่ชัดเจน เพื่อให้นักศึกษาตั้งความคาดหวังได้อย่างชัดเจน
-
การทำงานเป็นทีมและความร่วมมือ
- โปรเจกต์ทีมดำเนินการเป็นทีมละ 3-5 คน และการทำงานเป็นทีมถือเป็นสิ่งจำเป็น
- แต่ละทีมทำงานอย่างอิสระ และสนับสนุนให้มีความร่วมมือกันภายในทีม
-
ข้อมูลอื่น ๆ
- มีการแจ้งประกาศสำคัญผ่าน Slack และสามารถสอบถามได้ทางอีเมลและ Slack
- เอกสารประกอบการเรียนเปิดเผยบน GitHub และมีให้สำหรับนักศึกษาที่ต้องการเรียนรู้ด้วยตนเองด้วย
หลักสูตรนี้มอบทักษะและความรู้ที่จำเป็นให้แก่นักศึกษาที่สนใจพัฒนาผลิตภัณฑ์ซอฟต์แวร์โดยใช้แมชชีนเลิร์นนิง พร้อมเปิดโอกาสให้สะสมประสบการณ์เชิงปฏิบัติผ่านกรณีศึกษาจริงและโปรเจกต์หลากหลายรูปแบบ
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
Kafka, Docker, Kubernetes และ Jenkins เป็นเครื่องมือมาตรฐานของอุตสาหกรรม และการเน้นไปที่ MLOps ก็ให้ความรู้สึกสดใหม่ ดีที่คอร์สนี้ไม่ได้หยุดแค่การสร้างโมเดล แต่พูดถึงการเชื่อมต่อกับระบบโปรดักชันจริงด้วย น่าประทับใจที่ยังครอบคลุมเรื่องความสามารถในการอธิบาย ความเป็นธรรม และการมอนิเตอร์ด้วย
แทบไม่มีเนื้อหาเรื่องคุณภาพข้อมูลเลย และมันไปอยู่ถึงบทที่ 16... เลยสงสัยว่าผู้เขียนมีประสบการณ์ทำงานจริงในอุตสาหกรรมมากแค่ไหน เพราะเวลา 90% หมดไปกับคุณภาพข้อมูลและการจัดระเบียบข้อมูล
มีใครรู้จักเอกสารหรือคอร์สเกี่ยวกับการสร้างโครงสร้างพื้นฐานคลัสเตอร์แมชชีนเลิร์นนิงไหม? สนใจหลัก ๆ เรื่องการสร้างและขยายโครงสร้างพื้นฐานด้านสตอเรจ รวมถึงแนวทางด้านเครือข่ายและการจัดตารางงาน
สงสัยว่ามีที่ไหนให้คนที่ไม่ใช่นักศึกษาเรียนตามไปด้วยกันได้บ้างไหม
สงสัยว่าใคร ๆ ก็สมัครได้หรือว่าต้องเข้าเรียนในหลักสูตรวิทยาการคอมพิวเตอร์ชั้นนำของประเทศก่อน
ดีใจที่ได้เห็นคอร์สนี้ที่นี่ Christian เป็นคนที่ยอดเยี่ยมและทำงานได้ยอดเยี่ยม ผมรู้ที่มาที่ไปของคอร์สและหนังสือเล่มนี้ และแนะนำได้อย่างมาก
ทำงานด้านแพลตฟอร์มและระบบ ML มาทุกสเกลเป็นเวลา 9.5 ปีแล้ว เนื้อหาดูยอดเยี่ยมมาก
น่าสนใจ; ผมลองดูภาคปฏิบัติแล้ว ในฐานะฟูลสแตกดีเวลลอปเปอร์ที่ไม่ได้มีประสบการณ์กับ LLM มากนัก ครึ่งหนึ่งของเนื้อหาก็คุ้นเคยอยู่แล้ว (git, flask, kafka, kubernetes) ที่เหลือก็เป็นแค่โค้ด ไม่มีคณิตศาสตร์ซับซ้อนที่เกี่ยวกับ ML
ชอบแนวคิดของการเรียน "Kubernetis" แบบเดี่ยว ๆ
อาจจะกำลังประเมินความซับซ้อนของคอร์สต่ำไป แต่ฟังดูเหมือนคอร์สระดับเริ่มต้น เครื่องมืออธิบายโมเดลไปจนถึงเนื้อหาอื่น ๆ ส่วนใหญ่ดูค่อนข้างง่ายตามตรง ผมคิดว่าการใช้เครื่องมือมาตรฐานของอุตสาหกรรมสำหรับกรณีใช้งานส่วนใหญ่นั้นเป็นเรื่องที่ดี