2 คะแนน โดย GN⁺ 2025-01-29 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

กระบวนการนำแมชชีนเลิร์นนิงไปใช้จริงของมหาวิทยาลัยคาร์เนกีเมลลอน

  • ภาพรวมของหลักสูตร

    • หลักสูตรนี้ครอบคลุมวิธีสร้าง ปรับใช้ และดูแลรักษาโมเดลแมชชีนเลิร์นนิงให้เป็นผลิตภัณฑ์ซอฟต์แวร์
    • ครอบคลุมตลอดทั้งวงจรชีวิต รวมถึง Responsible AI, MLOps, ความปลอดภัย ความมั่นคงปลอดภัย ความเป็นธรรม และความสามารถในการอธิบายผลลัพธ์
    • เหมาะสำหรับนักศึกษาที่มีประสบการณ์ด้าน data science และมีทักษะการเขียนโปรแกรมพื้นฐาน
  • เป้าหมายของหลักสูตร

    • เรียนรู้วิธีเปลี่ยนโมเดลแมชชีนเลิร์นนิงให้เป็นผลิตภัณฑ์ รับประกันคุณภาพ และนำไปใช้งานพร้อมดูแลรักษาในระดับขนาดใหญ่
    • ส่งเสริมความร่วมมือระหว่างวิศวกรซอฟต์แวร์และนักวิทยาศาสตร์ข้อมูล เพื่อสร้างความเข้าใจร่วมกันที่จำเป็นต่อการพัฒนาระบบ ML
    • เหมาะสำหรับนักศึกษาที่กำลังพิจารณาเส้นทางอาชีพเป็น ML Engineer
  • หัวข้อสำคัญ

    • การออกแบบสำหรับกรณีที่การคาดการณ์ผิดพลาด และวิธีรับประกันความปลอดภัยกับความมั่นคงปลอดภัย
    • การออกแบบส่วนติดต่อผู้ใช้และระบบที่สามารถทำงานได้ในสภาพแวดล้อมจริง
    • วิธีการปรับใช้และอัปเดตโมเดลอย่างน่าเชื่อถือ
    • วิธีตรวจจับปัญหาคุณภาพข้อมูล, concept drift และ feedback loop
    • วิธีออกแบบและทดสอบระบบ ML ขนาดใหญ่
    • วิธีระบุและวัดข้อกำหนดด้านคุณภาพสำคัญของโมเดลนอกเหนือจากความแม่นยำของการคาดการณ์ เช่น ความเป็นธรรม ความสามารถในการอธิบายผล ความเป็นส่วนตัว ความทนทาน และความปลอดภัย
  • ผลลัพธ์การเรียนรู้

    • วิเคราะห์ trade-off เมื่อต้องออกแบบระบบ production ที่มีองค์ประกอบ ML
    • วางแผนรับมือความผิดพลาดขององค์ประกอบ ML และนำระบบที่ทนทานไปใช้งานจริง
    • ออกแบบ data infrastructure และออกแบบระบบสำหรับการทดลอง
    • รับประกันคุณภาพของ ML pipeline ทั้งหมด
    • คำนึงถึงข้อกำหนดระดับระบบเมื่อต้องสร้างผลิตภัณฑ์ ML ที่ซับซ้อน
    • สื่อสารได้อย่างมีประสิทธิภาพในทีมสหสาขาวิชา
  • ภาคปฏิบัติและโปรเจกต์

    • นักศึกษาจะเข้าร่วมโปรเจกต์สร้าง ปรับใช้ ประเมินผล และดูแลรักษาบริการแนะนำภาพยนตร์สำหรับผู้ใช้ 1 ล้านคน
  • การเรียนการสอนและภาคปฏิบัติ

    • การบรรยายจัดขึ้นในวันจันทร์และวันพุธ ส่วนภาคปฏิบัติจัดในวันศุกร์ตามช่วงเวลาต่าง ๆ
    • สามารถเข้าร่วมกิจกรรมระหว่างเรียนผ่าน Slack และวิดีโอบันทึกการบรรยายมีให้บน Canvas
  • การประเมินผลและงานที่มอบหมาย

    • ประเมินจากงานเดี่ยว โปรเจกต์กลุ่ม สอบกลางภาค การมีส่วนร่วม ภาคปฏิบัติ และแบบทดสอบจากการอ่าน
    • งานแต่ละชิ้นมีสเปกและสัดส่วนคะแนนที่ชัดเจน เพื่อให้นักศึกษาตั้งความคาดหวังได้อย่างชัดเจน
  • การทำงานเป็นทีมและความร่วมมือ

    • โปรเจกต์ทีมดำเนินการเป็นทีมละ 3-5 คน และการทำงานเป็นทีมถือเป็นสิ่งจำเป็น
    • แต่ละทีมทำงานอย่างอิสระ และสนับสนุนให้มีความร่วมมือกันภายในทีม
  • ข้อมูลอื่น ๆ

    • มีการแจ้งประกาศสำคัญผ่าน Slack และสามารถสอบถามได้ทางอีเมลและ Slack
    • เอกสารประกอบการเรียนเปิดเผยบน GitHub และมีให้สำหรับนักศึกษาที่ต้องการเรียนรู้ด้วยตนเองด้วย

หลักสูตรนี้มอบทักษะและความรู้ที่จำเป็นให้แก่นักศึกษาที่สนใจพัฒนาผลิตภัณฑ์ซอฟต์แวร์โดยใช้แมชชีนเลิร์นนิง พร้อมเปิดโอกาสให้สะสมประสบการณ์เชิงปฏิบัติผ่านกรณีศึกษาจริงและโปรเจกต์หลากหลายรูปแบบ

1 ความคิดเห็น

 
GN⁺ 2025-01-29
ความคิดเห็นจาก Hacker News
  • Kafka, Docker, Kubernetes และ Jenkins เป็นเครื่องมือมาตรฐานของอุตสาหกรรม และการเน้นไปที่ MLOps ก็ให้ความรู้สึกสดใหม่ ดีที่คอร์สนี้ไม่ได้หยุดแค่การสร้างโมเดล แต่พูดถึงการเชื่อมต่อกับระบบโปรดักชันจริงด้วย น่าประทับใจที่ยังครอบคลุมเรื่องความสามารถในการอธิบาย ความเป็นธรรม และการมอนิเตอร์ด้วย

    • หรือว่านี่เป็นระดับเริ่มต้น? ดูจากภาคปฏิบัติแล้ว มีหลายอย่างที่วิศวกรซอฟต์แวร์ระดับกลางหรือมือใหม่ที่มีแรงจูงใจก็น่าจะเรียนตามจากบทเรียนได้ Git, Flask และ container orchestration มีประโยชน์ แต่สำหรับคนที่เคยทำงานในสภาพแวดล้อมโปรดักชันมาแล้วก็ค่อนข้างพื้นฐาน ดูเหมือนว่าจะพูดถึงความท้าทายเชิงลึกอย่างการปรับแต่งเครือข่ายสำหรับ distributed training หรือการจัดการ inference ขนาดใหญ่ค่อนข้างน้อย ไม่แน่ใจว่าอาจจะไปอยู่ในโปรเจกต์กลุ่มหรือเปล่า
    • ยังสงสัยเหมือนกันว่าเครื่องมือที่ใช้จะเกี่ยวข้องในระยะยาวแค่ไหน Jenkins มีอยู่ทุกที่ก็จริง แต่ถ้าจะสอน CI/CD การแนะนำของที่ทันสมัยกว่าอย่าง GitHub Actions หรือ ArgoCD จะสมเหตุสมผลกว่าหรือไม่? แน่นอนว่า Kubernetes เป็นสิ่งที่ต้องรู้ แต่แล้วทางเลือกหรือเครื่องมือเสริมสำหรับการ deploy แบบ edge หรือระบบ serverless ล่ะ? รู้สึกว่าน่าจะมีโอกาสพาไปมองอนาคตได้มากกว่านี้อีกนิด
  • แทบไม่มีเนื้อหาเรื่องคุณภาพข้อมูลเลย และมันไปอยู่ถึงบทที่ 16... เลยสงสัยว่าผู้เขียนมีประสบการณ์ทำงานจริงในอุตสาหกรรมมากแค่ไหน เพราะเวลา 90% หมดไปกับคุณภาพข้อมูลและการจัดระเบียบข้อมูล

  • มีใครรู้จักเอกสารหรือคอร์สเกี่ยวกับการสร้างโครงสร้างพื้นฐานคลัสเตอร์แมชชีนเลิร์นนิงไหม? สนใจหลัก ๆ เรื่องการสร้างและขยายโครงสร้างพื้นฐานด้านสตอเรจ รวมถึงแนวทางด้านเครือข่ายและการจัดตารางงาน

  • สงสัยว่ามีที่ไหนให้คนที่ไม่ใช่นักศึกษาเรียนตามไปด้วยกันได้บ้างไหม

  • สงสัยว่าใคร ๆ ก็สมัครได้หรือว่าต้องเข้าเรียนในหลักสูตรวิทยาการคอมพิวเตอร์ชั้นนำของประเทศก่อน

  • ดีใจที่ได้เห็นคอร์สนี้ที่นี่ Christian เป็นคนที่ยอดเยี่ยมและทำงานได้ยอดเยี่ยม ผมรู้ที่มาที่ไปของคอร์สและหนังสือเล่มนี้ และแนะนำได้อย่างมาก

  • ทำงานด้านแพลตฟอร์มและระบบ ML มาทุกสเกลเป็นเวลา 9.5 ปีแล้ว เนื้อหาดูยอดเยี่ยมมาก

  • น่าสนใจ; ผมลองดูภาคปฏิบัติแล้ว ในฐานะฟูลสแตกดีเวลลอปเปอร์ที่ไม่ได้มีประสบการณ์กับ LLM มากนัก ครึ่งหนึ่งของเนื้อหาก็คุ้นเคยอยู่แล้ว (git, flask, kafka, kubernetes) ที่เหลือก็เป็นแค่โค้ด ไม่มีคณิตศาสตร์ซับซ้อนที่เกี่ยวกับ ML

    • หมายความว่า ML ops เป็นสาขาที่ดีเวลลอปเปอร์ทั่วไปเข้าถึงได้ ไม่ได้ยากมากจนต้องมี PhD ใช่ไหม?
  • ชอบแนวคิดของการเรียน "Kubernetis" แบบเดี่ยว ๆ

  • อาจจะกำลังประเมินความซับซ้อนของคอร์สต่ำไป แต่ฟังดูเหมือนคอร์สระดับเริ่มต้น เครื่องมืออธิบายโมเดลไปจนถึงเนื้อหาอื่น ๆ ส่วนใหญ่ดูค่อนข้างง่ายตามตรง ผมคิดว่าการใช้เครื่องมือมาตรฐานของอุตสาหกรรมสำหรับกรณีใช้งานส่วนใหญ่นั้นเป็นเรื่องที่ดี