สแตกของ AI Engineering

1. โครงสร้าง 3 ชั้นของสแตก AI Engineering: บริการ AI ทุกอย่างถูกสร้างขึ้นบน 3 ชั้นหลัก

1.1 การพัฒนาแอปพลิเคชัน (Application Development)

  • การใช้ Foundation Model ทำให้ใครก็สามารถพัฒนาแอป AI ได้อย่างรวดเร็ว
  • ความแตกต่างของบริการขึ้นอยู่กับการออกแบบพรอมป์ต์, UI/UX ของผู้ใช้, และระบบการประเมินผล
  • เมื่อหลายทีมใช้โมเดลที่คล้ายกันมากขึ้น อินเทอร์เฟซที่เป็นมิตรต่อผู้ใช้ และ เครื่องมือประเมินผลอัตโนมัติ จึงยิ่งสำคัญ

1.2 การพัฒนาโมเดล (Model Development)

  • มีความเชี่ยวชาญเฉพาะด้านมากขึ้น เช่น Fine-tuning, Inference Optimization, และ Dataset Engineering
  • มีการใช้งานและปรับแต่งโมเดลขนาดใหญ่ รวมถึงการเกิดขึ้นของ LLM และโมเดลมัลติโหมดแบบโอเพนซอร์สที่หลากหลาย
  • ความน่าเชื่อถือและคุณภาพเป็นหัวใจสำคัญ (เช่น การประเมินคำตอบแบบปลายเปิด, การควบคุมคุณภาพเลเบล)

1.3 โครงสร้างพื้นฐาน (Infrastructure)

  • การดีพลอยโมเดล, การบริหารคลัสเตอร์ GPU ขนาดใหญ่, การสเกลบริการ, การมอนิเตอร์ และการรับมือเหตุขัดข้อง
  • แม้ความเร็วของนวัตกรรมด้านอินฟราจะค่อนข้างช้ากว่า แต่มีผลอย่างมากต่อ ประสิทธิภาพและการควบคุมต้นทุน

2. AI Engineering vs ML Engineering: การเปลี่ยนแปลงเชิงแก่นแท้

2.1 วิธีการใช้งานโมเดล

  • ML แบบเดิม: ฝึกโมเดลเองตั้งแต่ต้น (Machine Learning from scratch)
  • AI ยุคใหม่: การเรียกใช้/นำโมเดลขนาดใหญ่ที่ผ่านการ pre-train มาแล้ว (using pre-trained models) กลายเป็นกระแสหลัก
  • การประเมินผล (Evaluation) มีแนวโน้มสำคัญกว่าการพัฒนาโมเดลเอง (โดยเฉพาะการจัดการผลลัพธ์แบบ open-ended)

2.2 การเปลี่ยนแปลงด้านทรัพยากรและทักษะวิศวกรรม

  • ความสามารถในการบริหารคลัสเตอร์ GPU ระดับหลายร้อยถึงหลายพันเครื่อง (Scalable GPU infrastructure)
  • เมื่อต้องทำเป็นผลิตภัณฑ์สำหรับบริการจริง จำเป็นต้องมีการจัดการข้อมูลขนาดใหญ่และการใช้ทรัพยากรอย่างมีประสิทธิภาพสูง

2.3 นวัตกรรมด้านการประเมินผล (Evaluation)

  • การประเมินแบบคำตอบสั้น (closed-ended) → ต้องการ ความสามารถในการรับมือผลลัพธ์แบบปลายเปิด (open-ended output)
  • มีการพัฒนาระบบประเมินผลอัตโนมัติและกึ่งอัตโนมัติ (Auto evaluation system) อย่างคึกคัก

3. การปรับโมเดลให้เหมาะกับงาน: พรอมป์ต์ vs Fine-tuning

3.1 แบบอิงพรอมป์ต์ (Prompt-based)

  • เปลี่ยนพฤติกรรมด้วยการออกแบบพรอมป์ต์ (Prompt Engineering) และการจัดการคอนเท็กซ์ (โดยไม่มีการเปลี่ยนพารามิเตอร์ภายในของโมเดล)
  • ใช้ข้อมูลน้อย ทดลองได้เร็ว และต้นทุนต่ำ
  • ข้อจำกัด: เมื่อเป็นงานยากหรือมีความซับซ้อนสูง ประสิทธิภาพจะลดลง

3.2 Fine-tuning

  • ปรับเปลี่ยนน้ำหนักของโมเดลโดยตรง ต้องใช้ข้อมูลจำนวนมาก และเหมาะกับความต้องการด้านประสิทธิภาพสูง
  • ต้นทุน/เวลาเพิ่มขึ้น แต่ในระยะยาวช่วยปรับปรุงทั้งคุณภาพบริการ ความเร็ว และต้นทุน

4. การแยกย่อยความหมายของ "การฝึก"

  • Pre-training: การสร้าง Foundation Model ขนาดใหญ่ตั้งต้น ซึ่งมีเพียงบริษัท/องค์กรขนาดมหึมาบางแห่งเท่านั้นที่ทำได้
  • Fine-tuning: การฝึกเฉพาะทางโดยอิงจากน้ำหนักของโมเดลเดิม เพื่อให้เหมาะกับปัญหาเฉพาะหรือข้อมูลของลูกค้า
  • Post-training: แม้จะมีการใช้คำนี้ปะปนกัน แต่ในทางปฏิบัติมักครอบคลุมทั้ง Fine-tuning และการอัปเดตอย่างต่อเนื่อง

5. Dataset Engineering: การเปลี่ยนสถานะของข้อมูล

  • เปลี่ยนไปเน้น ข้อมูลไม่มีโครงสร้าง (unstructured) เป็นหลัก (เช่น ข้อความ, รูปภาพ, มัลติโหมด)
  • ความยากของการติดเลเบลเพิ่มขึ้น: ต้องมีความชำนาญอย่างมากในการรับมือผลลัพธ์แบบปลายเปิดที่คาดเดาไม่ได้
  • แก่นของ ความแตกต่างในการแข่งขันของบริการกำลังย้ายไปอยู่ที่ข้อมูล: การมีชุดข้อมูลคุณภาพสูงคือความได้เปรียบในการแข่งขัน
  • ความสำคัญของการดูแลคุณภาพข้อมูล จริยธรรม และความเป็นส่วนตัว (Privacy/Ethics) ก็เด่นชัดขึ้นเช่นกัน

6. เทรนด์การพัฒนาแอปพลิเคชัน AI

  • หลายองค์กรใช้โมเดลเดียวกัน (Foundation Model) ทำให้
    • Prompt Engineering (การออกแบบอินพุต)
    • อินเทอร์เฟซผลิตภัณฑ์ (UI/UX, แชตบอต, เว็บส่วนขยาย ฯลฯ)
    • การออกแบบลูปฟีดแบ็กจากผู้ใช้
      กลายเป็นหัวใจสำคัญ
  • การสร้างบริการ AI แบบเบา สำหรับ Edge และมือถือ กลายเป็นโอกาสใหม่

การเปลี่ยนแปลงของแนวทางการพัฒนา:

  • เดิม: ออกแบบข้อมูล/โมเดล → ค่อยทำเป็นผลิตภัณฑ์ภายหลัง
  • ปัจจุบัน: ทำต้นแบบผลิตภัณฑ์อย่างรวดเร็ว → ค่อยลงทุนด้านข้อมูล/โมเดลเมื่อจำเป็น (Product first, Model/Data later)

7. AI vs Full-stack Engineering: การสลายเส้นแบ่ง

  • บทบาทของ นักพัฒนา Frontend และ Full-stack สายเว็บ/มือถือ กำลังขยายตัว
    • ความสามารถในการผสาน AI เข้ากับอินเทอร์เฟซกลายเป็นความได้เปรียบในการแข่งขัน
  • ในยุคของ Foundation Model + ปลั๊กอิน สามารถ เปิดตัวบริการ AI ได้ง่ายโดยไม่ต้องมีแบ็กเอนด์ซับซ้อน
  • รูปแบบการใช้งาน: ทำต้นแบบอย่างรวดเร็ว → รับฟีดแบ็กผู้ใช้ → ปรับปรุงซ้ำอย่างต่อเนื่อง

8. บทสรุปและมุมมองอนาคต

  • AI Engineering แม้จะต่อเนื่องมาจาก ML Engineering เดิม แต่ก็ต้องการความสามารถในการขยายระบบและนวัตกรรมในระดับที่ไม่เคยมีมาก่อน
  • Foundation Model และระบบนิเวศ AI แบบโอเพนซอร์ส คือแกนหลักของการเปลี่ยนแปลง
  • ในยุคข้อมูลล้นเกิน ความจำเป็นในการสร้าง framework ที่ชัดเจนและ best practices ยิ่งเพิ่มขึ้น

[ข้อมูลอ้างอิงและการสรุป]

  • ต้นฉบับ: Chip Huyen, 『AI Engineering』

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น