สแตกของ AI Engineering
1. โครงสร้าง 3 ชั้นของสแตก AI Engineering: บริการ AI ทุกอย่างถูกสร้างขึ้นบน 3 ชั้นหลัก
1.1 การพัฒนาแอปพลิเคชัน (Application Development)
- การใช้ Foundation Model ทำให้ใครก็สามารถพัฒนาแอป AI ได้อย่างรวดเร็ว
- ความแตกต่างของบริการขึ้นอยู่กับการออกแบบพรอมป์ต์, UI/UX ของผู้ใช้, และระบบการประเมินผล
- เมื่อหลายทีมใช้โมเดลที่คล้ายกันมากขึ้น อินเทอร์เฟซที่เป็นมิตรต่อผู้ใช้ และ เครื่องมือประเมินผลอัตโนมัติ จึงยิ่งสำคัญ
1.2 การพัฒนาโมเดล (Model Development)
- มีความเชี่ยวชาญเฉพาะด้านมากขึ้น เช่น Fine-tuning, Inference Optimization, และ Dataset Engineering
- มีการใช้งานและปรับแต่งโมเดลขนาดใหญ่ รวมถึงการเกิดขึ้นของ LLM และโมเดลมัลติโหมดแบบโอเพนซอร์สที่หลากหลาย
- ความน่าเชื่อถือและคุณภาพเป็นหัวใจสำคัญ (เช่น การประเมินคำตอบแบบปลายเปิด, การควบคุมคุณภาพเลเบล)
1.3 โครงสร้างพื้นฐาน (Infrastructure)
- การดีพลอยโมเดล, การบริหารคลัสเตอร์ GPU ขนาดใหญ่, การสเกลบริการ, การมอนิเตอร์ และการรับมือเหตุขัดข้อง
- แม้ความเร็วของนวัตกรรมด้านอินฟราจะค่อนข้างช้ากว่า แต่มีผลอย่างมากต่อ ประสิทธิภาพและการควบคุมต้นทุน
2. AI Engineering vs ML Engineering: การเปลี่ยนแปลงเชิงแก่นแท้
2.1 วิธีการใช้งานโมเดล
- ML แบบเดิม: ฝึกโมเดลเองตั้งแต่ต้น (Machine Learning from scratch)
- AI ยุคใหม่: การเรียกใช้/นำโมเดลขนาดใหญ่ที่ผ่านการ pre-train มาแล้ว (using pre-trained models) กลายเป็นกระแสหลัก
- การประเมินผล (Evaluation) มีแนวโน้มสำคัญกว่าการพัฒนาโมเดลเอง (โดยเฉพาะการจัดการผลลัพธ์แบบ open-ended)
2.2 การเปลี่ยนแปลงด้านทรัพยากรและทักษะวิศวกรรม
- ความสามารถในการบริหารคลัสเตอร์ GPU ระดับหลายร้อยถึงหลายพันเครื่อง (Scalable GPU infrastructure)
- เมื่อต้องทำเป็นผลิตภัณฑ์สำหรับบริการจริง จำเป็นต้องมีการจัดการข้อมูลขนาดใหญ่และการใช้ทรัพยากรอย่างมีประสิทธิภาพสูง
2.3 นวัตกรรมด้านการประเมินผล (Evaluation)
- การประเมินแบบคำตอบสั้น (closed-ended) → ต้องการ ความสามารถในการรับมือผลลัพธ์แบบปลายเปิด (open-ended output)
- มีการพัฒนาระบบประเมินผลอัตโนมัติและกึ่งอัตโนมัติ (Auto evaluation system) อย่างคึกคัก
3. การปรับโมเดลให้เหมาะกับงาน: พรอมป์ต์ vs Fine-tuning
3.1 แบบอิงพรอมป์ต์ (Prompt-based)
- เปลี่ยนพฤติกรรมด้วยการออกแบบพรอมป์ต์ (Prompt Engineering) และการจัดการคอนเท็กซ์ (โดยไม่มีการเปลี่ยนพารามิเตอร์ภายในของโมเดล)
- ใช้ข้อมูลน้อย ทดลองได้เร็ว และต้นทุนต่ำ
- ข้อจำกัด: เมื่อเป็นงานยากหรือมีความซับซ้อนสูง ประสิทธิภาพจะลดลง
3.2 Fine-tuning
- ปรับเปลี่ยนน้ำหนักของโมเดลโดยตรง ต้องใช้ข้อมูลจำนวนมาก และเหมาะกับความต้องการด้านประสิทธิภาพสูง
- ต้นทุน/เวลาเพิ่มขึ้น แต่ในระยะยาวช่วยปรับปรุงทั้งคุณภาพบริการ ความเร็ว และต้นทุน
4. การแยกย่อยความหมายของ "การฝึก"
- Pre-training: การสร้าง Foundation Model ขนาดใหญ่ตั้งต้น ซึ่งมีเพียงบริษัท/องค์กรขนาดมหึมาบางแห่งเท่านั้นที่ทำได้
- Fine-tuning: การฝึกเฉพาะทางโดยอิงจากน้ำหนักของโมเดลเดิม เพื่อให้เหมาะกับปัญหาเฉพาะหรือข้อมูลของลูกค้า
- Post-training: แม้จะมีการใช้คำนี้ปะปนกัน แต่ในทางปฏิบัติมักครอบคลุมทั้ง Fine-tuning และการอัปเดตอย่างต่อเนื่อง
5. Dataset Engineering: การเปลี่ยนสถานะของข้อมูล
- เปลี่ยนไปเน้น ข้อมูลไม่มีโครงสร้าง (unstructured) เป็นหลัก (เช่น ข้อความ, รูปภาพ, มัลติโหมด)
- ความยากของการติดเลเบลเพิ่มขึ้น: ต้องมีความชำนาญอย่างมากในการรับมือผลลัพธ์แบบปลายเปิดที่คาดเดาไม่ได้
- แก่นของ ความแตกต่างในการแข่งขันของบริการกำลังย้ายไปอยู่ที่ข้อมูล: การมีชุดข้อมูลคุณภาพสูงคือความได้เปรียบในการแข่งขัน
- ความสำคัญของการดูแลคุณภาพข้อมูล จริยธรรม และความเป็นส่วนตัว (Privacy/Ethics) ก็เด่นชัดขึ้นเช่นกัน
6. เทรนด์การพัฒนาแอปพลิเคชัน AI
- หลายองค์กรใช้โมเดลเดียวกัน (Foundation Model) ทำให้
- Prompt Engineering (การออกแบบอินพุต)
- อินเทอร์เฟซผลิตภัณฑ์ (UI/UX, แชตบอต, เว็บส่วนขยาย ฯลฯ)
- การออกแบบลูปฟีดแบ็กจากผู้ใช้
กลายเป็นหัวใจสำคัญ
- การสร้างบริการ AI แบบเบา สำหรับ Edge และมือถือ กลายเป็นโอกาสใหม่
การเปลี่ยนแปลงของแนวทางการพัฒนา:
- เดิม: ออกแบบข้อมูล/โมเดล → ค่อยทำเป็นผลิตภัณฑ์ภายหลัง
- ปัจจุบัน: ทำต้นแบบผลิตภัณฑ์อย่างรวดเร็ว → ค่อยลงทุนด้านข้อมูล/โมเดลเมื่อจำเป็น (Product first, Model/Data later)
7. AI vs Full-stack Engineering: การสลายเส้นแบ่ง
- บทบาทของ นักพัฒนา Frontend และ Full-stack สายเว็บ/มือถือ กำลังขยายตัว
- ความสามารถในการผสาน AI เข้ากับอินเทอร์เฟซกลายเป็นความได้เปรียบในการแข่งขัน
- ในยุคของ Foundation Model + ปลั๊กอิน สามารถ เปิดตัวบริการ AI ได้ง่ายโดยไม่ต้องมีแบ็กเอนด์ซับซ้อน
- รูปแบบการใช้งาน: ทำต้นแบบอย่างรวดเร็ว → รับฟีดแบ็กผู้ใช้ → ปรับปรุงซ้ำอย่างต่อเนื่อง
8. บทสรุปและมุมมองอนาคต
- AI Engineering แม้จะต่อเนื่องมาจาก ML Engineering เดิม แต่ก็ต้องการความสามารถในการขยายระบบและนวัตกรรมในระดับที่ไม่เคยมีมาก่อน
- Foundation Model และระบบนิเวศ AI แบบโอเพนซอร์ส คือแกนหลักของการเปลี่ยนแปลง
- ในยุคข้อมูลล้นเกิน ความจำเป็นในการสร้าง framework ที่ชัดเจนและ best practices ยิ่งเพิ่มขึ้น
[ข้อมูลอ้างอิงและการสรุป]
- ต้นฉบับ: Chip Huyen, 『AI Engineering』
ยังไม่มีความคิดเห็น