ความต้องการโครงสร้างพื้นฐานของ AI workload
- AI workload ทำให้ การประมวลผล, การจัดเก็บ, และ เครือข่าย ตกภาระในลักษณะที่ทีมไอทีส่วนใหญ่ไม่คาดคิด
- เมื่อองค์กรจำนวนมากเริ่มต้น เส้นทาง AI ขององค์กร จะให้ความสำคัญกับค่าใช้จ่ายที่เห็นได้ชัดเจน เช่น ค่าลิขสิทธิ์, บริการที่ปรึกษา, และ บุคลากร
- อย่างไรก็ตาม ความต้องการโครงสร้างพื้นฐาน เพื่อรองรับ AI workload แม้ไม่ค่อยปรากฏต่อสายตา แต่กลับเป็น ศูนย์ต้นทุนที่สำคัญไม่แพ้กัน
- การนำ AI ไปใช้งาน สร้างผลกระทบต่อระบบนิเวศเทคโนโลยีทั้งหมด และทำให้เกิดปัญหาที่ไม่สามารถคาดการณ์ได้ด้วย กรอบการวางแผนความจุแบบดั้งเดิม
ข้อจำกัดของการวางแผน IT แบบดั้งเดิม
- AI workload ต่างจาก รูปแบบการใช้ทรัพยากร ของแอปพลิเคชันองค์กรแบบดั้งเดิมในเชิงพื้นฐาน
- รูปแบบการใช้งานที่คาดเดาได้ยาก:
- การวางแผนความจุแบบดั้งเดิมมักสมมติว่าการใช้งานค่อนข้างคาดเดาได้ แต่ AI workload อาจขยายตัวแบบก้าวกระโดดตามกำลังเมื่อการยอมรับเพิ่มขึ้น
- กรณีการใช้ AI ที่ประสบความสำเร็จจะแพร่กระจายไปทั่วแผนกอย่างรวดเร็ว และการนำไปใช้ใหม่แต่ละครั้งต้องใช้ทรัพยากรการคำนวณเพิ่มขึ้น
- การมาของ เอเจนต์ AI อิสระ ทำให้เกิดพลวัตด้านต้นทุนรูปแบบใหม่ที่การวางแผนแบบดั้งเดิมไม่อาจคาดการณ์
- ตัวเร่งความเร็วฮาร์ดแวร์เฉพาะทาง:
- แอปพลิเคชัน AI จำนวนมากต้องการตัวเร่งความเร็วฮาร์ดแวร์เฉพาะทาง เช่น GPU หรือ TPU ซึ่งมีเส้นโค้งราคา-ประสิทธิภาพที่ต่างจาก CPU มาตรฐาน
เสาหลัก 3 เรื่องสำคัญของโครงสร้างพื้นฐาน AI
- สถาปัตยกรรมการคำนวณ:
- AI workload สมัยใหม่ต้องการ ความสามารถประมวลผลแบบขนานขนาดใหญ่ และอาจเกินความจุของโครงสร้างพื้นฐานที่มีอยู่
- โครงการ AI ที่ดูเพียงผิวเผินอย่างแชตบอทบริการลูกค้า ก็ต้องการ ความต้องการการคำนวณที่ค่อนข้างมาก เพื่อจัดการการโต้ตอบพร้อมกันนับพัน
- สถาปัตยกรรมการจัดเก็บข้อมูล:
- การพัฒนาและการนำ AI ไปใช้สร้าง ปริมาณข้อมูลมหาศาล ให้กับระบบจัดเก็บ ทำให้ระบบเหล่านี้หนักขึ้น
- นอกเหนือจากการเก็บข้อมูลดิบเพื่อฝึกและตรวจสอบโมเดลแล้ว ยังต้องใช้ความจุสำหรับโมเดลอาร์ติแฟกต์ การจับข้อมูลการอนุมาน และโซลูชันสำรองสำหรับทรัพย์สิน AI
- โครงสร้างพื้นฐานเครือข่าย:
- การเคลื่อนย้ายข้อมูลทำให้เกิด ความต้องการเครือข่ายที่มาก
- AI workload ต้องส่งชุดข้อมูลจำนวนมากผ่านโครงสร้างพื้นฐานเครือข่าย ซึ่งอาจนำไปสู่ คอขวด และก่อให้เกิดประสิทธิภาพลดลง
การวัดผลกระทบที่แท้จริงของ AI
- องค์กรต้องการ แนวทางที่ละเอียดขึ้น เพื่อวัดผลกระทบของ AI ต่อโครงสร้างพื้นฐาน
- แนวปฏิบัติที่ดีที่สุด คือการพัฒนาความเข้าใจแบบครอบคลุมเกี่ยวกับการใช้ทรัพยากร มากกว่าเพียงใช้ตัวชี้วัดพื้นผิว
- การเปรียบเทียบตามงาน จะให้มุมมองที่เป็นจริงมากกว่าสเปกผู้ขายหรือ Benchmark อุตสาหกรรมทั่วไป
- การบัญชีทรัพยากรรวม ต้องวัดเกินกว่าค่ามาตรวัดการคำนวณพื้นฐาน โดยรวมถึงการใช้หน่วยความจำ รูปแบบ I/O ของการจัดเก็บข้อมูล การจราจรเครือข่าย และการใช้ตัวเร่งความเร็วเฉพาะทาง
การเพิ่มประสิทธิภาพโครงสร้างพื้นฐานเชิงกลยุทธ์
- แทนที่จะเพิ่มทรัพยากรเข้าไปอย่างง่าย ๆ องค์กรสามารถนำ แนวทางเชิงกลยุทธ์ มาใช้เพื่อเพิ่มประสิทธิภาพ AI workload
- โมเดลการปรับใช้แบบรับรู้งาน รับรู้ว่า AI application แต่ละตัวมีโปรไฟล์การใช้ทรัพยากรเฉพาะตัว
- กรอบการกำกับดูแลทรัพยากร ตั้งนโยบายที่ชัดเจนสำหรับการจัดสรรทรัพยากร ติดตามรูปแบบการใช้ และใช้ กลไกการเรียกเก็บเงิน เพื่อให้เกิดความรับผิดชอบ
- แนวทางโครงสร้างพื้นฐานแบบผสม สามารถให้สมดุลที่เหมาะสมที่สุดระหว่างประสิทธิภาพ ต้นทุน และความยืดหยุ่น
ความสำคัญของทีมโครงสร้างพื้นฐาน AI
- ความท้าทายสำคัญที่สุดในด้านการควบคุมต้นทุนโครงสร้างพื้นฐาน AI คือ ปัญหาด้านองค์กร มากกว่าเรื่องทางเทคนิค
- ทีม IT แบบดั้งเดิมมักดำเนินงานแบบ ไซโล โดยแยกการจัดการการคำนวณ การจัดเก็บ เครือข่าย และการพัฒนาแอปพลิเคชันเป็นส่วนๆ
- AI workload ต้องการ แนวทางที่ผสานมากขึ้น และองค์กรที่ประสบความสำเร็จคือองค์กรที่สร้างทีม ข้ามสายงาน โดยผสมผสานความเชี่ยวชาญจากโดเมน IT แบบดั้งเดิม วิทยาการข้อมูล และหน่วยธุรกิจ
- การผสานดังกล่าวทำให้เกิด การพัฒนาวิธีแก้ปัญหาแบบองค์รวม ซึ่งช่วยปิดช่องว่างระหว่างศักยภาพโครงสร้างพื้นฐานกับความต้องการของแอปพลิเคชัน
อนาคตของกลยุทธ์โครงสร้างพื้นฐาน AI
- เนื่องจากเทคโนโลยี AI พัฒนาขึ้นอย่างรวดเร็ว องค์กรต้องวางกลยุทธ์โครงสร้างพื้นฐานที่รักษาสมดุลระหว่าง ความต้องการเร่งด่วน กับ ความยืดหยุ่นระยะยาว
- องค์กรลูกค้าจำนวนมากลงทุนทรัพยากรมากในการนำ RAG (Retrieval-Augmented Generation) มาใช้ แต่การทำให้ระบบเหล่านี้มี ความพร้อมใช้งานระดับองค์กร กลับพบว่าเป็นเรื่องยากกว่าที่คาดคิดมาก
- การเกิดขึ้นของ โพรโทคอลที่เป็นมาตรฐาน กำลังเปลี่ยนแปลงรูปแบบการรวมระบบ AI กับโครงสร้างพื้นฐานองค์กรในระดับรากฐาน
- โมดูลาร์ ช่วยให้แอปพลิเคชันสามารถแยกตัวออกจากการเปลี่ยนแปลงเทคโนโลยีพื้นฐาน ทำให้ง่ายต่อการยอมรับแนวทางใหม่ได้มากขึ้น
การสร้างระบบนิเวศ AI ที่ยั่งยืน
- ข้อได้เปรียบเชิงแข่งขันที่แท้จริงของ AI ในองค์กรไม่ใช่มาจากอัลกอริทึมที่ซับซ้อนที่สุดหรือโมเดลที่ใหญ่ที่สุด
- การสร้าง ระบบนิเวศโครงสร้างพื้นฐานที่ยั่งยืน คือวิธีการสนับสนุน AI ขับเคลื่อนนวัตกรรม โดยไม่กดดันองค์กรทางการเงิน
- ต้องมี กระบวนการตรวจสอบเป็นประจำ เพื่อประเมินประสิทธิภาพและความคุ้มค่าต้นทุนของโครงสร้างพื้นฐาน AI เพื่อให้ปรับตัวให้ตรงกับความต้องการที่เปลี่ยนแปลง
- เพื่อให้เกิด ความคงทนของคุณค่า ในการลงทุนด้าน AI ผู้นำเทคโนโลยีต้องผสานการพิจารณาโครงสร้างพื้นฐานเข้ากับแผนกลยุทธ์ตั้งแต่ต้น
ยังไม่มีความคิดเห็น