ความต้องการโครงสร้างพื้นฐานของ AI workload

  • AI workload ทำให้ การประมวลผล, การจัดเก็บ, และ เครือข่าย ตกภาระในลักษณะที่ทีมไอทีส่วนใหญ่ไม่คาดคิด
  • เมื่อองค์กรจำนวนมากเริ่มต้น เส้นทาง AI ขององค์กร จะให้ความสำคัญกับค่าใช้จ่ายที่เห็นได้ชัดเจน เช่น ค่าลิขสิทธิ์, บริการที่ปรึกษา, และ บุคลากร
  • อย่างไรก็ตาม ความต้องการโครงสร้างพื้นฐาน เพื่อรองรับ AI workload แม้ไม่ค่อยปรากฏต่อสายตา แต่กลับเป็น ศูนย์ต้นทุนที่สำคัญไม่แพ้กัน
  • การนำ AI ไปใช้งาน สร้างผลกระทบต่อระบบนิเวศเทคโนโลยีทั้งหมด และทำให้เกิดปัญหาที่ไม่สามารถคาดการณ์ได้ด้วย กรอบการวางแผนความจุแบบดั้งเดิม

ข้อจำกัดของการวางแผน IT แบบดั้งเดิม

  • AI workload ต่างจาก รูปแบบการใช้ทรัพยากร ของแอปพลิเคชันองค์กรแบบดั้งเดิมในเชิงพื้นฐาน
  • รูปแบบการใช้งานที่คาดเดาได้ยาก:
    • การวางแผนความจุแบบดั้งเดิมมักสมมติว่าการใช้งานค่อนข้างคาดเดาได้ แต่ AI workload อาจขยายตัวแบบก้าวกระโดดตามกำลังเมื่อการยอมรับเพิ่มขึ้น
    • กรณีการใช้ AI ที่ประสบความสำเร็จจะแพร่กระจายไปทั่วแผนกอย่างรวดเร็ว และการนำไปใช้ใหม่แต่ละครั้งต้องใช้ทรัพยากรการคำนวณเพิ่มขึ้น
  • การมาของ เอเจนต์ AI อิสระ ทำให้เกิดพลวัตด้านต้นทุนรูปแบบใหม่ที่การวางแผนแบบดั้งเดิมไม่อาจคาดการณ์
  • ตัวเร่งความเร็วฮาร์ดแวร์เฉพาะทาง:
    • แอปพลิเคชัน AI จำนวนมากต้องการตัวเร่งความเร็วฮาร์ดแวร์เฉพาะทาง เช่น GPU หรือ TPU ซึ่งมีเส้นโค้งราคา-ประสิทธิภาพที่ต่างจาก CPU มาตรฐาน

เสาหลัก 3 เรื่องสำคัญของโครงสร้างพื้นฐาน AI

  1. สถาปัตยกรรมการคำนวณ:
    • AI workload สมัยใหม่ต้องการ ความสามารถประมวลผลแบบขนานขนาดใหญ่ และอาจเกินความจุของโครงสร้างพื้นฐานที่มีอยู่
    • โครงการ AI ที่ดูเพียงผิวเผินอย่างแชตบอทบริการลูกค้า ก็ต้องการ ความต้องการการคำนวณที่ค่อนข้างมาก เพื่อจัดการการโต้ตอบพร้อมกันนับพัน
  2. สถาปัตยกรรมการจัดเก็บข้อมูล:
    • การพัฒนาและการนำ AI ไปใช้สร้าง ปริมาณข้อมูลมหาศาล ให้กับระบบจัดเก็บ ทำให้ระบบเหล่านี้หนักขึ้น
    • นอกเหนือจากการเก็บข้อมูลดิบเพื่อฝึกและตรวจสอบโมเดลแล้ว ยังต้องใช้ความจุสำหรับโมเดลอาร์ติแฟกต์ การจับข้อมูลการอนุมาน และโซลูชันสำรองสำหรับทรัพย์สิน AI
  3. โครงสร้างพื้นฐานเครือข่าย:
    • การเคลื่อนย้ายข้อมูลทำให้เกิด ความต้องการเครือข่ายที่มาก
    • AI workload ต้องส่งชุดข้อมูลจำนวนมากผ่านโครงสร้างพื้นฐานเครือข่าย ซึ่งอาจนำไปสู่ คอขวด และก่อให้เกิดประสิทธิภาพลดลง

การวัดผลกระทบที่แท้จริงของ AI

  • องค์กรต้องการ แนวทางที่ละเอียดขึ้น เพื่อวัดผลกระทบของ AI ต่อโครงสร้างพื้นฐาน
  • แนวปฏิบัติที่ดีที่สุด คือการพัฒนาความเข้าใจแบบครอบคลุมเกี่ยวกับการใช้ทรัพยากร มากกว่าเพียงใช้ตัวชี้วัดพื้นผิว
  • การเปรียบเทียบตามงาน จะให้มุมมองที่เป็นจริงมากกว่าสเปกผู้ขายหรือ Benchmark อุตสาหกรรมทั่วไป
  • การบัญชีทรัพยากรรวม ต้องวัดเกินกว่าค่ามาตรวัดการคำนวณพื้นฐาน โดยรวมถึงการใช้หน่วยความจำ รูปแบบ I/O ของการจัดเก็บข้อมูล การจราจรเครือข่าย และการใช้ตัวเร่งความเร็วเฉพาะทาง

การเพิ่มประสิทธิภาพโครงสร้างพื้นฐานเชิงกลยุทธ์

  • แทนที่จะเพิ่มทรัพยากรเข้าไปอย่างง่าย ๆ องค์กรสามารถนำ แนวทางเชิงกลยุทธ์ มาใช้เพื่อเพิ่มประสิทธิภาพ AI workload
  • โมเดลการปรับใช้แบบรับรู้งาน รับรู้ว่า AI application แต่ละตัวมีโปรไฟล์การใช้ทรัพยากรเฉพาะตัว
  • กรอบการกำกับดูแลทรัพยากร ตั้งนโยบายที่ชัดเจนสำหรับการจัดสรรทรัพยากร ติดตามรูปแบบการใช้ และใช้ กลไกการเรียกเก็บเงิน เพื่อให้เกิดความรับผิดชอบ
  • แนวทางโครงสร้างพื้นฐานแบบผสม สามารถให้สมดุลที่เหมาะสมที่สุดระหว่างประสิทธิภาพ ต้นทุน และความยืดหยุ่น

ความสำคัญของทีมโครงสร้างพื้นฐาน AI

  • ความท้าทายสำคัญที่สุดในด้านการควบคุมต้นทุนโครงสร้างพื้นฐาน AI คือ ปัญหาด้านองค์กร มากกว่าเรื่องทางเทคนิค
  • ทีม IT แบบดั้งเดิมมักดำเนินงานแบบ ไซโล โดยแยกการจัดการการคำนวณ การจัดเก็บ เครือข่าย และการพัฒนาแอปพลิเคชันเป็นส่วนๆ
  • AI workload ต้องการ แนวทางที่ผสานมากขึ้น และองค์กรที่ประสบความสำเร็จคือองค์กรที่สร้างทีม ข้ามสายงาน โดยผสมผสานความเชี่ยวชาญจากโดเมน IT แบบดั้งเดิม วิทยาการข้อมูล และหน่วยธุรกิจ
  • การผสานดังกล่าวทำให้เกิด การพัฒนาวิธีแก้ปัญหาแบบองค์รวม ซึ่งช่วยปิดช่องว่างระหว่างศักยภาพโครงสร้างพื้นฐานกับความต้องการของแอปพลิเคชัน

อนาคตของกลยุทธ์โครงสร้างพื้นฐาน AI

  • เนื่องจากเทคโนโลยี AI พัฒนาขึ้นอย่างรวดเร็ว องค์กรต้องวางกลยุทธ์โครงสร้างพื้นฐานที่รักษาสมดุลระหว่าง ความต้องการเร่งด่วน กับ ความยืดหยุ่นระยะยาว
  • องค์กรลูกค้าจำนวนมากลงทุนทรัพยากรมากในการนำ RAG (Retrieval-Augmented Generation) มาใช้ แต่การทำให้ระบบเหล่านี้มี ความพร้อมใช้งานระดับองค์กร กลับพบว่าเป็นเรื่องยากกว่าที่คาดคิดมาก
  • การเกิดขึ้นของ โพรโทคอลที่เป็นมาตรฐาน กำลังเปลี่ยนแปลงรูปแบบการรวมระบบ AI กับโครงสร้างพื้นฐานองค์กรในระดับรากฐาน
  • โมดูลาร์ ช่วยให้แอปพลิเคชันสามารถแยกตัวออกจากการเปลี่ยนแปลงเทคโนโลยีพื้นฐาน ทำให้ง่ายต่อการยอมรับแนวทางใหม่ได้มากขึ้น

การสร้างระบบนิเวศ AI ที่ยั่งยืน

  • ข้อได้เปรียบเชิงแข่งขันที่แท้จริงของ AI ในองค์กรไม่ใช่มาจากอัลกอริทึมที่ซับซ้อนที่สุดหรือโมเดลที่ใหญ่ที่สุด
  • การสร้าง ระบบนิเวศโครงสร้างพื้นฐานที่ยั่งยืน คือวิธีการสนับสนุน AI ขับเคลื่อนนวัตกรรม โดยไม่กดดันองค์กรทางการเงิน
  • ต้องมี กระบวนการตรวจสอบเป็นประจำ เพื่อประเมินประสิทธิภาพและความคุ้มค่าต้นทุนของโครงสร้างพื้นฐาน AI เพื่อให้ปรับตัวให้ตรงกับความต้องการที่เปลี่ยนแปลง
  • เพื่อให้เกิด ความคงทนของคุณค่า ในการลงทุนด้าน AI ผู้นำเทคโนโลยีต้องผสานการพิจารณาโครงสร้างพื้นฐานเข้ากับแผนกลยุทธ์ตั้งแต่ต้น

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น