Meta เปิดตัว MTIAv2 ซึ่งเป็นรุ่นถัดไปของ MTIA (Meta Training and Inference Accelerator) v1 ตัวเร่งการอนุมาน AI ที่บริษัทพัฒนาขึ้นเองและเปิดตัวเมื่อปีที่แล้ว MTIA เป็นชิปที่ออกแบบมาสำหรับเวิร์กโหลด AI ของ Meta โดยเฉพาะโมเดลแนะนำแบบดีปเลิร์นนิงที่ช่วยยกระดับประสบการณ์หลากหลายด้านในผลิตภัณฑ์ต่าง ๆ เมื่อเวิร์กโหลด AI มีความสำคัญมากขึ้นเรื่อย ๆ ต่อผลิตภัณฑ์และบริการของ Meta การเพิ่มประสิทธิภาพของ MTIA จึงน่าจะช่วยเพิ่มความสามารถในการมอบประสบการณ์ที่ดีที่สุดให้ผู้ใช้ทั่วโลก
ชิป MTIAv2 รุ่นใหม่นี้แสดงให้เห็นแล้วว่าประสิทธิภาพดีขึ้น 3 เท่าเมื่อเทียบกับชิปรุ่นแรกใน 4 โมเดลหลัก ที่ระดับแพลตฟอร์ม ด้วยจำนวนอุปกรณ์ที่เพิ่มเป็น 2 เท่าและ CPU แบบ 2 ซ็อกเก็ตที่ทรงพลังกว่า ทำให้สามารถบรรลุปริมาณงานการเสิร์ฟโมเดลสูงขึ้น 6 เท่าและประสิทธิภาพต่อวัตต์ดีขึ้น 1.5 เท่าเมื่อเทียบกับระบบ MTIA รุ่นแรก เมื่อเปรียบเทียบกับ GPU เชิงพาณิชย์ MTIA ก็พิสูจน์ให้เห็นว่ามีบทบาทเสริมกันอย่างมากในการมอบประสิทธิภาพและประสิทธิผลที่เหมาะสมที่สุดสำหรับเวิร์กโหลดเฉพาะของ Meta
คุณสมบัติหลักของ MTIAv2
คุณสมบัติหลักของ MTIAv2 มีดังนี้:
- ประสิทธิภาพการประมวลผลและแบนด์วิดท์หน่วยความจำเพิ่มขึ้นมากกว่า 2 เท่าเมื่อเทียบกับรุ่นก่อน
- ออกแบบมาเพื่อจัดการโมเดลการจัดอันดับและการแนะนำได้อย่างมีประสิทธิภาพ
- ประกอบด้วย processing elements (PE) ในกริด 8x8 ปรับปรุงประสิทธิภาพการประมวลผลแบบหนาแน่น 3.5 เท่า และแบบ sparse 7 เท่า
- เพิ่ม local PE storage 3 เท่า, on-chip SRAM 2 เท่า และแบนด์วิดท์ 3.5 เท่า, ความจุ LPDDR5 2 เท่า
- สถาปัตยกรรม NoC (Network on Chip) ที่ปรับปรุงใหม่ เพิ่มแบนด์วิดท์ 2 เท่า และทำให้ประสานงานระหว่าง PE ได้ด้วย latency ต่ำ
ยังไม่มีความคิดเห็น