• GPU ไม่ได้เหมาะสมที่สุดสำหรับการรัน DLRM (Deep Learning Recommendation Model) ของ Meta
  • จึงได้พัฒนา ASIC ชื่อ Meta Training and Inference Accelerator (MTIA) ที่เหมาะกับงานแนะนำ
  • ออกแบบร่วมโดยคำนึงถึงความต้องการของโมเดลแนะนำรุ่นถัดไป และผสานเข้ากับ PyTorch เพื่อสร้างระบบจัดอันดับที่ปรับแต่งอย่างสมบูรณ์
  • กระบวนการผลิต TSMC 7 นาโนเมตร, 800Mhz, 102.4 TOPS @ INT8, 51.2 TFLOPS @ FP16, 25W

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น