AITemplate - เฟรมเวิร์ก Python สำหรับแปลงโครงข่ายประสาทเทียมเชิงลึกเป็นโค้ด C++ CUDA/HIP ประสิทธิภาพสูง

xguru · 2023-06-10T10:31:01+09:00

แปลงโครงข่ายประสาทเทียมเชิงลึกเป็นโค้ด C++ สำหรับ CUDA (NVIDIA GPU) / HIP (AMD GPU) เพื่อการอนุมานที่รวดเร็ว ให้ประสิทธิภาพใกล้เคียงกับ roofline fp16 TensorCore/MatrixCore บนโมเดลหลัก ๆ เช่น ResNet, BERT, VisionTransformer, Stable Diffusion เป็นโอเพนซอร์สที่เป็นหนึ่งเดียว เปิดกว้าง และยืดหยุ่น รองรับความเข้ากันได้ย้อนหลังได้ดีเยี่ยม (ไม่ขึ้นกับไลบรารี/รันไทม์ของบุคคลที่สาม) โดยแต่ละโมเดลจะถูกคอมไพล์เป็นไบนารีแบบพกพา Horizontal Fusion / Vertical Fusion / Memory Fusion ใช้งานร่วมกับหรือไม่ใช้ PyTorch ก็ได้

(github.com/facebookincubator)

11 คะแนน โดย xguru 2023-06-10 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

แปลงโครงข่ายประสาทเทียมเชิงลึกเป็นโค้ด C++ สำหรับ CUDA (NVIDIA GPU) / HIP (AMD GPU) เพื่อการอนุมานที่รวดเร็ว
ให้ประสิทธิภาพใกล้เคียงกับ roofline fp16 TensorCore/MatrixCore บนโมเดลหลัก ๆ เช่น ResNet, BERT, VisionTransformer, Stable Diffusion
เป็นโอเพนซอร์สที่เป็นหนึ่งเดียว เปิดกว้าง และยืดหยุ่น
รองรับความเข้ากันได้ย้อนหลังได้ดีเยี่ยม (ไม่ขึ้นกับไลบรารี/รันไทม์ของบุคคลที่สาม) โดยแต่ละโมเดลจะถูกคอมไพล์เป็นไบนารีแบบพกพา
Horizontal Fusion / Vertical Fusion / Memory Fusion
ใช้งานร่วมกับหรือไม่ใช้ PyTorch ก็ได้

AITemplate - เฟรมเวิร์ก Python สำหรับแปลงโครงข่ายประสาทเทียมเชิงลึกเป็นโค้ด C++ CUDA/HIP ประสิทธิภาพสูง

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น