4 คะแนน โดย GN⁺ 2023-11-15 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

GPU ที่ทรงพลังที่สุดในโลก

  • NVIDIA H200 Tensor Core GPU ช่วยเร่งเวิร์กโหลดด้าน generative AI และ high-performance computing (HPC) ด้วยประสิทธิภาพและความสามารถด้านหน่วยความจำระดับพลิกเกม
  • ในฐานะ GPU รุ่นแรกที่มาพร้อม HBM3e, H200 ช่วยยกระดับการเร่งความเร็วสำหรับ generative AI, large language models (LLMs) และเวิร์กโหลด HPC สำหรับงานคำนวณทางวิทยาศาสตร์

ประสิทธิภาพที่ดีขึ้นบนสถาปัตยกรรม NVIDIA Hopper

  • NVIDIA HGX H200 ซึ่งสร้างบนสถาปัตยกรรม NVIDIA Hopper™ มาพร้อม NVIDIA H200 Tensor Core GPU ที่มีหน่วยความจำขั้นสูงสำหรับรองรับการประมวลผลข้อมูลขนาดใหญ่

สัมผัสประสบการณ์ประสิทธิภาพที่สูงขึ้น

  • การอนุมาน Llama2 70B เร็วขึ้น 1.9 เท่า และการอนุมาน GPT-3 175B เร็วขึ้น 1.6 เท่า
  • งาน high-performance computing เร็วขึ้นได้สูงสุด 110 เท่าเมื่อเทียบกับ CPU

ประสิทธิภาพสูงขึ้นพร้อมหน่วยความจำที่ใหญ่และเร็วกว่า

  • NVIDIA H200 มอบหน่วยความจำ HBM3e ขนาด 141GB และแบนด์วิดท์หน่วยความจำ 4.8TB/s เพื่อเร่ง generative AI และ LLMs เพิ่มประสิทธิภาพด้านพลังงาน และลดต้นทุนรวมในการเป็นเจ้าของ

รับข้อมูลเชิงลึกด้วยการอนุมาน LLM ประสิทธิภาพสูง

  • ตัวเร่ง AI inference ต้องมอบ throughput สูงสุดและ TCO ต่ำสุดเมื่อถูกนำไปใช้งานกับฐานผู้ใช้ขนาดใหญ่
  • H200 ให้ความเร็วการอนุมานสำหรับการประมวลผล LLMs ได้สูงสุด 2 เท่าเมื่อเทียบกับ H100 GPU

เร่ง high-performance computing

  • แบนด์วิดท์หน่วยความจำมีความสำคัญต่อแอปพลิเคชัน HPC เพราะช่วยให้รับส่งข้อมูลได้เร็วขึ้นและลดคอขวดในการประมวลผลที่ซับซ้อน
  • แบนด์วิดท์หน่วยความจำที่สูงของ H200 ทำให้การเข้าถึงและจัดการข้อมูลมีประสิทธิภาพยิ่งขึ้น และช่วยให้ได้ผลลัพธ์เร็วขึ้นสูงสุด 110 เท่าเมื่อเทียบกับ CPU

ลดพลังงานและ TCO

  • การนำ H200 มาใช้งานทำให้ประสิทธิภาพด้านพลังงานและ TCO ก้าวสู่ระดับใหม่
  • ให้ประสิทธิภาพที่โดดเด่นภายใต้โปรไฟล์การใช้พลังงานเท่าเดิม พร้อมข้อดีที่เป็นมิตรต่อสิ่งแวดล้อมและคุ้มค่ามากขึ้น

ประสิทธิภาพ

  • สถาปัตยกรรม NVIDIA Hopper มอบการยกระดับประสิทธิภาพอย่างที่ไม่เคยมีมาก่อน และยังคงยกระดับมาตรฐานประสิทธิภาพต่อเนื่องผ่านการปรับปรุงซอฟต์แวร์สำหรับ H100
  • การเปิดตัว H200 สานต่อการเพิ่มประสิทธิภาพเหล่านี้ พร้อมการปรับปรุงอย่างต่อเนื่องสำหรับซอฟต์แวร์ที่รองรับ เพื่อรับประกันความเป็นผู้นำด้านประสิทธิภาพทั้งในปัจจุบันและอนาคต

พร้อมสำหรับองค์กร: ซอฟต์แวร์ AI ช่วยให้การพัฒนาและการนำไปใช้งานง่ายขึ้น

  • NVIDIA H200 ที่ทำงานร่วมกับ NVIDIA AI Enterprise ช่วยให้การสร้างแพลตฟอร์มที่พร้อมสำหรับ AI ง่ายขึ้น และเร่งการพัฒนาและการนำไปใช้งาน AI เช่น generative AI, computer vision และ voice AI
  • โซลูชันเหล่านี้มอบความปลอดภัยระดับองค์กร ความสามารถในการจัดการ ความเสถียร และการสนับสนุน เพื่อช่วยให้ได้ข้อมูลเชิงลึกที่นำไปใช้ได้จริงเร็วขึ้น และสร้างมูลค่าทางธุรกิจที่จับต้องได้เร็วขึ้น

สเปกของ NVIDIA H200 Tensor Core GPU

  • รูปแบบ: H200 SXM
  • FP64: 34 TFLOPS
  • FP64 Tensor Core: 67 TFLOPS
  • FP32: 67 TFLOPS
  • TF32 Tensor Core: 989 TFLOPS
  • BFLOAT16 Tensor Core: 1,979 TFLOPS
  • FP16 Tensor Core: 1,979 TFLOPS
  • FP8 Tensor Core: 3,958 TFLOPS
  • INT8 Tensor Core: 3,958 TFLOPS
  • หน่วยความจำ GPU: 141GB
  • แบนด์วิดท์หน่วยความจำ GPU: 4.8TB/s
  • ตัวถอดรหัส: 7 NVDEC
  • กำลังไฟออกแบบความร้อนสูงสุด (TDP): สูงสุด 700W (ปรับตั้งค่าได้)
  • Multi-Instance GPU: สูงสุด 7 MIGs @16.5GB ต่ออินสแตนซ์

ความเห็นของ GN⁺

สิ่งที่สำคัญที่สุดในบทความนี้คือ NVIDIA ได้เปิดตัว GPU ที่ทรงพลังที่สุดในโลกสำหรับเวิร์กโหลด AI และ HPC ผ่าน H200 Tensor Core GPU คาดว่า GPU รุ่นนี้จะช่วยผลักดันไม่เพียงการเร่งความเร็วของ generative AI และ large language models เท่านั้น แต่ยังรวมถึงความก้าวหน้าของเวิร์กโหลด HPC สำหรับการประมวลผลทางวิทยาศาสตร์ด้วย ความก้าวหน้าทางเทคโนโลยีนี้น่าจะน่าสนใจแม้แต่สำหรับวิศวกรซอฟต์แวร์ระดับเริ่มต้น และมีศักยภาพที่จะนำการเปลี่ยนแปลงเชิงนวัตกรรมมาสู่โครงการที่พวกเขามีส่วนร่วม หน่วยความจำขั้นสูงและความสามารถในการประมวลผลของ H200 คาดว่าจะช่วยให้การคำนวณเร็วขึ้น เพิ่มประสิทธิภาพด้านพลังงาน และลด TCO ซึ่งจะเร่งความก้าวหน้าในด้าน AI และงานวิจัยทางวิทยาศาสตร์

1 ความคิดเห็น

 
GN⁺ 2023-11-15
ความคิดเห็นจาก Hacker News
  • ไดของ GPU H200 เหมือนกับ H100 แต่ใช้สแตกหน่วยความจำ 24GB ที่เร็วกว่าในทุกส่วน

    ตัวเร่งความเร็ว H200 ของ NVIDIA ใช้ซิลิคอนตัวเดียวกับ H100 141GB แต่ไม่ใช่ซิลิคอนใหม่อย่างที่เว็บไซต์ของ Nvidia ชวนให้เข้าใจ

  • สงสัยว่าผู้ผลิตชิปรายอื่นจะมีโอกาสไล่ตามหรือแซง NVIDIA ในด้าน AI ได้ภายในไม่กี่ปีข้างหน้าหรือไม่

    ตั้งคำถามว่าความเป็นผู้นำและความเชี่ยวชาญด้าน AI ของ NVIDIA จะถูกผู้ผลิตชิปรายอื่นท้าทายได้ในอีกไม่กี่ปีข้างหน้าหรือไม่ หรือว่าความนำของพวกเขายังยากจะเอาชนะ

  • การเพิ่มขึ้นของประสิทธิภาพของ NVIDIA ในช่วงเวลาสั้น ๆ น่าประทับใจ แต่ก็รู้สึกว่าตลาดนี้ต้องการคู่แข่งรายอื่นด้วย

    แสดงความประทับใจกับการยกระดับประสิทธิภาพที่ NVIDIA ทำได้ในเวลาอันสั้น พร้อมทั้งหวังว่าจะมีคู่แข่งรายอื่นอย่าง AMD เข้ามาในตลาดนี้

  • ถามเกี่ยวกับตัวชี้วัดที่ใช้กับการอนุมาน และควรคาดหวังการเพิ่มประสิทธิภาพแบบใกล้เคียงกันในการฝึกด้วยหรือไม่

    มีการกล่าวถึงตัวชี้วัดประสิทธิภาพของขั้นตอนการอนุมานของโมเดล AI เป็นหลัก จึงเกิดคำถามว่าในขั้นตอนการฝึกโมเดลจะได้เห็นการเพิ่มประสิทธิภาพในลักษณะคล้ายกันหรือไม่

  • สงสัยถึงตำแหน่งของ H200 เมื่อเทียบกับ B100 ที่ออกในปีเดียวกัน

    อยากรู้บทบาทและราคาของ H200 หาก B100 เปิดตัวในปีเดียวกันพร้อมมอบประสิทธิภาพสูงกว่า 2 เท่า

  • ตกใจกับราคาของ GPU H100 และถามถึงค่าใช้จ่ายหากต้องการใช้สำหรับการทดลองส่วนตัวและแฮกกาธอน

    ตกใจกับราคาที่สูงเกินคาดของ GPU H100 สำหรับการทดลองส่วนตัวและแฮกกาธอน และสงสัยว่าราคาของ H200 จะอยู่ที่เท่าไร

  • บนอุปกรณ์พกพา พื้นที่หน้าจอที่มองเห็นได้จริงถูกจำกัดอย่างมากจากแบนเนอร์คุกกี้และแบนเนอร์โฆษณา

    ชี้ปัญหาว่าในสภาพแวดล้อมบนมือถือ พื้นที่ที่มองเห็นหน้าเว็บได้จริงเหลือเพียงหนึ่งในสี่เพราะแบนเนอร์คุกกี้และแบนเนอร์โฆษณา

  • ไม่มีคำอธิบายเกี่ยวกับคำว่า "GPU" และไม่มีความสามารถแสดงผลวิดีโอในตัวเลย

    กล่าวถึงข้อเท็จจริงว่า GPU นี้ไม่ได้มีฟังก์ชันแสดงผลวิดีโอในตัว

  • มีคำขอให้อธิบายว่ามีอะไรอยู่ในภาพ และมีความเห็นว่ามันดูเหมือนเมืองหรืออาคารจาก Blade Runner

    บอกว่าเข้าใจได้ยากว่าส่วนประกอบในภาพคืออะไรจึงขอคำอธิบาย พร้อมแสดงความรู้สึกว่ามันดูคล้ายเมืองหรืออาคารจาก Blade Runner

  • ถามว่าข้อจำกัดของความเร็วในการอนุมานเกิดจากปัญหาแบนด์วิดท์หน่วยความจำ หรือเป็นปัญหาด้านพลังการคำนวณ

    สงสัยว่าปัจจัยที่จำกัดความเร็วการอนุมานของโมเดล AI คือแบนด์วิดท์หน่วยความจำ หรือความสามารถในการประมวลผลคำนวณ