- Blackwell ซีรีส์ ซึ่งเป็นชิป AI รุ่นถัดไปของ Nvidia จะล่าช้าออกไปมากกว่า 3 เดือนเนื่องจากข้อบกพร่องด้านการออกแบบ
- เรื่องนี้อาจส่งผลกระทบต่อลูกค้าที่สั่งซื้อชิปมูลค่าหลายพันล้านดอลลาร์ เช่น Meta, Google และ Microsoft
- เดิม Nvidia วางแผนจะจัดส่งชิป Blackwell จำนวนมากภายในปลายปีนี้ แต่เกิดปัญหาด้านการออกแบบที่ไม่คาดคิดขึ้นในช่วงท้ายของกระบวนการผลิต
- ด้วยเหตุนี้ คาดว่าการจัดส่งครั้งใหญ่จะยังไม่เกิดขึ้นจนกว่าจะถึงไตรมาส 1
คาดว่าแผนของลูกค้ารายใหญ่ของ Nvidia จะสะดุด
- ความล่าช้าของชิป Blackwell มีแนวโน้มจะทำให้แผนพัฒนาโมเดลภาษาขนาดใหญ่รุ่นถัดไปของลูกค้ารายสำคัญอย่าง Microsoft, OpenAI และ Meta สะดุดลง
- บริษัทเหล่านี้ต้องการใช้ชิป AI รุ่นถัดไปของ Nvidia เพื่อยกระดับประสิทธิภาพซอฟต์แวร์ครั้งใหญ่
- โดยเฉพาะ Microsoft เดิมมีแผนเตรียมชิป GB200 จำนวน 55,000 ถึง 65,000 ชิ้น เพื่อให้ OpenAI ใช้งานได้ภายในไตรมาส 1 ปี 2025
สถานะคำสั่งซื้อจำนวนมหาศาลจากลูกค้า
- Google สั่งซื้อชิป GB200 มากกว่า 400,000 ชิ้น และเมื่อรวมฮาร์ดแวร์เซิร์ฟเวอร์แล้ว คาดว่ามูลค่าคำสั่งซื้อจะสูงกว่า 1 หมื่นล้านดอลลาร์อย่างมาก
- Meta ก็สั่งซื้ออย่างน้อย 1 หมื่นล้านดอลลาร์เช่นกัน ขณะที่ Microsoft เพิ่งเพิ่มขนาดคำสั่งซื้อล่าสุดขึ้น 20%
การค้นพบข้อบกพร่องด้านการออกแบบและความล่าช้าในการผลิต
- เมื่อไม่นานมานี้ วิศวกรของ TSMC พบข้อบกพร่องระหว่างการเตรียมความพร้อมสำหรับการผลิตจำนวนมาก
- ชิป GB200 ประกอบด้วย Blackwell GPU ที่เชื่อมต่อกัน 2 ตัว และ Grace CPU โดยปัญหาเกิดขึ้นที่ processor die ซึ่งเชื่อม Blackwell GPU ทั้งสองตัวเข้าด้วยกัน
- ส่งผลให้อัตราผลผลิตของชิปที่ TSMC สามารถผลิตให้ Nvidia ได้ลดลง
- Nvidia จำเป็นต้องปรับแก้การออกแบบและทำการทดสอบการผลิตใหม่ที่ TSMC
การปรับตารางเปิดตัว
- เดิม TSMC มีแผนเริ่มการผลิตชิป Blackwell จำนวนมากในไตรมาส 3 และเริ่มจัดส่งจำนวนมากให้ลูกค้าของ Nvidia ตั้งแต่ไตรมาส 4
- แต่ขณะนี้คาดว่าจะเริ่มการผลิตจำนวนมากในไตรมาส 4 และหากไม่เกิดปัญหาเพิ่มเติม เซิร์ฟเวอร์จะถูกจัดส่งจำนวนมากในไตรมาสถัดไป
ข้อบกพร่องด้านการออกแบบและความล่าช้าในการผลิตที่ผิดปกติ
- การพบข้อบกพร่องด้านการออกแบบที่ร้ายแรงก่อนการผลิตจำนวนมากเพียงไม่นานถือเป็นเรื่องที่เกิดขึ้นได้ยากมาก
- โดยทั่วไป นักออกแบบชิปจะร่วมมือกับผู้ผลิตชิปอย่าง TSMC เพื่อทำการทดสอบการผลิตและการจำลองหลายรอบ
- การที่ TSMC ต้องหยุดสายการผลิตของผลิตภัณฑ์สำคัญอย่าง GB200 และย้อนกลับไปยังขั้นตอนการออกแบบอีกครั้งก็เป็นเรื่องที่พบได้ยากมาก
ยังไม่มีความคิดเห็น