APU ชิปเลตของ AMD: ภาพรวม Strix Halo

(chipsandcheese.com)

1 คะแนน โดย GN⁺ 2025-10-20 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Strix Halo เป็น APU ชิปเลตสำหรับอุปกรณ์ไคลเอนต์ขนาดใหญ่ที่สุดของ AMD ที่ถูกออกแบบมาเพื่อ ประมวลผลงาน CPU และ GPU สมรรถนะสูงแบบบูรณาการ
ติดตั้ง Zen 5 16 คอร์ และ Compute Unit ของ iGPU RDNA 3.5 จำนวน 40 ตัว ทำให้ให้สมรรถนะใกล้เคียงกับ CPU ระดับเดสก์ท็อปและการ์ดจอภายนอกระดับกลาง
ใช้บัสหน่วยความจำ LPDDR5X-8000 ร่วมกับ Infinity Cache ขนาด 32MB เพื่อสร้างแบนด์วิดท์สูงและเลตนซี่ต่ำ
สมรรถนะ iGPU ทิ้ง iGPU ใน APU มือถือรุ่นก่อนหน้าไว้ข้างหลัง และในบางสภาพแวดล้อมสามารถเข้าไปแข่งกับการ์ดจอภายนอกระดับกลางได้
สมรรถนะ ML กำลังรอการรองรับ ROCm จึงมีความคาดหวังด้านการขยายตัวและการพัฒนาในอนาคต

แนะนำและภาพรวมผลิตภัณฑ์

Strix Halo เป็น APU ชิปเลตสำหรับผู้บริโภคตัวแรกของ AMD ที่ประกาศที่ CES 2025
แม้จะเป็นโปรเซสเซอร์มือถือ แต่ยังไล่ระดับกับเดสก์ท็อป โดยรองรับ 55W~120W TDP และให้สมรรถนะสูงได้โดยไม่ต้องใช้การ์ดจอภายนอกแยกต่างหาก
ใช้สถาปัตยกรรม Zen 5 16 คอร์ (CCD 8 คอร์แบบคู่) และ FPU 512b แบบเดียวกับผลิตภัณฑ์เดสก์ท็อป
รองรับความเร็วสูงสุดบูสต์ 5.1GHz (ต่ำกว่าเดสก์ท็อป Ryzen 9 9950X ประมาณ 600MHz)
RDNA 3.5 iGPU ที่ทำหน้าที่เป็น GPU หลัก: 40 compute units, 32MB Infinity Cache และความเร็วบูสต์ 2.9GHz → สมรรถนะการคำนวณระดับ RX 7600 XT~RX 7700
ใช้ บัส LPDDR5X-8000 256b (สูงสุด 256GB/s, ใช้ร่วมกันทุกส่วน; ต่ำกว่า RX 7600 XT ที่ 288GB/s เล็กน้อย แต่เหนือกว่า APU ตัวเดิมได้อย่างชัดเจน)

สภาพแวดล้อมการทดสอบและอุปกรณ์

ใช้ Asus ROG Flow Z13 (2025) และ HP ZBook Ultra G1a 14” เพื่อวัดสมรรถนะการใช้งานจริง
ROG Flow Z13 ใช้สำหรับทดสอบเน้นเกม ขณะที่ ZBook Ultra G1a ใช้สำหรับไมโครเบนช์มาร์ก

หน่วยย่อยหน่วยความจำมุมมอง CPU

เลตนซีหน่วยความจำ: เทียบจาก Strix Point (~128ns) เป็น Strix Halo (~123ns) มีความแตกต่างกันเล็กน้อยมาก
CPU ไม่สามารถเข้าถึง Infinity Cache 32MB ใน IO Die โดยตรงได้ ซึ่งได้รับการยืนยันอย่างเป็นทางการผ่านการสัมภาษณ์
CPU เดสก์ท็อป (9950X) มีเลตนซีเพียง 75~80ns ซึ่งต่ำกว่ามือถืออย่างมาก
แบนด์วิดท์หน่วยความจำ: โหมดอ่าน-แก้ไข-บวกของคอร์ 16 ตัวทำได้มากกว่า 175GB/s, และอ่านได้ถึง 124GB/s
- CCD เดี่ยว มีแบนด์วิดท์ 64GB/s (อ่าน), 43GB/s (เขียน) รวมราว 103GB/s
- ลิงก์ระหว่าง CCD กับ IO Die เทียบเท่าเดสก์ท็อปที่ 2000MHz และ 32 ไบต์ต่อรอบ
โฆษณา

ประสิทธิภาพ CPU

CPU ของ Strix Halo มีสมรรถนะการคำนวณจำนวนเต็มเทียบเท่ากับเรือธงเดสก์ท็อปรุ่นก่อน (7950X) แม้ความเร็วคล็อกจะลดลง 11.7%
สมรรถนะการคำนวณตัวเลขจุดลอย ใกล้เคียงเรือธงปัจจุบัน (9950X) และมีบางการทดสอบย่อยที่เกิดการกลับตาลปัตร
ใน SPEC CPU 2017 Integer/FP Subtests Strix Halo ค่อนข้างใกล้เคียงหรือเกิน 9950X ในบางข้อ แต่มีความต่างเล็กน้อยจากเลตนซีบัส LPDDR5X ที่สูงขึ้น

โครงสร้างหน่วยความจำมุมมอง GPU

แบนด์วิดท์หน่วยความจำของ GPU Strix Halo สูงกว่า SoC มือถือทั้งหมด อย่างเห็นได้ชัด
อย่างไรก็ตาม เมื่อเทียบกับ RTX 5070 Mobile แบนด์วิดท์หน่วยความจำต่ำกว่า 50%
สมรรถนะ Infinity Cache (MALL) สูงกว่า L2 ของ 5070M 40% และมีความจุมากกว่า 33% โดย L2 4MB ให้แบนด์วิดท์ 2.5TB/s
เลตนซีของ L2 ใน Strix Halo ต่ำกว่า L2 ของ 5070M และเลตนซี MALL 32MB ใกล้เคียงกับ L2 ของ 5070M
เลตนซีหน่วยความจำรวม ต่ำกว่า 5070M ถึง 35%

Throughput การประมวลผลของ GPU

การประมวลผล FP: สูงกว่า Strix Point ประมาณ 2.5 เท่า และใกล้เคียง/สูงกว่า 5070M
- ในผล FP16 5070M ต่ำกว่าเป้าหมายเพียงเล็กน้อย (อาจเป็นความแปลกของผลทดสอบ)
โฆษณา
การประมวลผลจำนวนเต็ม: 5070M สูงกว่า Radeon 8060S

ประสิทธิภาพและการเล่นเกมของ GPU

ในฐานะ iGPU แห่ง Strix Halo มีสมรรถนะเหนือกว่า iGPU ของ Intel/AMD รุ่นก่อนอย่างชัดเจน และยังมีศักยภาพในการแข่งขันกับ GPU แยกอย่างใกล้ชิด
ในการทดสอบเกมที่มีความต่างสูง (Cyberpunk 2077):
- สภาพแวดล้อมแบตเตอรี่: ภายใต้เงื่อนไขเดียวกัน Radeon 8060S ทำคะแนน 1080p ดีกว่า 5070M 7.5%
- สภาพแวดล้อมไฟ AC: 1080p Radeon 8060S นำ 2.5%, ส่วนที่ 1440p 5070M นำ 8.3%
- ทั้งสองสามารถคงความสามารถในการแข่งขันได้ตามการตั้งค่า/เงื่อนไขพลังงาน และ iGPU แสดงสมรรถนะที่แท้จริงใกล้เคียงการ์ดจอภายนอกได้จริง
ใน Fluid X3D และภาระงานเชิงคำนวณ Radeon 8060S แซงหน้าทุก iGPU ของ Intel/AMD รุ่นเดิมได้อย่างสมบูรณ์

สรุป

Strix Halo ตั้งเป้าเป็น SoC CPU-GPU อินทิเกรตสมรรถนะสูง และแสดงสมรรถนะยอดเยี่ยมในสภาพการใช้งานหลากหลาย
แข่งขันได้กับ CPU Zen 5 เดสก์ท็อปและการ์ดจอภายนอกระดับกลาง พร้อมรองรับทั้งมือถือและเดสก์ท็อป
รักษาข้อดีด้าน ประสิทธิภาพและความเป็นหน่วยเดียวกัน (ข้อได้เปรียบของ iGPU) ควบคู่กับสมรรถนะสูงได้
ยังไม่ก้าวขึ้นเหนือ GPU แยกสมรรถนะสูงเฉพาะทาง แต่ในเครื่องขนาดเล็กและระบบรวมตัวเป็นตัวเลือกที่ยืดหยุ่นและแข็งแรงที่สุด
สมรรถนะ ML ต้องรอการสนับสนุน ROCm ต่อไป จึงจำเป็นต้องมีการวิเคราะห์รอบต่อไป และมีการกล่าวถึงศักยภาพในการขยายตัวและการออกแบบบัสหน่วยความจำความจุสูงในอนาคต (แบบ Apple Max/Ultra)
คาดว่าแนวทางการออกแบบที่ประสบผลสำเร็จของ Strix Halo จะเป็นฐานสำคัญสำหรับการขยายไลน์ APU สมรรถนะสูงของ AMD ในอนาคต

1 ความคิดเห็น

GN⁺ 2025-10-20

ความเห็นจาก Hacker News

ฉันอยากลองใช้มินิพีซีที่มาพร้อมผลิตภัณฑ์นี้มาก แต่ในยุโรปราคาสูงมากหรือไม่ก็หาซื้อไม่ได้เลย การสั่งตรงจากจีนก็ยังลังเลเพราะปัญหา AS และตอนนี้ ROCm 7 ก็ใช้งานได้แล้วบนลินุกซ์ดิสโทรส่วนใหญ่ เลยคิดว่าน่าจะเหมาะมากถ้าเอาไปใช้เป็นเวิร์กสเตชัน หรือเป็นโฮม inference server สำหรับ LLM หรือ Ollama และบริการอื่น ๆ ที่บ้าน
- เจอรุ่นที่ส่งจากเยอรมนีและราคาค่อนข้างถูกอยู่เหมือนกัน ลองดู BOSGAME M5 AI Mini Desktop
- สงสัยว่าได้ดู Corsair AI Workstation 300 Desktop PC หรือยัง ราคาอยู่ราว 2000~2700 ยูโรขึ้นอยู่กับรุ่นที่เลือก ซึ่งถ้าคิดรวม VAT แล้วก็ให้ความรู้สึกใกล้เคียงกับราคาในสหรัฐฯ (1700~2300 USD) Corsair AI Workstations
- ฉันสั่ง framework desktop 395 รุ่น 128GB มาในราคาไม่ถึง 1900 ยูโร และพอรวมออปชันเสริมกับค่าส่งแล้วก็จ่ายไปเกิน 2000 ยูโรนิดหน่อย แต่ก็ไม่ได้รู้สึกว่ามันแพงเกินไป
- เท่าที่เข้าใจ สาเหตุหลักที่ราคาสูงคือหน่วยความจำแบนด์วิดท์สูง (แม้ว่าเมื่อเทียบกับ GPU ประสิทธิภาพสูงจริง ๆ แล้ว แบนด์วิดท์หน่วยความจำก็ไม่ได้สูงมากนัก)
- ROCm พัฒนาขึ้นมากก็จริง แต่ฉันก็ยังเจอปัญหาเล็กน้อยบนเดสก์ท็อป RX9070XT ดังนั้นถ้าจะทำงาน AI ตอนนี้ยังแนะนำโซลูชันของ Nvidia หรือ Apple มากกว่า แต่คิดว่า AMD จะตามทันในไม่ช้า ระบบ AI ที่คุ้มค่าที่สุดต่อราคายังคงเป็นเดสก์ท็อปประกอบเองที่ใส่ RTX 3090 สองใบ (แน่นอนว่าต้องมีเมนบอร์ดที่รองรับการ์ดคู่) แล้วก็เอาไปตั้งรันไว้ในตู้เสื้อผ้าได้เลย
เมื่อเทียบกับ dGPU บนมือถือ และ DGX Spark ที่ในที่สุดก็กลายเป็นของจริงแล้ว ตลาดนี้ยังให้ความรู้สึกเหมือนเป็นเซกเมนต์ที่ยังไม่ลงตัวและยังมีศักยภาพเหลืออยู่ ไม่รู้ว่าเพราะอะไร DGX Spark ถึงล่าช้าอยู่นาน แต่ก็เปิดโอกาสให้ AMD ชิงส่วนแบ่งตลาดก่อน ข้อดีของ discrete GPU (รวมถึงบนมือถือ) คือแบนด์วิดท์หน่วยความจำ ส่วนข้อเสียคือกินไฟสูงและมีความจุหน่วยความจำจำกัด (จะไม่นับ CUDA ในที่นี้ แม้มันจะเป็นปัจจัยใหญ่มากก็ตาม) ถ้าเพิ่มเดสก์ท็อปขนาดเล็ก DGX Spark เข้าไป ก็อาจใช้งานได้คุ้มกว่า Strix Halo 395 จำนวนเท่ากัน เพราะมีพอร์ตเครือข่ายที่รองรับ RDMA ได้หลายอุปกรณ์ผ่าน 200Gb แบบคู่ แต่ในการใช้งานจริง ฉันคงเลือก GPU server หรือ Threadripper GPU workstation มากกว่า DGX Spark 4 เครื่อง และอีกอย่าง DGX Spark ก็ใส่ในแล็ปท็อปไม่ได้ ซึ่งเป็นข้อได้เปรียบของ Strix Halo สรุปแล้วฉันคิดว่านี่คือตลาดเฉพาะกลุ่มใหม่ และอยากเห็นว่ามันจะลงหลักปักฐานในรูปแบบไหนตลอดหลายเจเนอเรชันข้างหน้า
- รุ่นถัดไป AMD น่าจะมี Medusa Halo ที่ใช้บัส LPDDR6 แบบ 384-bit ซึ่งในกรณีนั้นอาจได้หน่วยความจำมากกว่า Strix Halo 2 เท่า และแบนด์วิดท์มากกว่า 1.7 เท่า ตอนนี้ Strix Halo กำลังไปได้ดีในฐานะแพลตฟอร์ม inference ดังนั้นเซกเมนต์ตลาดนี้น่าจะเติบโตต่อ
- เผื่อข้อมูลไว้ก่อนว่าไม่ใช่ 200Gb แบบคู่ แต่เป็น 200Gb แบบเดี่ยว หรือ 100Gb แบบคู่
- ปกติ “dGPU” หมายถึง discrete GPU เลยสงสัยว่าคุณอาจหมายถึง “iGPU” (กราฟิกแบบรวม) หรือเปล่า ผลิตภัณฑ์ Strix Halo ก็มีการทำตลาดด้านเกมเหมือนกัน แต่ประสิทธิภาพจริงดูไม่ค่อยเข้ากันนัก CPU แรงเกินไปเมื่อเทียบกับ iGPU ที่ยังค่อนข้างตามหลัง แต่ประสิทธิภาพด้าน matrix multiply (matmul) น่าจะแข็งแกร่งแน่ ๆ
- จุดประสงค์หลักของ DGX Spark ดูเหมือนจะเป็นการพัฒนาและทดสอบโมเดล AI แบบโลคัล ส่วน Strix Halo เป็น iGPU บนฐาน amd64 จึงใช้กับงานพีซีแบบดั้งเดิมก็ได้ และเป็นอุปกรณ์เป้าหมายสำหรับ AI แบบโลคัลก็เพียงพอ ในความเห็นของฉัน Strix Halo ดูเหมือนเป็นจุดเริ่มต้นของจุดจบยุค discrete GPU ในแล็ปท็อป และ Nvidia ก็ดูจะรับรู้เรื่องนี้ จึงพยายามทำโซลูชัน iGPU ร่วมกับ Intel
เรื่องน่าเสียดายคือผ่านไปครึ่งปีหลังเปิดตัวแล้ว แต่ยังมีแล็ปท็อปที่ใช้งานได้จริงแค่สองรุ่น และในนั้นรุ่นสมรรถนะสูงก็มีแค่ Z13 ยังมีของ Framework ด้วย แต่ในหลายประเทศก็ซื้อไม่ได้ และดูเหมือนจะเป็นสินค้าสำหรับกลุ่มลูกค้าที่จำกัดพอสมควร ฉันชอบ Z13 มาก แต่ผลิตภัณฑ์นี้ก็ชัดเจนว่าเป็นของเฉพาะกลุ่ม ไม่รู้ว่ามีปัญหาเรื่องการผลิตชิปหรือเปล่า หรือว่า Apple กวาดกำลังการผลิตไปหมด
- ราคา HP ZBook Ultra ในสหรัฐฯ สูงมาก แต่ในยุโรปกลับดูสมเหตุสมผลพอ ๆ กับแล็ปท็อปทั่วไป สิ่งที่ฉันเสียดายคือวันเปิดขายฉันรีบสั่งเลยจนรอรุ่น 128GB ไม่ไหว แต่เรื่องแบตเตอรี่และประสิทธิภาพนั้นยังไม่เคยเจอคู่แข่งที่สู้ได้ในงานหนักทุกแบบที่ฉันลองมา และนอกจากแล็ปท็อปแล้ว บริษัทอย่าง Beelink ก็ยังทำ NUC ราคาเหมาะสมออกมาด้วย เห็นด้วยว่าของขาดตลาดทำให้ประเมินโอกาสได้ยาก
- HP ZBook Ultra G1a เป็นอีกตัวเลือกที่ดี เพราะคอนฟิก RAM ได้สูงสุด 128GB
- แบรนด์อย่าง Beelink, GMKtec, Minisforum, Corsair ก็เริ่มออกสินค้าเช่นกัน
- น่าเสียดายที่ในยุโรปส่วนใหญ่ซื้อ Z13 ที่มี RAM มากกว่า 32GB ไม่ได้ และโดยทั่วไปก็ไม่มีประกัน 2~3 ปีให้ด้วย สุดท้ายเลยรู้สึกไม่พอใจที่อาจต้องไปซื้อ Framework 13 ที่มี RAM/CPU/GPU อ่อนกว่าด้วยซ้ำ
High Yield ได้ทำวิดีโอวิเคราะห์ชิป 395 ในระดับซิลิคอนแบบเจาะลึก ลองดูได้ High Yield - 395 Chip Deep Dive
สงสัยว่า framework desktop จะปรับ TDP (ขีดจำกัดพลังงาน) ให้สูงกว่านี้ได้ไหม เดสก์ท็อปรุ่นนี้ดูเหมือนมีระบบระบายความร้อนดีกว่าแล็ปท็อปที่ใช้ชิปตัวเดียวกันมาก เลยอาจมีความต่างด้านประสิทธิภาพจริงก็ได้
- ตั้งค่าได้ที่ 140W ต่อเนื่อง และ 160W แบบ burst (ประมาณ 10 วินาที)
- ฉันไม่ได้วัดการใช้พลังงานโดยตรง แต่ใช้งานเมนบอร์ด Framework ในเคส ITX ที่ใหญ่ขึ้นเพื่อปรับปรุงการระบายความร้อน พีซีหลักของฉันที่ใช้ 7950X3D กับเครื่อง Strix มีจำนวนคอร์/เธรดเท่ากัน และผลทดสอบประสิทธิภาพก็แทบไม่ต่างกันเลย ดังนั้นการที่แล็ปท็อปให้พลังประมวลผลระดับเดสก์ท็อปได้จึงน่าทึ่งมาก
เคยอ่านมาจากที่ไหนสักแห่งว่า เหตุผลหลักที่ APU นี้ไม่ได้มีประสิทธิภาพพลังงานสูงเท่าผลิตภัณฑ์ Apple เป็นเพราะการตัดสินใจให้มันใช้สถาปัตยกรรมร่วมกับ Epyc ซึ่งทำให้ต้องแลกกับประสิทธิภาพในช่วงพลังงานต่ำที่ด้อยลง เลยอยากรู้ว่ามีใครช่วยยืนยันได้ไหม
- ในรีวิวของ Hardware Canucks มีการทดสอบ M4 Pro (3nm เจเนอเรชัน 2) กับ 395+ (4nm) ที่ 50W และผลลัพธ์ประสิทธิภาพค่อนข้างใกล้กัน ซึ่งอาจอธิบายได้ด้วยความต่างของกระบวนการผลิต 3nm กับ 4nm รีวิวบน YouTube
- APU ก็โอเค แต่ไม่มีทางตามทันแบนด์วิดท์หน่วยความจำของ m3 ultra ได้แน่นอน อย่างไรก็ตามราคาถูกกว่ามาก ฉันกำลังคิดจะเปลี่ยนเดสก์ท็อปเก่า และสิ่งสำคัญคือสามารถยืม external GPU (เช่น A6000) จากที่ทำงานมาใช้ชั่วคราวได้ และต้องตั้งค่าได้โดยไม่เสียเวลามาก
ฉันซื้อ framework desktop มาทดสอบอยู่ มันเป็นเครื่องขนาดเล็กแต่สร้างความประทับใจได้มาก หวังว่าในอนาคตผลิตภัณฑ์แบบนี้จะดึงดูดความสนใจและการมีส่วนร่วมจากชุมชนวิศวกรมากขึ้น ecosystem ที่รองรับ vulkan หรือ rocm ได้ดีจะเป็นประโยชน์กับทุกคน
มีคำถามที่เกี่ยวข้องอยู่เหมือนกัน ถ้าประกอบเครื่องด้วย Zen 5 CPU สำหรับเดสก์ท็อป + RX 7600 XT + หน่วยความจำ จะสามารถทำระบบราคาประหยัดที่ให้ system memory กับ GPU แชร์แบนด์วิดท์หน่วยความจำร่วมกันแบบ Strix Halo หรือ Apple Silicon ได้ไหม และจะสามารถรัน LLM ขนาดใหญ่แบบโลคัลได้ในราคาสมเหตุสมผลหรือเปล่า อีกอย่างฉันไม่ค่อยแน่ใจ แต่เข้าใจว่าการแชร์หน่วยความจำแบบนี้มีเฉพาะ APU และไม่มีใน discrete GPU ใช่ไหม
- หน่วยความจำจะไม่ใช่แบบ "unified" ถ้าเป็น GPU ที่แยกออกมาทางกายภาพ เพราะในกรณีนั้นจะเข้าถึงผ่านบัส PCIe ซึ่งทำให้เกิดคอขวดด้านแบนด์วิดท์อย่างมาก โดย PCIe 5.0 x16 ได้สูงสุด 64GB/s และ GPU ก็ไม่ได้รองรับระดับนั้นทุกตัว
อยากรู้ว่าประสิทธิภาพกราฟิกอยู่ในระดับที่พอสู้กับ 5070M ได้ไหม ถ้าราคาและการใช้พลังงานอยู่ในระดับเหมาะสมก็ดูน่าสนใจมาก
- การใช้พลังงานอยู่ราว 75W และปรับเพิ่มเองได้ แต่ไม่ว่าอย่างไรก็ยังต่ำกว่า 100W เสมอ (เป็นข้อมูลที่ได้มาตอนหาข้อมูล Z13) ตัวชิปเองรองรับกำลังไฟได้สูงกว่านี้ และ ASUS ก็เป็นบริษัทที่มักให้แล็ปท็อปกินไฟเกิน 130W อยู่แล้ว เลยค่อนข้างแปลกใจกับตัวเลข 75W นี้
อยากรู้ว่าประสิทธิภาพ GPU เมื่อเทียบกับ GPU ใน Mac ซีรีส์ m เป็นอย่างไร

APU ชิปเลตของ AMD: ภาพรวม Strix Halo

แนะนำและภาพรวมผลิตภัณฑ์

สภาพแวดล้อมการทดสอบและอุปกรณ์

หน่วยย่อยหน่วยความจำมุมมอง CPU

ประสิทธิภาพ CPU

โครงสร้างหน่วยความจำมุมมอง GPU

Throughput การประมวลผลของ GPU

ประสิทธิภาพและการเล่นเกมของ GPU

สรุป

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความเห็นจาก Hacker News