3 คะแนน โดย GN⁺ 2024-10-13 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Turin ของ AMD: เปิดตัว EPYC เจเนอเรชันที่ 5

  • เซิร์ฟเวอร์ CPU ความเร็ว 5GHz
    • บทความแนะนำ EPYC 9575F ซึ่งเป็นเซิร์ฟเวอร์ CPU รุ่นใหม่ของ AMD และต่างจาก Granite Rapids รุ่นก่อนตรงที่ผู้เขียนได้ทดลองใช้งานจริงโดยตรง
    • เนื่องจากก่อนหน้านี้ได้พูดถึงความแตกต่างของ Zen 5 เวอร์ชันมือถือและเดสก์ท็อปไปแล้ว บทความนี้จึงโฟกัสที่การเปลี่ยนแปลงของซับซิสเต็มหน่วยความจำใน Turin

แบนด์วิดท์หน่วยความจำ

  • 9575F ทำแบนด์วิดท์การอ่านหน่วยความจำได้ราว 52GB/s การเขียน 48GB/s และการอ่าน-แก้ไข-เขียน 95GB/s
  • เมื่อดูการใช้แบนด์วิดท์หน่วยความจำบน CCD เดียว จะพบว่าคอร์เดียวสามารถใช้แบนด์วิดท์การอ่านของ CCD ทั้งหมดได้ไม่ถึงครึ่ง ใช้แบนด์วิดท์การเขียนได้ประมาณ 55% และใช้แบนด์วิดท์แบบอ่าน-แก้ไข-เขียนได้มากกว่า 2/3
  • 9575F มีแบนด์วิดท์ต่อ CCD สูงกว่าชิ้นส่วน Zen 5 สำหรับเดสก์ท็อปอย่างชัดเจน เพราะให้ GMI link 2 เส้นไปยัง IO die ผ่าน GMI3-W
  • Turin รองรับสูงสุดถึง DDR5-6400MT/s แต่รองรับเฉพาะบางระบบในแบบ 1 DIMM ต่อแชนเนล ส่วนระบบส่วนใหญ่รองรับ 6000MT/s และหากจัดแบบ 2 DIMM ต่อแชนเนล ความเร็วจะลดลงเหลือ 4400 MT/s

เวลาแฝงของหน่วยความจำ

  • เวลาแฝงของหน่วยความจำของ Turin ในสภาวะไม่มีโหลดใกล้เคียงกับ Genoa
  • จากการวัดเวลาแฝงของหน่วยความจำภายใต้โหลด พบว่าเมื่อมีโหลดบน CCD เดียว เวลาแฝงเพิ่มขึ้นราว 39 นาโนวินาทีจากสภาวะไม่มีโหลด และเมื่อทั้งระบบมีโหลดจะเพิ่มขึ้นราว 31 นาโนวินาที
  • เวลาแฝงภายใน CCD อยู่ที่ประมาณ 45ns ระหว่าง CCD อยู่ที่ประมาณ 150ns และระหว่างซ็อกเก็ตอยู่ที่ประมาณ 260ns ซึ่งเพิ่มขึ้นเมื่อเทียบกับ Genoa

ความเร็วสัญญาณนาฬิกา

  • คอร์ทั้ง 64 คอร์ของ 9575F สามารถขึ้นไปได้สูงสุดถึง 5GHz ในการทดสอบเธรดเดี่ยว และในการทดสอบแบนด์วิดท์หน่วยความจำมี 8 คอร์ที่ทำงานที่ 5GHz
  • ใน Cinebench 2024 เมื่อทำงาน 128 เธรด 9575F รักษาความเร็วได้ราว 4.3GHz ขณะที่เวิร์กโหลดเว็บเซิร์ฟเวอร์/TLS transaction ทำได้ราว 4.9GHz

บทสรุป

  • Turin ของ AMD เป็นการอัปเดตตามเจเนอเรชันที่คาดหมายได้ โดยมีทั้ง SKU คอร์จำนวนมากและ SKU ความถี่สูงที่มีคอร์น้อยกว่า เพื่อตอบโจทย์ความต้องการของตลาดที่หลากหลาย
  • Turin ใกล้เคียงกับการพัฒนาต่อจาก Milan ไป Genoa มากกว่าการเปลี่ยนแปลงครั้งใหญ่แบบ Naples ไป Rome โดยมาพร้อมแบนด์วิดท์หน่วยความจำที่เพิ่มขึ้น จำนวนคอร์ที่มากขึ้น และการอัปเดตตัวคอร์
  • เจเนอเรชันนี้มอบคุณค่าอย่างมากในระบบนิเวศที่มีการแข่งขันสูง และน่าจะดึงดูดความสนใจของผู้คนจำนวนมาก

สรุปโดย GN⁺

  • Turin ของ AMD เป็นความก้าวหน้าที่สำคัญในตลาดเซิร์ฟเวอร์ CPU โดยเฉพาะการพัฒนาด้านแบนด์วิดท์หน่วยความจำและประสิทธิภาพของคอร์ที่น่าจับตามอง
  • บทความนี้เป็นประโยชน์สำหรับผู้ที่ต้องการเข้าใจเทคโนโลยีล่าสุดของ AMD และอาจช่วยวิศวกรที่สนใจการเพิ่มประสิทธิภาพเซิร์ฟเวอร์ได้
  • ผลิตภัณฑ์ที่มีคุณสมบัติใกล้เคียงกับ Turin ได้แก่ซีรีส์ Xeon ของ Intel และการเปรียบเทียบกับ AMD จะช่วยให้เห็นข้อดีข้อเสียของแต่ละผลิตภัณฑ์

1 ความคิดเห็น

 
GN⁺ 2024-10-13
ความคิดเห็นจาก Hacker News
  • AMD EPYC 9175F เป็นผลิตภัณฑ์ที่ค่อนข้างแปลก โดยมี 16 คอร์และ L3 cache 512MB ดูเหมือนว่าจะมีไว้สำหรับลูกค้าที่ต้องการลดค่าไลเซนส์แบบ "ต่อคอร์" ให้น้อยที่สุด สงสัยว่า Oracle ยังใช้โมเดลไลเซนส์แบบนี้อยู่หรือไม่

    • สำหรับงานเฉพาะทางอย่าง HFT ก็อาจเอาอัลกอริทึมทั้งหมดใส่ไว้ใน L3 เพื่อไล่ระดับ latency ต่ำสุดได้
    • แต่โดยหลักแล้วน่าจะเป็นเรื่องที่เกี่ยวกับไลเซนส์ซอฟต์แวร์มากกว่า
  • Phoronix ทำรีวิวเปรียบเทียบ Turin Dense 196 คอร์กับ AmpereOne 192 คอร์

    • MSRP ของ Ampere อยู่ที่ $5.5K ส่วน EPYC อยู่ที่ $15K
    • Turin 196 ให้ประสิทธิภาพดีกว่า 1.6 เท่า
    • Ampere มีประสิทธิภาพด้านการใช้พลังงานดีกว่า 1.2 เท่า
    • ในแง่ $/ประสิทธิภาพจริง Ampere 192 คอร์ดีกว่า Turin Dense 196 คอร์ 1.7 เท่า
  • ด้วยราคา $5.5K สามารถซื้อ CPU AmpereOne 192 คอร์ (274w) หรือ CPU Turin Dense 48 คอร์ (300w) ได้

    • Ampere มีแผนจะเปิดตัวผลิตภัณฑ์ 256 คอร์, 3nm, 12 ช่องสัญญาณหน่วยความจำ ในปีหน้า ซึ่งอาจเป็นคู่แข่งที่ท้าทายกว่าในการแข่งด้านประสิทธิภาพกับ Turin Dense และ Sierra Forest
    • ตอนนี้ $/ประสิทธิภาพคือจุดขายของพวกเขา
  • สนใจมากกับประสิทธิภาพของชิปเซิร์ฟเวอร์ของ Qualcomm ที่พัฒนาบนพื้นฐาน Nuvia

    • ถ้าการพัฒนาของคอร์ฝั่งไคลเอนต์ของ ARM เป็นตัวบ่งชี้ใดๆ ก็ยิ่งอยากรู้มากว่าชิปที่พัฒนาเองอย่าง AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace, Alibaba Yitian จะสู้กับคอร์ Neoverse ที่ดีขึ้นได้อย่างไร
    • ตั้งตารอการแข่งขันระหว่าง Nuvia vs ARM vs AmpereOne
  • ตอนนี้อาจเป็นยุคทองของเซิร์ฟเวอร์ CPU

    • เมื่อ 7 ปีก่อนมีแค่ Xeon ของ Intel
    • ตอนนี้มีตัวเลือกหลากหลายแล้ว
  • รอคอยที่จะได้เห็น Hetzner เปิดให้ใช้เซิร์ฟเวอร์ bare metal ที่ใช้ AMD Turin

    • รุ่นก่อนหน้าก็คุ้มค่ามากอยู่แล้ว แต่ครั้งนี้ดูเหมือนจะไปได้ไกลขึ้นอีกขั้น
  • เมื่อ 20 ปีก่อน CPU หนึ่งตัวมีแค่ 1-2 คอร์ และถ้าเป็นเซิร์ฟเวอร์ dual-socket ที่มี 4 คอร์รวมกันก็ถือว่าโชคดีมาก

    • ตอนนี้ในเซิร์ฟเวอร์เครื่องเดียวสามารถมีได้เกือบ 400 คอร์
    • คอร์ ARM อาจมีได้มากกว่า แต่ตอนนี้ก็ยังไม่ได้แรงเท่าพวกนี้
  • สำหรับคนที่ไม่ชอบการเปลี่ยนไปใช้ Substack ก็มีเว็บไซต์ทางเลือกอยู่

  • กำลังใช้งาน Dell PowerEdge อายุ 12 ปีที่เป็น dual Xeon อยู่

    • รอวันที่เซิร์ฟเวอร์ Epyc รุ่นแรกๆ หลุดมาใน eBay ราคาถูก
  • ChipsAndCheese เป็นหนึ่งในสื่อเทคโนโลยีรุ่นใหม่ที่มีความรู้ยอดเยี่ยม โดยเฉพาะด้าน benchmark เชิงลึก

    • ในยุคที่เว็บไซต์เทคโนโลยีรุ่นเก่าอย่าง Anandtech, TechReport, HardCOP และอื่นๆ หายไป ก็น่ายินดีที่ยังมีสำนักใหม่ที่รักษาสไตล์แบบนี้ไว้ได้
  • ออกมาได้จังหวะพอดีกับ Factorio 2.0

  • อยากเห็น 9965 ตอนทำงานจริง

    • ชิ้นส่วนพวกนี้น่าทึ่งมาก
    • มีแผนจะซื้อเครื่องในเจเนอเรชันนี้
  • ในวิดีโอที่เวลา 1:11 มีกราฟ TDP อยู่

    • ทำงานร้อนมากที่ 125-500W