- เบนช์มาร์กประสิทธิภาพ CPU และความคุ้มค่าของ 7 คลาวด์ (VM 44 ประเภท) ครอบคลุมทั้งซิงเกิลเธรด มัลติเธรด อินสแตนซ์แบบจองล่วงหน้า และสปอตอินสแตนซ์
- AMD EPYC Turin ครองอันดับ 1 ในแทบทุกการทดสอบ และก้าวขึ้นมาเป็น CPU ระดับท็อปใหม่ของฝั่ง x86
- ในด้านประสิทธิภาพต่อราคาแบบ on-demand นั้น Hetzner และ Oracle Cloud ครองอันดับต้น ๆ ส่วน AWS หากไม่นับ Turin แล้ว โดยรวมมีความคุ้มค่าต่อราคาย่ำแย่ที่สุด
- Intel Granite Rapids แก้ปัญหาความไม่เสถียรด้านประสิทธิภาพของ Emerald Rapids รุ่นก่อน และให้ประสิทธิภาพที่สม่ำเสมอ แต่ช่องว่างกับ Turin ยังห่างมาก
- หากใช้สปอตอินสแตนซ์ จะได้ประสิทธิภาพต่อดอลลาร์ราว 2 เท่า เมื่อเทียบกับการจองล่วงหน้า 3 ปี จึงเป็นเครื่องมือหลักของการ เพิ่มประสิทธิภาพต้นทุนคลาวด์
ภาพรวมเบนช์มาร์กและวิธีวิทยา
- กลุ่มที่เปรียบเทียบ: ผู้ให้บริการ 7 ราย AWS, GCP, Azure, Oracle Cloud(OCI), Akamai(Linode), DigitalOcean, Hetzner รวม VM 44 ประเภท
- เพื่อให้การเปรียบเทียบต้นทุนมีความสม่ำเสมอ ทุกอินสแตนซ์ถูกกำหนดให้ใช้สเปก 2vCPU, RAM 2GB/vCPU, SSD 30GB
- AMD และ Intel ใช้ SMT (ไฮเปอร์เธรดดิ้ง) ทำให้ 2vCPU = 1 คอร์จริง ส่วน ARM และข้อยกเว้น x86 บางรายการ (AWS C8a, C7a, GCP t2d) ใช้ 2vCPU = 2 คอร์จริง
- ราคา on-demand อ้างอิงจากรีเจียนในสหรัฐฯ ที่ถูกที่สุด ราคาเป็นข้อมูล ณ เดือนมกราคม 2026 และควรตรวจสอบราคาปัจจุบันเพิ่มเติม
- เครื่องมือเบนช์มาร์กที่ใช้: DKbench (เบนช์มาร์กหลัก เวิร์กโหลดเซิร์ฟเวอร์ 19 แบบบนพื้นฐาน Perl·C/XS), Geekbench 5, 7zip, NGINX, FFmpeg/libx264, OpenSSL RSA4096(AVX512)
- ไม่ใช้ Geekbench 6 เนื่องจากพิจารณาว่าวิธีวัดมัลติคอร์มีข้อบกพร่องด้านการออกแบบ
- เพื่อดูช่วงของประสิทธิภาพ มีการสร้างและทดสอบอินสแตนซ์ซ้ำในหลายรีเจียน แล้วแสดงเป็นช่วงค่าต่ำสุดถึงค่าสูงสุด
ภาพรวมระดับประสิทธิภาพตามเจเนอเรชัน CPU
- AMD: Rome → Milan → Genoa → Turin (เรียงตามรุ่น จากล่าง→บน)
- Intel: Broadwell → Skylake → Cascade Lake → Ice Lake → Sapphire Rapids → Emerald Rapids → Granite Rapids
- ARM: Ampere Altra → AmpereOne → AmpereOne M / AWS Graviton2 → Graviton3 → Graviton4 / Google Axion / Azure Cobalt 100
- CPU รุ่นเก่ามีประสิทธิภาพต่ำกว่า แต่กลับ ถูกคิดค่าบริการแพงกว่า เพราะต้นทุนการดำเนินงาน จึงควรอัปเกรดเป็นเจเนอเรชันใหม่ที่สุดเท่าที่ทำได้
ผลลัพธ์ประสิทธิภาพซิงเกิลเธรด
- AMD EPYC Turin ได้อันดับ 1 โดยรวม และเป็นครั้งแรกของซีรีส์ที่ทิ้งห่างคู่แข่งอย่างชัดเจนเช่นนี้
- AWS C8a (Turin, ปิด SMT) คือคอนฟิก Turin ที่เร็วที่สุด
- GCP c4d มีความแปรปรวนของประสิทธิภาพสูง และ n4d ที่ราคาถูกกว่าทำได้ดีกว่าในแง่ความสม่ำเสมอ
- Intel Granite Rapids: แก้ปัญหาประสิทธิภาพไม่เสถียรจากการพึ่ง boost clock และการแย่งทรัพยากรโหนดของ Emerald Rapids ได้ ทำให้ให้ประสิทธิภาพที่สูงและสม่ำเสมอกว่า
- GCP Emerald Rapids มีอาการประสิทธิภาพลดลงชัดเจนเมื่อโหลดเพิ่มขึ้น และ GCP มีโหมด "ประสิทธิภาพสม่ำเสมอ" (ปิด boost) แยกต่างหากสำหรับกรณีนี้
- ฝั่ง ARM นั้น Google Axion ให้ประสิทธิภาพซิงเกิลเธรดระดับ EPYC Genoa และขึ้นมาเป็นผู้นำด้านประสิทธิภาพเซิร์ฟเวอร์ ARM
- Azure Cobalt 100 อยู่ระหว่าง Graviton3 กับ Graviton4
- Ampere AmpereOne M ปรับปรุงขึ้นเล็กน้อยมาถึงระดับ AWS Graviton3
- ในกลุ่มผู้ให้บริการราคาประหยัด DigitalOcean มีแนวโน้มคะแนนประสิทธิภาพลดลง ส่วน Akamai และ Hetzner ทำได้ดีบนอินสแตนซ์ Milan แต่ไม่สามารถการันตีระดับประสิทธิภาพตอนสร้างอินสแตนซ์ได้
ประสิทธิภาพมัลติเธรดและการสเกล
- การสเกล (Scalability): อินสแตนซ์ ARM และ shared CPU เข้าใกล้ ~100% หมายถึง 2vCPU ให้ประสิทธิภาพประมาณ 2 เท่าของ vCPU เดี่ยว
- อินสแตนซ์ x86 ที่ใช้ SMT จะต่ำกว่า 100% และยิ่งใกล้ 50% มากเท่าไร ก็ยิ่งแทบไม่ได้ประโยชน์ด้านประสิทธิภาพ
- โดยทั่วไป AMD มีประสิทธิภาพ SMT ดีกว่า Intel และ Intel ก็มีแนวโน้มดีขึ้นตั้งแต่ Ice Lake เป็นต้นมา
- อินสแตนซ์ Turin ของ Akamai ทำสเกลได้สูงผิดปกติที่ 71.9% ทั้งที่ใช้ SMT (ยังไม่ทราบสาเหตุ)
- อินสแตนซ์ที่ปิด SMT: AWS C7a(Genoa), C8a(Turin), GCP t2d(Milan)
- ผู้นำด้านมัลติเธรด: AWS C8a ที่ใช้ Turin และปิด SMT ครองกราฟอย่างขาดลอย
- Google Axion อยู่ในระดับเดียวกับ Genoa C7a ที่เคยเป็นอันดับ 1 ในการเปรียบเทียบก่อนหน้า
- Graviton4 ตามมาติด ๆ และ Cobalt 100 ตามหลังมา
- กลุ่มล่างคือ Intel Broadwell/Skylake/Ice Lake และ AMD Rome
- 7zip: Turin ครองอันดับ 1 โดยรวม แต่ Axion และ Graviton4 แซง Turin ในงานแตกไฟล์ ส่วน Cobalt 100 ให้ประสิทธิภาพแตกไฟล์สูงสุดเดี่ยว ๆ
- NGINX (100 connections): AWS C8a เร็วกว่าอันดับ 2 เกือบ 2 เท่า และ Granite Rapids ก็ทำผลงานได้ดีมาก
- FFmpeg H264: Turin เป็นอันดับ 1 และ Granite Rapids ก็สูสีในซิงเกิลเธรด; เมื่อใช้ครบ 2 คอร์ Axion แซงอินสแตนซ์ SMT (คอร์เดี่ยว) เกือบทั้งหมด ยกเว้น Turin
- OpenSSL RSA4096(AVX512): AMD แซง Intel แม้ในส่วนขยายที่ตนเองไม่เคยเด่นมาก่อน โดยทั้ง Turin และ Genoa เหนือกว่า Intel ทุกเจเนอเรชัน; Granite Rapids แทบไม่ได้ดีขึ้นมากเมื่อเทียบกับ Ice Lake; ARM และ AMD รุ่นเก่าไม่รองรับ AVX512 จึงตามหลังแม้แต่ Intel Skylake หรือต่ำกว่า
การเปรียบเทียบประสิทธิภาพ/ราคาแบบ on-demand
- ซิงเกิลเธรด: Hetzner (หากนับ shared core จะทิ้งห่างเป็นอันดับ 1) และ Oracle อยู่อันดับบน ตามด้วย GCP n4d(Turin) และ Linode
- AWS มีความคุ้มค่าต่อราคาแย่ที่สุดในแบบ on-demand; Turin คือทางเลือกที่ดีที่สุดภายใน AWS แต่รุ่นเก่าติดอันดับท้ายสุด
- มัลติเธรด: อินสแตนซ์ ARM ของ Oracle (AmpereOne M) เป็นอันดับ 1 โดย Hetzner และ Linode แบบ shared core ตามมาติด ๆ
- Google Axion, Azure Cobalt 100 และ DigitalOcean Droplet อยู่ในกลุ่มระดับรอง
- Hetzner shared core (CPX22, CAX11) แม้มีข้อจำกัดด้านความพร้อมใช้งาน (จำกัดที่รีเจียน EU·AP และมักเต็มบ่อย) แต่ราคาต่อหน่วยประสิทธิภาพยังเหนือกว่าผู้ให้บริการรายอื่นอย่างชัดเจน
การเปรียบเทียบประสิทธิภาพ/ราคาแบบจองล่วงหน้า
- จอง 1 ปี: GCP Turin(n4d·c4d) สูสีกับ Oracle และ Azure Cobalt 100 กับ Genoa ก็มีความคุ้มค่าน่าสนใจ
- สำหรับ AWS ตระกูล C8a คือทางเลือกที่ดีที่สุด และผ่านผู้ให้บริการภายนอกอย่าง DoIT Flexsave ก็สามารถใช้ราคาแบบ 1 ปีได้โดยไม่ต้องจองล่วงหน้า
- จอง 3 ปี ซิงเกิลเธรด: GCP Turin นำ Oracle และ VM แบบ dedicated ของ Hetzner อยู่เล็กน้อย; Azure ก็แข่งขันได้ดีด้วย Cobalt 100 และ Genoa
- AWS แม้ผูกสัญญา 3 ปี ก็ยังให้ความคุ้มค่าดีกว่า Akamai และ DigitalOcean
- จอง 3 ปี มัลติเธรด: Azure Cobalt 100 ได้อันดับ 1 แบบเหนือความคาดหมาย; ตามด้วย GCP และ OCI ARM; ส่วน Turin ของ AWS และ GCP ก็เกือบติดกลุ่มบน
การเปรียบเทียบประสิทธิภาพ/ราคาแบบสปอต/พรีเอ็มป์ทิเบิลอินสแตนซ์
- สปอตอินสแตนซ์ถูกมองว่าเป็น วิธีเดียวบนคลาวด์ที่ทำให้ต้นทุนเข้าใกล้การรันเซิร์ฟเวอร์เองได้
- การแจ้งเตือนก่อนเรียกคืนอินสแตนซ์: AWS และ OCI 2 นาที, Azure และ GCP 30 วินาที
- Oracle ลดราคาแบบคงที่ 50% ส่วนอีก 3 รายมีความผันผวนสูงตามรีเจียนและช่วงเวลา
- สปอตซิงเกิลเธรด: Oracle Turin ครองอันดับบนเสมอด้วยส่วนลดคงที่; GCP และ Azure ให้ส่วนลดลึกที่สุด (Genoa, Cobalt 100)
- หากใช้สปอต จะได้ประสิทธิภาพต่อดอลลาร์ประมาณ 2 เท่า เทียบกับการจอง 3 ปี
- สปอตมัลติเธรด: Azure Cobalt 100 อันดับ 1, OCI AmpereOne M อันดับ 2; ฝั่ง GCP นั้น t2d(Milan) อาจคุ้มค่าที่สุดขึ้นอยู่กับรีเจียน; AWS พออาศัย Turin จึงเข้า Top 10 ได้
สรุปตามผู้ให้บริการคลาวด์
- AWS: เสียตำแหน่ง ARM ที่แรงที่สุดโดยรวมให้ Google Axion เพราะ Graviton5 ยังเป็น private beta แต่ยังรักษาตำแหน่ง x86 ที่แรงที่สุดด้วย C8a(Turin) แบบไม่ใช้ SMT; ราคา on-demand สูงกว่าคู่แข่ง แต่เมื่อใช้สปอต จองล่วงหน้า หรือ Flexsave ก็ยังแข่งขันได้; อินสแตนซ์รุ่นเก่าลดราคาน้อย ทำให้ C8a ยังเป็นตัวเลือกสปอตที่ดีที่สุด
- GCP: แนะนำอินสแตนซ์ ARM รุ่นที่ 4 (Axion c4a) และ AMD (Turin n4d·c4d); n4d ให้ประสิทธิภาพแทบไม่ต่างจาก c4d แต่ถูกกว่า; Granite Rapids เข้าถึงไม่ได้หากไม่เพิ่มค่า local SSD (ปัจจุบันยังไม่รองรับ
min_cpu_platform); สปอตต้องเลือกประเภทอินสแตนซ์ที่เหมาะที่สุดตามแต่ละรีเจียน
- Azure: ARM ที่พัฒนาขึ้นเองอย่าง Cobalt 100 มีประสิทธิภาพต่ำกว่า Google Axion เล็กน้อย แต่ราคายังแข่งขันได้; Turin และ Granite Rapids ยังเป็น private preview ณ เวลาที่เขียน; และขึ้นอันดับ 1 แบบไม่คาดคิดในมัลติเธรดแบบจอง 3 ปี
- Oracle: แนะนำอย่างมากสำหรับโปรเจกต์ขนาดเล็กด้วย VM ARM ฟรี 4 คอร์ (A1); อินสแตนซ์แบบเสียเงินก็คุ้มค่าพอ ๆ กับราคาจอง 1-3 ปีของ Big 3 แม้เทียบแบบ on-demand; AmpereOne M(A4) และ Turin E6 เป็นตัวเลือกที่ดีที่สุดของ ARM และ x86 ตามลำดับ; A4 ยังมีรีเจียนให้ใช้งานจำกัด
- Akamai(Linode): Linode แบบ shared core มีความคุ้มค่า on-demand รองจาก Hetzner และ Oracle; ตอนสร้างไม่สามารถเลือก CPU ได้ จึงต้องตรวจสอบเองว่าเป็น Milan หรือไม่ผ่าน
/proc/cpuinfo; อินสแตนซ์แบบ dedicated ระบุเจเนอเรชันได้ (G8=Turin) แต่ประสิทธิภาพซิงเกิลเธรดกลับต่ำผิดปกติ
- DigitalOcean: ไม่ได้อัปเกรดมานาน ทำให้อันดับด้านประสิทธิภาพลดลง และยังมีอาการโอเวอร์โหลดด้วย; แต่ความสะดวกใช้งาน เช่น การอัปเกรดอินสแตนซ์แบบง่าย (เปลี่ยนประเภทได้ในคลิกเดียว) ยังมีอยู่
- Hetzner: มีชื่อเสียงดีในหมู่ผู้ใช้ระยะยาว และไม่มีการโอเวอร์โปรวิชันเกินควร (ยกเว้น CX23); shared core อย่าง CPX22(Genoa) และ CAX11(ARM Altra) คุ้มค่าที่สุด แต่จำกัดเฉพาะรีเจียน EU·AP และมักเต็มบ่อย; dedicated core CCX13 มีความต่างของประสิทธิภาพตามดาต้าเซ็นเตอร์
คำแนะนำสุดท้าย
- งบต่ำสุด: Oracle Free Tier → Hetzner (หากรับได้กับรีเจียน EU·AP) → สปอตอินสแตนซ์ (Azure ARM, Oracle·GCP ARM/AMD)
- ความคุ้มค่าสูงสุดสำหรับ CPU แบบไม่แชร์ (on-demand): Oracle AmpereOne M A4 หรือ Turin E6; หากจองล่วงหน้า Azure Dpls_v6, GCP c4a/n4d และ AWS C8a ก็แข่งขันได้
- ประสิทธิภาพสูงสุด: AWS C8a (Turin แบบไม่ใช้ SMT) ให้ประสิทธิภาพต่ออินสแตนซ์สูงสุด และอินสแตนซ์ของผู้ให้บริการรายใหญ่ทุกเจ้าที่ใช้ Turin อยู่ในระดับรองลงมา
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
เรารันเทสต์ขนาดใหญ่ใน CI ของเรา ใช้อินสแตนซ์ AMD Turin ของ GCP ซึ่งในบทความก็บอกว่าอยู่ในกลุ่มที่เร็วที่สุด
แต่ที่น่าประหลาดใจก็คือ AMD EPYC 4565p เร็วกว่า Turin บนคลาวด์ในงาน single-core ได้มากสุดถึง 2 เท่า
บน GCP เทสต์ใช้เวลา 2 นาที แต่บน 4565p เสร็จใน 1 นาที บนคลาวด์บูสต์ค้างที่ 4.1GHz ส่วนเครื่องของฉันค้างที่ 5.1GHz
บน GCP ราคา $130/เดือนสำหรับ 8vCPU (สปอตอินสแตนซ์) แต่ 4565p ของฉันเป็น CPU ราคา $500 ได้ 32vCPU และทั้งเครื่องราคาไม่ถึง $2,000
สำหรับงาน CI ฉันคิดว่า เอาเครื่องขึ้นแร็กเองคุ้มกว่ามาก จ่ายค่าคลาวด์ไม่กี่เดือนก็คืนทุนแล้ว และยังได้ประสิทธิภาพ 2 เท่า
มาร์จินของผู้ให้บริการยุโรปต่ำกว่าของอเมริกามาก ถ้าคิดแบบตรงๆ ต้อง 17 เดือนกว่าจะคุ้ม และถ้ารวมค่า colo ก็ต้องราว 8 ปีถึงจะคืนทุน
ต่อให้ colo ฟรีก็ยังต้องใช้เวลาเกิน 1 ปี
เดี๋ยวนี้นักพัฒนาหลายคนรู้สึกว่า bare metal ยุ่งยาก แต่จริงๆ แล้วคลาวด์ก็ซับซ้อนพอๆ กันหรืออาจจะมากกว่าด้วยซ้ำ
ฉันทำงานอยู่ทีม Google Compute Engine VM บทความนี้เป็นเบนช์มาร์กที่สรุปมาได้ดีมากจริงๆ
Genoa เป็นก้าวกระโดดครั้งใหญ่จาก Milan และ Turin ก็ยิ่งใหญ่กว่านั้นอีก AMD ช่วงนี้ทำได้ดีมากจริงๆ ขอปรบมือให้ ทีมของ Lisa Su
แอ็กเซลเลอเรเตอร์อย่าง MI300 แม้สเปกจะสู้ได้ แต่เพราะซอฟต์แวร์สแต็กอ่อน เลยแทบไม่มีใครสนใจ
Vultr กับ HostHatch ก็เป็นตัวเลือกที่น่าพิจารณา
ฉันลองเทียบกับพีซีเกมมิงของตัวเอง (9800X3D, 8 คอร์ 5.2GHz)
ถ้าดูผล 7-Zip กับ Geekbench จะเห็นว่า CPU เดสก์ท็อปเร็วกว่ามากทั้งแบบ single-thread และ multi-thread
ประสิทธิภาพ single-thread ของ C8A ถือว่าโอเค แต่ ประสิทธิภาพหน่วยความจำแย่มาก
สงสัยว่าการย้ายออกจาก Oracle Cloud ทำได้ง่ายแค่ไหน เบนช์มาร์กออกมาดูดี แต่ได้ยินมาว่า ล็อกอินด้วยไลเซนส์ หนักมาก
แต่เพราะมันถูกมาก ฉันเลยยังเอาโปรเจกต์เล็กๆ ไว้บน Oracle Cloud อยู่ ไม่ใช้ DBaaS ใช้แค่ Linux VM ธรรมดา
แต่ UX แย่มากจริงๆ
ทีมเซลส์ติดต่อมาเรื่อยๆ แต่ก็แก้ปัญหาไม่ได้ ใน Reddit ก็มีคนเจอแบบเดียวกันเยอะ
ฉันยังใช้ CPU ROME EPYC ที่ซื้อมาหลายร้อยดอลลาร์อยู่เลย ประสิทธิภาพต่อพลังงานไม่ค่อยดี แต่ประสิทธิภาพแบบ multi-thread ดีกว่า 9950X
รู้สึกดีที่เห็นว่าอินเทอร์เน็ตไฟเบอร์ 250/250 ราคา 36 ยูโรที่ฉันจ่ายอยู่ยังถือว่าแข่งขันได้ดี
ดูแล้วยังไง การเป็นเจ้าของฮาร์ดแวร์เองก็ถูกกว่ามาก โดยเฉพาะในสภาพแวดล้อมพัฒนา/ทดสอบ
ฉันไม่เข้าใจว่าทำไมบริษัทใหญ่ๆ ที่มีต้นทุนเงินทุนต่ำกว่า AWS ยังเลือกไปคลาวด์
แต่ตอนนี้โครงสร้างมัน รวมค่าแรงวิศวกรของ AWS เข้าไปแล้ว ดังนั้นในความเป็นจริงก็ยังแพงอยู่ดี
สมัยนี้เซิร์ฟเวอร์มีได้ถึง 288 คอร์แล้ว การซื้อเผื่อและรันเองก็ทำได้สบาย
รันเวิร์กโหลดหลักบนฮาร์ดแวร์ของตัวเอง แล้วใช้คลาวด์สตอเรจควบคู่กันไปก็เพียงพอแล้ว
ในโลกจริง เหตุผลที่ใหญ่กว่าคือ “เพราะทุกคนก็ทำกัน”
ดูบทความที่เกี่ยวข้อง
มันน่าแปลกดีที่ Oracle ดูเหมือนจะเป็น ตัวเลือกที่คุ้มราคา แต่ก็คงเชื่อใจมันในระยะยาวไม่ได้