Nvidia เสนอระบบ CPU สุดโหดสำหรับพีซี Windows
(twitter.com/lemire)- ระบบประสิทธิภาพสูงสำหรับพีซี Windows ของ NVIDIA ใช้ชิปที่ให้ CPU·GPU ใช้ หน่วยความจำร่วม 128GB ร่วมกัน และมี CUDA core ได้สูงสุด 6,144 คอร์
- CPU มีคอร์ประสิทธิภาพ 10 คอร์และคอร์ประหยัดพลังงาน 10 คอร์ โดยคอร์ประสิทธิภาพอิงกับ Cortex-X925 และ SVE2 แม้จะด้อยกว่าชิป AMD รุ่นล่าสุด แต่ก็ยังดีกว่า Apple Silicon
- จุดแตกต่างสำคัญคือ หน่วยความจำแบบรวมศูนย์ ที่ไม่แยกหน่วยความจำของ CPU และ GPU แม้จะช้ากว่าหน่วยความจำเฉพาะของ GPU แต่เป็นโครงสร้างที่มุ่งตอบโจทย์ทั้งแบนด์วิดท์และต้นทุนสำหรับการรันโมเดล AI แบบโลคัล
- ยังมีมุมมองว่าความต้องการรันโมเดล AI แบบโลคัลยังเป็นเพียงแอปพลิเคชันเฉพาะกลุ่ม ขณะที่อีกมุมหนึ่งมองว่าหน่วยความจำร่วม 128GB อาจสำคัญกว่าค่า peak GPU TFLOPs สำหรับการทดลองระดับนักศึกษา
- แกนเปรียบเทียบคือ AMD Strix Halo, Intel Xe3P AI GPU และ AVX-512 ของโปรเซสเซอร์ AMD รุ่นล่าสุด รวมถึงข้อจำกัดที่ RAM ถูกบัดกรีติดบอร์ดทำให้เปลี่ยนภายหลังได้ยาก
สเปกระบบและโครงสร้างหน่วยความจำ
- ระบบ CPU สำหรับพีซี Windows ที่ Nvidia เสนอมาใช้หน่วยความจำร่วม 128GB และมี CUDA core รุ่นล่าสุดได้สูงสุด 6,144 คอร์
- CPU ประกอบด้วยคอร์ประสิทธิภาพ 10 คอร์และคอร์ประหยัดพลังงาน 10 คอร์ โดยคอร์ประสิทธิภาพอิงกับ Cortex-X925
- มีการเปรียบเทียบว่า SVE2 ของ Cortex-X925 ตามสเปกแล้วด้อยกว่าชิป AMD รุ่นล่าสุด แต่ดีกว่า Apple Silicon
- โปรเซสเซอร์ AMD รุ่นล่าสุดทั้งหมดรองรับ AVX-512 และมีการเปรียบเทียบว่า AVX-512 เหนือกว่า SVE2 ของ Cortex-X925 อย่างมาก ทั้งประมวลผลข้อมูลได้มากกว่าและใช้งานได้อเนกประสงค์กว่า
- ขณะที่ Intel ยังระมัดระวังในการใส่ AVX-512 ให้ระบบสำหรับผู้บริโภคจนถึงตอนนี้
- หน่วยความจำแบบรวมศูนย์ขนาด 128GB เป็นแนวทางที่ใช้พูลหน่วยความจำเดียวร่วมกันแทนการแยกหน่วยความจำของ CPU และ GPU ซึ่งเป็นโครงสร้างเดียวกับแนวทางที่ Apple เลือกใช้เมื่อหลายปีก่อน
- หน่วยความจำแบบรวมศูนย์กำลังได้รับความนิยมมากขึ้น แม้จะไม่เร็วเท่าหน่วยความจำเฉพาะของ GPU แต่ข้อดีคือมีต้นทุนต่ำพอที่จะให้แบนด์วิดท์เพียงพอสำหรับการรันโมเดล AI แบบโลคัล
- มีความเห็นว่าใน RAM แบบรวมศูนย์ไม่จำเป็นต้องส่งข้อมูลไปมาระหว่าง CPU และ GPU และทุกอย่างอยู่ในพูลหน่วยความจำเดียว จึงให้ความรู้สึกเหมือนการประมวลผลแบบ zero-copy
- ประเด็นที่น่าจับตาคือ Intel และ AMD จะตอบสนองอย่างไร
ความเห็นที่เกี่ยวข้องหลากหลาย
- ยังไม่ชัดเจนว่าความต้องการรันโมเดล AI แบบโลคัลจะมีมากเพียงใด และตอนนี้ยังเป็นแอปพลิเคชันเฉพาะกลุ่ม
- มีทั้งมุมมองว่าระบบนี้อาจเป็นเครื่องที่ดีสำหรับวิดีโอเกม และข้อโต้แย้งว่ามันไม่ได้ออกแบบมาเพื่อเกม แต่เน้นโมเดลขนาดใหญ่ จึงอาจเล่นเกมได้ไม่ดีอย่างที่คาด
- มีข้อเสนอว่าการทดลองระดับนักศึกษา หน่วยความจำร่วม 128GB อาจสำคัญกว่าค่า peak GPU TFLOPs และอาจเปลี่ยนขอบเขตของโมเดลหรือเวิร์กโหลดที่สามารถทดลองแบบโลคัลได้
- ข้อแลกเปลี่ยนคือ RAM ไม่สามารถเปลี่ยนทีหลังได้และถูกบัดกรีติดทั้งหมด
- ความต้องการด้านความจุหน่วยความจำมีความเห็นว่า 128GB ยังไม่พอ และต้องการ 256GB หรือ 512GB บ้าง บางคนมองว่าเครื่อง AI ระดับ “beast” ต้องมีอย่างน้อย 512GB และบางคนก็อยากได้ตัวเลือกหน่วยความจำแบบรวมศูนย์ 1TB
- คำตอบสั้น ๆ ของผู้เขียนต่อเหตุผลที่เลือก 128GB คือ "ต้นทุน"
- ในประเด็นระบบปฏิบัติการ มีทั้งคำกล่าวว่าไม่ได้รัน “regular Windows” พร้อมแสดงความเสียดายเรื่องระบบปฏิบัติการ และมีข้อเสนอให้ติดตั้ง Linux
- AMD Strix Halo เป็นผลิตภัณฑ์ลักษณะใกล้เคียงที่มีหน่วยความจำแบบรวมศูนย์ 128GB และ iGPU ขนาดใหญ่ พร้อม AVX-512 แบบเดียวกับเดสก์ท็อป Zen 5 ให้ใช้เปรียบเทียบ
- จากประสบการณ์ใช้งาน AMD Strix Halo เป็นเวลาไม่กี่เดือนในโฮมแล็บ LLM แบบโลคัล พบว่าสามารถรัน LLM ระดับ prosumer ได้ แต่คอขวดจริงคือแบนด์วิดท์หน่วยความจำ
- มีข้อเรียกร้องว่าชิป Nvidia ใหม่ควรมีแบนด์วิดท์หน่วยความจำมากกว่า 300GB/s
- RTX5090 อาจคุ้มค่ากว่าสำหรับโมเดลขนาดเล็กที่ต้องการความเร็ว หากมีเดสก์ท็อปอยู่แล้ว และบอร์ดตระกูลนี้อาจเหมาะกับโมเดลโลคัลที่ใหญ่กว่ามากกว่า
- ข้อดีของการรัน AI แบบโลคัลคือไม่ต้องส่งข้อมูลลับหรือข้อมูลลูกค้าไปให้บุคคลที่สามซึ่งความรับผิดชอบไม่ชัดเจน ช่วยหลีกเลี่ยงค่าสมาชิก SaaS และค่าโทเค็น และเชื่อมโยงกับการให้โมเดลโลคัลเรียนรู้พฤติกรรมการใช้งานพีซีเพื่อทำงานแทน
- โมเดลโลคัลอาจทำงานเป็นฟังก์ชันเบื้องหลังที่ผู้ใช้ไม่เห็น และงานที่ต้องการความฉลาดสูงกว่าหรือบริบทมากกว่าสามารถออฟโหลดไปประมวลผลระยะไกลได้
- แก่นสำคัญไม่ใช่ตัวโมเดลโลคัลเพียงอย่างเดียว แต่คือแพลตฟอร์มซอฟต์แวร์ที่รองรับแอปพลิเคชัน AI แบบบูรณาการ และเป็นวิธีทำให้เดสก์ท็อปยังคงมีความเกี่ยวข้อง
- ตัวอย่างว่าการเปิดใช้ Google Chrome อาจเป็นกรณีใช้งาน AI แบบโลคัลได้ อ้างอิงจากเอกสาร built-in AI ของ Chrome
- รายการเปรียบเทียบ Intel Xe3P AI GPU ระบุ 160GB LPDDR5X, ความเป็นไปได้สูงสุด 480GB, อินเทอร์เฟซหน่วยความจำ 640 บิต, และโครงแบบ PCIe x16: https://tomshardware.com/pc-components/gpus/…
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
พูลหน่วยความจำแบบรวม ดูเหมือนจะยังคงเป็น “ตัวเปลี่ยนเกม” โดยเฉพาะในสถาปัตยกรรมระบบนอกดาต้าเซ็นเตอร์
เกมสมัยใหม่หรืองานฝั่งผู้บริโภคเองก็ไม่ได้ใช้แบนด์วิดท์ PCIe ของ GPU หรือแบนด์วิดท์หน่วยความจำ GDDR ได้เต็มจริง ๆ และ AI บนเครื่องสำหรับผู้ใช้ทั่วไปก็ไม่ได้ได้ประโยชน์จากหน่วยความจำที่เร็วกว่าอย่างมีนัยสำคัญนัก
หน่วยความจำแบบรวมช่วยให้ปรับการใช้งานให้เหมาะตามความต้องการได้ และไม่ต้องมาคิดแยกว่าจะจัด GDDR/DDR อย่างไร จึงลดต้นทุนหน่วยความจำโดยรวมในอุปกรณ์ขนาดเล็กและพกพาได้
ข้อเสียคือเรื่อง ความปลอดภัย เพราะการโจมตี side-channel ต่อหน่วยความจำจากฝั่ง GPU หรือ CPU อาจลุกลามไปอีกฝั่งได้ จึงน่าจะยิ่งทำให้การออกแบบเพื่อความปลอดภัยของหน่วยความจำสำคัญขึ้น และน่าจะเป็นทิศทางที่ดีสำหรับผู้สนับสนุน Rust
แก่นของเกมไม่ใช่การทำให้ฮาร์ดแวร์อิ่มตัว แต่คือการสร้างผลลัพธ์ที่สม่ำเสมอภายใน เวลาปิดเฟรม
ต่อให้พยายามทำให้ 5090 อิ่มตัวด้วยเกม ตลาดเป้าหมายก็เล็ก และต้องทำให้สเปกจริงของผู้ใช้รันได้ดีพอ ๆ กับเครื่องทดสอบเพื่อรักษาเฟรมเรตด้วย
หนึ่งในความต่างที่ใหญ่ที่สุดระหว่างคอนโซลเจเนอเรชันปัจจุบันกับพีซีเจเนอเรชันปัจจุบันก็คือหน่วยความจำแบบรวม
งาน 99% ต้องการหน่วยความจำระบบมากกว่าหน่วยความจำ GPU อย่างน้อยหนึ่งหลัก และระบบส่วนใหญ่แทบไม่ต้องการหน่วยความจำ GPU เกินกว่าระดับที่พอสำหรับวิดีโอหรือการท่องเว็บ
ต่อให้มีกรณีใช้งานใหม่เกิดขึ้น โครงสร้างนี้ก็ไม่ได้กลับหัวทั้งหมด และถ้าตอนนี้ต้องใช้ 128GB และ AI บนเครื่องก็ต้องใช้ 128GB เช่นกัน ถ้าจะทำงานเดิมต่อไปก็ย่อมต้องใช้ 256GB
ที่จริงแล้วมันดูเหมือนเป็นข้อโต้แย้งว่าไม่ควรใช้หน่วยความจำราคาแพงขนาดนั้นกับ GPU มากกว่า และถ้าเน้นแค่งาน inference อย่างเดียวก็อาจจะจริง
ใน สถาปัตยกรรมหน่วยความจำแบบรวม จะต้องยอมแลกประสิทธิภาพไปมากพอสมควร ซึ่งอาจสมเหตุสมผลในบางสถานการณ์ แต่ไม่ใช่คำตอบสารพัดประโยชน์
ไม่แน่ใจว่ามีคนรันโมเดล AI บนเครื่องมากแค่ไหน และตอนนี้ก็ยังดูเป็นตลาดเฉพาะกลุ่ม แต่จากการปล่อย Gemma ช่วงหลัง ๆ ก็มีแนวโน้มมากขึ้นว่าบางโมเดลจะถูกรันบนเครื่องได้เพียงเพราะเรื่องต้นทุน
ถ้าคิดถึงความปลอดภัยระดับองค์กรก็ยิ่งเป็นอย่างนั้น เพียงแต่ก็ยังไม่ค่อยเข้าใจว่าสถาปัตยกรรมแบบนี้ดีต่อการเล่นเกมอย่างไร จึงสงสัยกับประโยคเต็มในต้นฉบับ
อีกอย่าง การแปะคำอย่าง “Stanford/Elsevier 2025 นักวิทยาศาสตร์ 2% แรกของโลก, GitHub นักพัฒนา 1000 อันดับแรก” ไปทั่ว ๆ กลับให้ความรู้สึกเหมือนส่งผลย้อนกลับ
เคย deploy ลง MacBook M5 หลายเครื่องแล้ว และใช้งานจริงได้ในหลายงาน
มันยังแทน Opus หรือโมเดลระดับ Sonnet รุ่นปัจจุบันไม่ได้ แต่ถ้าเทียบกับขนาดแล้วดีจนน่าทึ่ง และดูอยู่ราว ๆ ช่วง Sonnet 4 หรือก่อนหน้านั้นเล็กน้อย
ในการเรียกใช้เครื่องมือ งานเขียนโค้ด และงานแบบเอเจนต์ มันเสถียรกว่าโมเดล Gemma มาก และยิ่งเร็วขึ้นอีกโดยเฉพาะเมื่อใช้ MTP
ไม่เข้าใจว่าทำไม เศรษฐศาสตร์ของขนาด ที่ใช้ได้กับงานคำนวณอื่น ๆ ถึงจะใช้ไม่ได้กับเรื่องนี้
ไม่ได้อยากลดคุณค่างานของผู้เขียน แต่บทความนี้ให้ความรู้สึกว่าไม่ได้ลงลึกจริง ๆ และเหมือนเขียนจากการดูแค่ ตารางสเปก
แม้จะมีจำนวนคอร์เท่ากับ 5070 mobile แต่แบนด์วิดท์พีกร่วมและ TDP พีกร่วมมีเพียงราว 2/3 ดังนั้นประสิทธิภาพ GPU ล้วน ๆ ก็น่าจะอยู่ประมาณครึ่งหนึ่งของยูนิตแบบแยก
Apple ไม่มี SVE2 แต่มี AMX แบบปิดและ SME และก็ไม่เข้าใจว่าทำไมถึงมองว่า SVE2 จะเร็วกว่า SME
มีการพูดถึงประเภทคอร์เดี่ยว แต่ไม่พูดถึงองค์ประกอบโดยรวม และเรื่องที่ DGX Spark เทียบกับชิป Apple อย่างไรนั้นก็เป็นข้อมูลที่รู้กันมาตั้งแต่ปีที่แล้ว
CPU อยู่ประมาณระดับ M3 Pro ส่วนการคำนวณของ GPU ถ้าไม่นับแบนด์วิดท์ก็อยู่ระหว่าง M4 Pro กับ M4 Max และข้อดีจริง ๆ มีเพียงอย่างเดียวคือมันรัน CUDA ได้
พอถึงเวลาเปิดตัวจริง มีโอกาสสูงที่จะตามหลัง Apple 2-3 เจเนอเรชัน และตามหลัง AMD 1 เจเนอเรชัน ขณะเดียวกัน NIC สำหรับเชื่อมหลายเครื่องเข้าด้วยกัน ซึ่งเป็นอีกจุดแข็งของ DGX Spark ก็ไม่มีในที่นี้ด้วย
บน Spark มันเร็วกว่า M5 Max มาก และถ้าเทียบด้วยโมเดลเดียวกัน การควอนไทซ์เดียวกัน คำถามเดียวกัน และตั้งค่า vllm ให้ใกล้เคียงกันที่สุด ในงานที่มีพรอมป์ต์ใหญ่และมีโอกาสแคชน้อย มักเกิดกรณีที่ Spark เครื่องเดียวตอบเสร็จก่อนที่ MBP จะ prefill เสร็จ
ในส่วนนั้น Apple ได้เปรียบ แต่สมรรถนะการคำนวณของ GPU บน Spark สูงกว่า 17 FP32 TFLOPS ของ M5 Max มาก อยู่ราว ๆ 2 เท่า
มันมี CUDA core 6144 คอร์เหมือนเดสก์ท็อป 5070 เพียงแต่ถูกลดความเร็วลงเพราะหน่วยความจำที่ช้ากว่าและ TDP ที่ต่ำกว่า จึงได้ประมาณ 29.7 เทียบกับ 31 FP32 TFLOPS ของ 5070
โดยรวมแล้ว Spark ก็โอเค แต่ไม่ถึงกับน่าทึ่ง
เหมือนเพิ่งไปรู้จักชิปที่คนในวงการรู้กันมานานแล้ว แถมแทบไม่รู้จักสินค้าคู่แข่ง แต่ก็โพสต์คำอย่าง “BEAST”, “GAME CHANGER” ออกมา
ถ้าถามว่า DGX Spark เป็นตัวเปลี่ยนเกมไหม คำตอบโดยรวมคือทำให้ผิดหวังมาก และแล็ปท็อป Nvidia ราคาแพงอีกเครื่องก็คงไม่เปลี่ยนกระดานได้
Qualcomm Snapdragon X2 Elite Extreme เหนือกว่าชิป Nvidia อย่างมากในด้านประสิทธิภาพ CPU แบบคอร์เดียว และยังชนะผลิตภัณฑ์ท็อปของ Intel และ AMD ด้วย
มีหน่วยความจำแบบรวมศูนย์ด้วย และเป็น CPU เพียงตัวเดียวที่อยู่ในระดับเดียวกับ Apple M series ทั้งด้านประสิทธิภาพ CPU และประสิทธิภาพการใช้พลังงาน
ไม่ใช่ว่าต้องรอปลายปี เพราะตอนนี้ก็ซื้อมันในรูปแบบโน้ตบุ๊กได้แล้ว แต่ผู้คนยังประเมิน Qualcomm ต่ำเกินไป
ถ้ารองรับ Linux ไม่ได้ก็แทบไม่มีความหมาย และแพลตฟอร์มสำคัญในสายนี้มีอยู่สองตัวคือ Linux และ Darwin
Qualcomm ก็เหมือนที่ AMD เคยเป็นกับ GPU ตลอดหลายสิบปี คือประกาศเยอะ มีแฟนบนอินเทอร์เน็ตที่อ่านหน้าเว็บกันมาก แต่พอจะเอามาใช้งานจริงกลับกลายเป็นฝันร้าย
Snapdragon X Elite ใช้งานบน Linux ไม่ได้ จึงไม่มีประโยชน์ในฐานะแพลตฟอร์ม และถึงขั้นที่ผู้ใช้สายฮาร์ดคอร์ทำให้ M1 ใช้งานได้ดีกว่า จนคนเลือกใช้ Mac รุ่นเก่าแทน Qualcomm
ตัวเทียบที่ควรใช้คือ X930 หรือ C1 ใน Mediatek Dimensity 9500 กล่าวคือฝั่ง Snapdragon 8 Elite Gen 5 / X2 Elite
Qualcomm ยังนำอยู่ในด้านประสิทธิภาพ แต่ช่องว่างกำลังแคบลง และที่สำคัญกว่าคือ Nvidia กำลังสร้าง ecosystem ได้ดีกว่ามาก
Nvidia มีช่องทางจัดจำหน่ายและพาร์ตเนอร์ที่ดีกว่ามากจากฐาน GPU เกมมิงบนพีซี และความสัมพันธ์กับนักพัฒนาเกมก็ unmatched ในอุตสาหกรรม
Qualcomm ยังไม่แสดงให้เห็นถึงความสามารถในการลงมือทำจริงทั้งในตลาด CPU พีซีและเซิร์ฟเวอร์
อดีตมีประสบการณ์แย่ ๆ มากเกินไปจนคนลังเลก็ไม่แปลก ตอนนี้อาจดูเหมือนพยายามมากขึ้น แต่การกู้ชื่อเสียงในตลาดพีซียังต้องใช้เวลา
ข่าวประชาสัมพันธ์ของอุปกรณ์จริงอยู่ที่นี่
https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-...
น่าแปลกใจที่มีคนน้อยมากที่ชี้ว่า Microsoft และโดยเฉพาะ NVIDIA กำลังออกอุปกรณ์ที่โดยเนื้อแท้แล้วขัดแย้งกับ โมเดล AI คลาวด์แบบคิดค่าบริการตามการใช้งาน
เมื่อดูจากสัญญาณและประกาศอื่น ๆ เช่น Copilot แบบออฟไลน์ที่ดีขึ้นพร้อม BYOK และอนาคต AI แบบไม่จำกัด ทั้งสองบริษัทดูเหมือนจะเข้าใจแล้วว่า AI ที่อยู่บนคลาวด์อย่างเดียวไม่ทั้งยั่งยืน และไม่เป็นประโยชน์กับพวกเขาโดยเนื้อแท้
ถึงอย่างนั้น ท่าทีที่พยายามทำให้ OpenAI อ่อนแรงลงผ่านผลิตภัณฑ์แบบนี้ก็ยังเห็นได้ชัด
Microsoft กำลังผลักดัน AI แบบโลคัลอย่างหนัก
ยังไม่แน่ใจว่า LLM แบบโลคัล จะถูกนำไปใช้กว้างขวางไหม เว้นแต่ราคาจะไม่ขึ้นจริง ๆ
การใช้โมเดลขนาดเล็กแบบโฮสต์ที่ถูกกว่าอย่าง Sonnet หรือ Kimi ก็ดูสมเหตุสมผล และอุปกรณ์พวกนี้ก็คงรันโมเดลระดับ Kimi ไม่ไหว ทั้งที่นั่นคือระดับขั้นต่ำสำหรับงานเอเจนต์ที่ไม่ใช่ของเล่น
การจ่าย $5,000 เพื่อเลี่ยงค่าสมาชิก $20 ฟังดูไม่สมเหตุสมผลนัก เว้นแต่จะมีเหตุผลด้านความปลอดภัยเฉพาะทาง
เคยดู Dungeon Crawler Carl ไหม?
ดูเหมือนคนส่วนใหญ่ยังไม่เข้าใจจริง ๆ ว่าโน้ตบุ๊กแบบนี้จะให้อะไรได้บ้าง
ก่อนจะไปถึง AI แบบโลคัลเต็มตัว มีโอกาสสูงที่เราจะใช้ Hybrid AI ก่อน
การรันโมเดลใหญ่แบบโลคัลนั้นไม่สมจริง แต่ถ้ามองว่าใน agent workflow บางส่วนรันบนคลาวด์ และงานย่อยกว่ารันในเครื่อง นั่นเป็นการผสมผสานที่ยอดเยี่ยม
งานพื้นฐานไม่ได้ต้องใช้โมเดลอย่าง Opus/Code/DeepSeek/Kimi และโมเดลอย่าง Gemma4:12b/Qwen-27b ก็สามารถจัดการในเครื่องได้ด้วย latency ที่ต่ำกว่ามาก
ถ้ามีโน้ตบุ๊กที่รวมโมเดลขนาดใหญ่ระยะไกลกับโมเดลเฉพาะโดเมนแบบโลคัลอีก 5 ตัวได้ ฉันอยากใช้ทันทีเลย
พอนึกภาพได้ว่าใน OpenCode โมเดลเล็กจะตัดสินว่างานไหนควรรันในเครื่อง และจะใช้โมเดลโลคัลที่เหมาะกับงานนั้นหรือจะเรียกโมเดลบนคลาวด์
ความกังวลคือฮาร์ดแวร์นี้จะแรงพอรับมือกับ การสลับโมเดลโลคัลอย่างรวดเร็ว หรือไม่ ซึ่งฉันเดาว่าอาจไม่พอ แต่ก็หวังว่าฉันจะคิดผิด
ตอนนี้ frontier model เองก็ทำ benchmark ได้ดีขึ้นด้วยแค่ 200,000 โทเค็น และการ distillation ก็ยังไปได้อีกไกล
ไม่ค่อยเข้าใจว่านี่เป็น “สัตว์ประหลาด” ตรงไหน
แบนด์วิดท์หน่วยความจำ 300GB/s สูงกว่า AMD Strix Halo ที่ 256GB/s เพียงเล็กน้อย และยังไม่ถึงครึ่งของ M5 Max 128GB ที่ 614GB/s ในคอนฟิก RAM 128GB เท่ากัน
น่าจะมีคนสนใจส่วนใหญ่เป็นสายคลั่ง AI เลยเน้นแบนด์วิดท์หน่วยความจำกัน แถมยังเป็น Windows อีก
เวิร์กโฟลว์ 256k โทเค็นที่บน M5 อาจใช้เวลาเกือบครึ่งหนึ่งกว่าจะได้โทเค็นแรก ก็น่าจะรันได้จริงที่นี่
AMD เป็นเครื่อง x86 จึงรันได้ทุกอย่าง, Apple ดูแลสแตก MacOS ทั้งหมดเอง, แต่ Nvidia นั้นน่าอายถึงขั้นที่ในแต่ละยุคของ Jetson ยังแทบจะตาม Ubuntu ได้แค่หนึ่งรีลีส
น่าจะเอาพวกเอเจนต์ที่ชอบพูดไม่หยุดมาลงมือทำงาน รองรับระบบปฏิบัติการ จริง ๆ เสียที
อยากรู้จริง ๆ ว่ามันต่างจากของอย่าง AMD Ryzen AI Max ที่ซื้อได้อยู่แล้วและรองรับ หน่วยความจำแบบรวม 128GB ยังไง
ไม่รู้ว่าในปี 2026 จะยังมีใครยึดติดกับคำว่า “Windows PC” อยู่ทำไม
มันก็เป็นแค่คอมพิวเตอร์ส่วนบุคคล และปกติก็รันได้หลายระบบปฏิบัติการอย่างดี
คำว่า Windows PC ฟังดูเหมือนคนที่รับเงินจาก Microsoft หรือคนที่พูดเรื่องเทคโนโลยีแบบส่งเอกสาร Word ที่แทรกรูปมาให้
ไม่มีความจำเป็นต้องฝืนผูกความสนุกของอุปกรณ์ที่ไม่ยึดติดกับระบบปฏิบัติการ เข้ากับระบบปฏิบัติการห่วย ๆ ระบบหนึ่ง
น่าจะซื้อ PC ได้มากกว่าตลาดอื่นทั้งหมดรวมกันเสียอีก
แม้แต่การใช้งานส่วนตัว คนที่ dual boot Windows กับระบบปฏิบัติการอื่นก็น่าจะเป็นคนส่วนน้อยมาก
“Windows PC” เป็นคำที่ค่อนข้างสมเหตุสมผลในการแยก “ของที่ Apple ทำ” ออกจาก “ของที่คนอื่นทำ” และตลาด PC ที่ Apple ไม่ได้ทำแต่ไม่ได้ใช้ Windows เป็นค่าเริ่มต้นนั้นเล็กมากจริง ๆ
พูดตรง ๆ ว่าการมีท่าทีดุดันขนาดนี้กับประเด็นนี้ดูแปลกมาก
คำว่า PC เองก็คลุมเครือ เพราะอาจหมายถึงคอมพิวเตอร์ส่วนบุคคลทั้งหมดตามความหมายดั้งเดิม หรืออาจหมายถึงตระกูล IBM PC ที่ใช้เทียบกับ Mac ก็ได้
นึกถึงโฆษณา “I'm a Mac, I'm a PC” ก็พอ
ถ้าพูดแค่ PC ทุกวันนี้คนก็สับสนจริง ๆ ว่าหมายถึงแบบไหน ส่วน “IBM PC” ก็ดูล้าสมัย และ “IBM PC clone” ยิ่งแย่กว่าเดิม
เพราะงั้น “Windows PC” จึงเป็นชื่อที่ค่อนข้างใช้ได้ และ “Non-Mac PC” ก็ฟังไม่ค่อยดี
ไม่เห็นต้องพูดให้ดูหมิ่นกันเลย
เหตุผลที่ยังใช้ Windows ในองค์กรหรือเดสก์ท็อปตามบ้านบางส่วน เช่น เกม ก็ยังคงเป็นเรื่อง ความเข้ากันได้ของฮาร์ดแวร์·ซอฟต์แวร์
ใช้เพราะที่ทำงานสร้างโปรแกรม Windows และยังมีไดรเวอร์ที่ Win-for-ARM ยังไม่มี
ดังนั้นสำหรับคนส่วนใหญ่ “Windows PC” ก็ยังหมายถึง x64 Windows PC อยู่ดี
ถ้าความเข้ากันได้ของ Windows-Arm64 ยังไม่เพียงพอ ความเสี่ยงของ Microsoft ก็คือผู้คนอาจเลิกใช้ Windows ไปเลย เพราะยังไงก็ต้องใช้ทั้งซอฟต์แวร์และฮาร์ดแวร์ใหม่อยู่แล้ว
แม้ Nvidia Hackintosh ต้องคำสาปจะฟังดูตลกมากก็เถอะ
สำหรับผู้ใช้ทั่วไป ระบบปฏิบัติการคอมพิวเตอร์มีอยู่สามอย่างคือ Windows, Apple, ChromeOS; Nvidia คงไม่ไปทาง ChromeOS และ Apple ก็ไม่ชอบ Nvidia ดังนั้นระบบปฏิบัติการปกติที่ทำตลาดได้จึงเหลือแค่ Windows
การตลาดทำให้ชัดว่าอุปกรณ์พวกนี้ไม่ใช่ Chromebook ราคาถูกที่ทำลายประสบการณ์เดสก์ท็อปของผู้คนจำนวนมาก
Qualcomm เคยสัญญาเรื่องการรองรับ Linux แล้วทำไม่สำเร็จ และคนที่เคยเจ็บกับคำสัญญานั้นก็คงไม่อยากซื้อฮาร์ดแวร์นั้นอีก
ถ้าสัญญาว่าเป็น Windows PC ก็จะลดเหตุผลในการบ่นว่า Linux, FreeBSD, SerenityOS บูตไม่ได้ และเมื่อดูจากความล้มเหลวของ Qualcomm แล้ว Nvidia ก็น่าจะกำลังเลือกทางที่ถูก