Nvidia เสนอระบบ CPU สุดโหดสำหรับพีซี Windows

(twitter.com/lemire)

5 คะแนน โดย GN⁺ 2026-06-07 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

ระบบประสิทธิภาพสูงสำหรับพีซี Windows ของ NVIDIA ใช้ชิปที่ให้ CPU·GPU ใช้ หน่วยความจำร่วม 128GB ร่วมกัน และมี CUDA core ได้สูงสุด 6,144 คอร์
CPU มีคอร์ประสิทธิภาพ 10 คอร์และคอร์ประหยัดพลังงาน 10 คอร์ โดยคอร์ประสิทธิภาพอิงกับ Cortex-X925 และ SVE2 แม้จะด้อยกว่าชิป AMD รุ่นล่าสุด แต่ก็ยังดีกว่า Apple Silicon
จุดแตกต่างสำคัญคือ หน่วยความจำแบบรวมศูนย์ ที่ไม่แยกหน่วยความจำของ CPU และ GPU แม้จะช้ากว่าหน่วยความจำเฉพาะของ GPU แต่เป็นโครงสร้างที่มุ่งตอบโจทย์ทั้งแบนด์วิดท์และต้นทุนสำหรับการรันโมเดล AI แบบโลคัล
ยังมีมุมมองว่าความต้องการรันโมเดล AI แบบโลคัลยังเป็นเพียงแอปพลิเคชันเฉพาะกลุ่ม ขณะที่อีกมุมหนึ่งมองว่าหน่วยความจำร่วม 128GB อาจสำคัญกว่าค่า peak GPU TFLOPs สำหรับการทดลองระดับนักศึกษา
แกนเปรียบเทียบคือ AMD Strix Halo, Intel Xe3P AI GPU และ AVX-512 ของโปรเซสเซอร์ AMD รุ่นล่าสุด รวมถึงข้อจำกัดที่ RAM ถูกบัดกรีติดบอร์ดทำให้เปลี่ยนภายหลังได้ยาก

สเปกระบบและโครงสร้างหน่วยความจำ

ระบบ CPU สำหรับพีซี Windows ที่ Nvidia เสนอมาใช้หน่วยความจำร่วม 128GB และมี CUDA core รุ่นล่าสุดได้สูงสุด 6,144 คอร์
CPU ประกอบด้วยคอร์ประสิทธิภาพ 10 คอร์และคอร์ประหยัดพลังงาน 10 คอร์ โดยคอร์ประสิทธิภาพอิงกับ Cortex-X925
มีการเปรียบเทียบว่า SVE2 ของ Cortex-X925 ตามสเปกแล้วด้อยกว่าชิป AMD รุ่นล่าสุด แต่ดีกว่า Apple Silicon
โปรเซสเซอร์ AMD รุ่นล่าสุดทั้งหมดรองรับ AVX-512 และมีการเปรียบเทียบว่า AVX-512 เหนือกว่า SVE2 ของ Cortex-X925 อย่างมาก ทั้งประมวลผลข้อมูลได้มากกว่าและใช้งานได้อเนกประสงค์กว่า
- ขณะที่ Intel ยังระมัดระวังในการใส่ AVX-512 ให้ระบบสำหรับผู้บริโภคจนถึงตอนนี้
หน่วยความจำแบบรวมศูนย์ขนาด 128GB เป็นแนวทางที่ใช้พูลหน่วยความจำเดียวร่วมกันแทนการแยกหน่วยความจำของ CPU และ GPU ซึ่งเป็นโครงสร้างเดียวกับแนวทางที่ Apple เลือกใช้เมื่อหลายปีก่อน
หน่วยความจำแบบรวมศูนย์กำลังได้รับความนิยมมากขึ้น แม้จะไม่เร็วเท่าหน่วยความจำเฉพาะของ GPU แต่ข้อดีคือมีต้นทุนต่ำพอที่จะให้แบนด์วิดท์เพียงพอสำหรับการรันโมเดล AI แบบโลคัล
- มีความเห็นว่าใน RAM แบบรวมศูนย์ไม่จำเป็นต้องส่งข้อมูลไปมาระหว่าง CPU และ GPU และทุกอย่างอยู่ในพูลหน่วยความจำเดียว จึงให้ความรู้สึกเหมือนการประมวลผลแบบ zero-copy
ประเด็นที่น่าจับตาคือ Intel และ AMD จะตอบสนองอย่างไร

ความเห็นที่เกี่ยวข้องหลากหลาย

ยังไม่ชัดเจนว่าความต้องการรันโมเดล AI แบบโลคัลจะมีมากเพียงใด และตอนนี้ยังเป็นแอปพลิเคชันเฉพาะกลุ่ม
มีทั้งมุมมองว่าระบบนี้อาจเป็นเครื่องที่ดีสำหรับวิดีโอเกม และข้อโต้แย้งว่ามันไม่ได้ออกแบบมาเพื่อเกม แต่เน้นโมเดลขนาดใหญ่ จึงอาจเล่นเกมได้ไม่ดีอย่างที่คาด
มีข้อเสนอว่าการทดลองระดับนักศึกษา หน่วยความจำร่วม 128GB อาจสำคัญกว่าค่า peak GPU TFLOPs และอาจเปลี่ยนขอบเขตของโมเดลหรือเวิร์กโหลดที่สามารถทดลองแบบโลคัลได้
ข้อแลกเปลี่ยนคือ RAM ไม่สามารถเปลี่ยนทีหลังได้และถูกบัดกรีติดทั้งหมด
ความต้องการด้านความจุหน่วยความจำมีความเห็นว่า 128GB ยังไม่พอ และต้องการ 256GB หรือ 512GB บ้าง บางคนมองว่าเครื่อง AI ระดับ “beast” ต้องมีอย่างน้อย 512GB และบางคนก็อยากได้ตัวเลือกหน่วยความจำแบบรวมศูนย์ 1TB
- คำตอบสั้น ๆ ของผู้เขียนต่อเหตุผลที่เลือก 128GB คือ "ต้นทุน"
ในประเด็นระบบปฏิบัติการ มีทั้งคำกล่าวว่าไม่ได้รัน “regular Windows” พร้อมแสดงความเสียดายเรื่องระบบปฏิบัติการ และมีข้อเสนอให้ติดตั้ง Linux
AMD Strix Halo เป็นผลิตภัณฑ์ลักษณะใกล้เคียงที่มีหน่วยความจำแบบรวมศูนย์ 128GB และ iGPU ขนาดใหญ่ พร้อม AVX-512 แบบเดียวกับเดสก์ท็อป Zen 5 ให้ใช้เปรียบเทียบ
- จากประสบการณ์ใช้งาน AMD Strix Halo เป็นเวลาไม่กี่เดือนในโฮมแล็บ LLM แบบโลคัล พบว่าสามารถรัน LLM ระดับ prosumer ได้ แต่คอขวดจริงคือแบนด์วิดท์หน่วยความจำ
- มีข้อเรียกร้องว่าชิป Nvidia ใหม่ควรมีแบนด์วิดท์หน่วยความจำมากกว่า 300GB/s
RTX5090 อาจคุ้มค่ากว่าสำหรับโมเดลขนาดเล็กที่ต้องการความเร็ว หากมีเดสก์ท็อปอยู่แล้ว และบอร์ดตระกูลนี้อาจเหมาะกับโมเดลโลคัลที่ใหญ่กว่ามากกว่า
ข้อดีของการรัน AI แบบโลคัลคือไม่ต้องส่งข้อมูลลับหรือข้อมูลลูกค้าไปให้บุคคลที่สามซึ่งความรับผิดชอบไม่ชัดเจน ช่วยหลีกเลี่ยงค่าสมาชิก SaaS และค่าโทเค็น และเชื่อมโยงกับการให้โมเดลโลคัลเรียนรู้พฤติกรรมการใช้งานพีซีเพื่อทำงานแทน
โมเดลโลคัลอาจทำงานเป็นฟังก์ชันเบื้องหลังที่ผู้ใช้ไม่เห็น และงานที่ต้องการความฉลาดสูงกว่าหรือบริบทมากกว่าสามารถออฟโหลดไปประมวลผลระยะไกลได้
แก่นสำคัญไม่ใช่ตัวโมเดลโลคัลเพียงอย่างเดียว แต่คือแพลตฟอร์มซอฟต์แวร์ที่รองรับแอปพลิเคชัน AI แบบบูรณาการ และเป็นวิธีทำให้เดสก์ท็อปยังคงมีความเกี่ยวข้อง
ตัวอย่างว่าการเปิดใช้ Google Chrome อาจเป็นกรณีใช้งาน AI แบบโลคัลได้ อ้างอิงจากเอกสาร built-in AI ของ Chrome
รายการเปรียบเทียบ Intel Xe3P AI GPU ระบุ 160GB LPDDR5X, ความเป็นไปได้สูงสุด 480GB, อินเทอร์เฟซหน่วยความจำ 640 บิต, และโครงแบบ PCIe x16: https://tomshardware.com/pc-components/gpus/…

2 ความคิดเห็น

chcv0313 2026-06-07

เครื่องมือ LLM ส่วนใหญ่รันแบบเนทีฟบน Linux ผ่าน Docker แต่ถ้าจะใช้บน Windows ผ่าน WSL ก็มักมีข้อผิดพลาดจุกจิกเยอะพอสมควร ตอนนี้พอจะคาดหวังเครื่องมือแบบเนทีฟบน Windows ได้แล้วหรือยัง

GN⁺ 2026-06-07

ความคิดเห็นจาก Hacker News

พูลหน่วยความจำแบบรวม ดูเหมือนจะยังคงเป็น “ตัวเปลี่ยนเกม” โดยเฉพาะในสถาปัตยกรรมระบบนอกดาต้าเซ็นเตอร์
เกมสมัยใหม่หรืองานฝั่งผู้บริโภคเองก็ไม่ได้ใช้แบนด์วิดท์ PCIe ของ GPU หรือแบนด์วิดท์หน่วยความจำ GDDR ได้เต็มจริง ๆ และ AI บนเครื่องสำหรับผู้ใช้ทั่วไปก็ไม่ได้ได้ประโยชน์จากหน่วยความจำที่เร็วกว่าอย่างมีนัยสำคัญนัก
หน่วยความจำแบบรวมช่วยให้ปรับการใช้งานให้เหมาะตามความต้องการได้ และไม่ต้องมาคิดแยกว่าจะจัด GDDR/DDR อย่างไร จึงลดต้นทุนหน่วยความจำโดยรวมในอุปกรณ์ขนาดเล็กและพกพาได้
ข้อเสียคือเรื่อง ความปลอดภัย เพราะการโจมตี side-channel ต่อหน่วยความจำจากฝั่ง GPU หรือ CPU อาจลุกลามไปอีกฝั่งได้ จึงน่าจะยิ่งทำให้การออกแบบเพื่อความปลอดภัยของหน่วยความจำสำคัญขึ้น และน่าจะเป็นทิศทางที่ดีสำหรับผู้สนับสนุน Rust
- คำว่าใช้แบนด์วิดท์ PCIe ของ GPU หรือแบนด์วิดท์ GDDR ให้ “เต็มประสิทธิภาพ” ฟังดูชวนสับสนเล็กน้อย
  แก่นของเกมไม่ใช่การทำให้ฮาร์ดแวร์อิ่มตัว แต่คือการสร้างผลลัพธ์ที่สม่ำเสมอภายใน เวลาปิดเฟรม
  ต่อให้พยายามทำให้ 5090 อิ่มตัวด้วยเกม ตลาดเป้าหมายก็เล็ก และต้องทำให้สเปกจริงของผู้ใช้รันได้ดีพอ ๆ กับเครื่องทดสอบเพื่อรักษาเฟรมเรตด้วย
- ในมุมของนักพัฒนาเกม การที่เกมสมัยใหม่ใช้แบนด์วิดท์ GPU ได้ไม่เต็ม ไม่ใช่เพราะขี้เกียจ แต่เพราะว่า มันยากมากจริง ๆ
  หนึ่งในความต่างที่ใหญ่ที่สุดระหว่างคอนโซลเจเนอเรชันปัจจุบันกับพีซีเจเนอเรชันปัจจุบันก็คือหน่วยความจำแบบรวม
- ถ้าทำให้อุปกรณ์อัปเกรดไม่ได้ ผู้ผลิตก็จะบังคับ การแบ่งตลาด ได้สะดวก และบวกพรีเมียมหนัก ๆ กับการอัปเกรด RAM แค่เล็กน้อยได้ แบบที่ Apple ทำ
- เหตุผลเชิงเศรษฐศาสตร์นี้ฟังไม่ค่อยขึ้นเท่าไร
  งาน 99% ต้องการหน่วยความจำระบบมากกว่าหน่วยความจำ GPU อย่างน้อยหนึ่งหลัก และระบบส่วนใหญ่แทบไม่ต้องการหน่วยความจำ GPU เกินกว่าระดับที่พอสำหรับวิดีโอหรือการท่องเว็บ
  ต่อให้มีกรณีใช้งานใหม่เกิดขึ้น โครงสร้างนี้ก็ไม่ได้กลับหัวทั้งหมด และถ้าตอนนี้ต้องใช้ 128GB และ AI บนเครื่องก็ต้องใช้ 128GB เช่นกัน ถ้าจะทำงานเดิมต่อไปก็ย่อมต้องใช้ 256GB
  ที่จริงแล้วมันดูเหมือนเป็นข้อโต้แย้งว่าไม่ควรใช้หน่วยความจำราคาแพงขนาดนั้นกับ GPU มากกว่า และถ้าเน้นแค่งาน inference อย่างเดียวก็อาจจะจริง
- DRAM ที่เหมาะกับการใช้งานของ CPU และ DRAM ที่เหมาะกับการใช้งานของ GPU นั้นต่างกันพอสมควร
  ใน สถาปัตยกรรมหน่วยความจำแบบรวม จะต้องยอมแลกประสิทธิภาพไปมากพอสมควร ซึ่งอาจสมเหตุสมผลในบางสถานการณ์ แต่ไม่ใช่คำตอบสารพัดประโยชน์
ไม่แน่ใจว่ามีคนรันโมเดล AI บนเครื่องมากแค่ไหน และตอนนี้ก็ยังดูเป็นตลาดเฉพาะกลุ่ม แต่จากการปล่อย Gemma ช่วงหลัง ๆ ก็มีแนวโน้มมากขึ้นว่าบางโมเดลจะถูกรันบนเครื่องได้เพียงเพราะเรื่องต้นทุน
ถ้าคิดถึงความปลอดภัยระดับองค์กรก็ยิ่งเป็นอย่างนั้น เพียงแต่ก็ยังไม่ค่อยเข้าใจว่าสถาปัตยกรรมแบบนี้ดีต่อการเล่นเกมอย่างไร จึงสงสัยกับประโยคเต็มในต้นฉบับ
อีกอย่าง การแปะคำอย่าง “Stanford/Elsevier 2025 นักวิทยาศาสตร์ 2% แรกของโลก, GitHub นักพัฒนา 1000 อันดับแรก” ไปทั่ว ๆ กลับให้ความรู้สึกเหมือนส่งผลย้อนกลับ
- ฟังดูเหมือนเวอร์ชันปี 2026 ของคำพูด Ken Olsen ที่ว่า “ไม่มีเหตุผลที่ต้องมีคอมพิวเตอร์อยู่ในบ้าน”
- ถ้าเห็นคำลักษณะนั้นในประวัติส่วนตัว ก็เหมือนเป็นป้ายบอกให้ตีความทุกอย่างในบริบทของ การโปรโมตตัวเอง ไปเลย
- ในงานส่วนใหญ่ Qwen 3.6 นำ Gemma อยู่ไกลมาก
  เคย deploy ลง MacBook M5 หลายเครื่องแล้ว และใช้งานจริงได้ในหลายงาน
  มันยังแทน Opus หรือโมเดลระดับ Sonnet รุ่นปัจจุบันไม่ได้ แต่ถ้าเทียบกับขนาดแล้วดีจนน่าทึ่ง และดูอยู่ราว ๆ ช่วง Sonnet 4 หรือก่อนหน้านั้นเล็กน้อย
  ในการเรียกใช้เครื่องมือ งานเขียนโค้ด และงานแบบเอเจนต์ มันเสถียรกว่าโมเดล Gemma มาก และยิ่งเร็วขึ้นอีกโดยเฉพาะเมื่อใช้ MTP
- กลุ่มผู้อ่าน HN โดยทั่วไปอาจไม่ใช่เป้าหมายของการโปรโมตตัวเองของเขา แต่ก็มีคนที่เป็นเป้าหมายแน่ ๆ และก็ดูมีผลอยู่บ้าง
- ยากจะเชื่อว่าการรันโมเดลบนแล็ปท็อปจะถูกกว่าการรันในดาต้าเซ็นเตอร์
  ไม่เข้าใจว่าทำไม เศรษฐศาสตร์ของขนาด ที่ใช้ได้กับงานคำนวณอื่น ๆ ถึงจะใช้ไม่ได้กับเรื่องนี้
ไม่ได้อยากลดคุณค่างานของผู้เขียน แต่บทความนี้ให้ความรู้สึกว่าไม่ได้ลงลึกจริง ๆ และเหมือนเขียนจากการดูแค่ ตารางสเปก
แม้จะมีจำนวนคอร์เท่ากับ 5070 mobile แต่แบนด์วิดท์พีกร่วมและ TDP พีกร่วมมีเพียงราว 2/3 ดังนั้นประสิทธิภาพ GPU ล้วน ๆ ก็น่าจะอยู่ประมาณครึ่งหนึ่งของยูนิตแบบแยก
Apple ไม่มี SVE2 แต่มี AMX แบบปิดและ SME และก็ไม่เข้าใจว่าทำไมถึงมองว่า SVE2 จะเร็วกว่า SME
มีการพูดถึงประเภทคอร์เดี่ยว แต่ไม่พูดถึงองค์ประกอบโดยรวม และเรื่องที่ DGX Spark เทียบกับชิป Apple อย่างไรนั้นก็เป็นข้อมูลที่รู้กันมาตั้งแต่ปีที่แล้ว
CPU อยู่ประมาณระดับ M3 Pro ส่วนการคำนวณของ GPU ถ้าไม่นับแบนด์วิดท์ก็อยู่ระหว่าง M4 Pro กับ M4 Max และข้อดีจริง ๆ มีเพียงอย่างเดียวคือมันรัน CUDA ได้
พอถึงเวลาเปิดตัวจริง มีโอกาสสูงที่จะตามหลัง Apple 2-3 เจเนอเรชัน และตามหลัง AMD 1 เจเนอเรชัน ขณะเดียวกัน NIC สำหรับเชื่อมหลายเครื่องเข้าด้วยกัน ซึ่งเป็นอีกจุดแข็งของ DGX Spark ก็ไม่มีในที่นี้ด้วย
- ข้อได้เปรียบอีกอย่างเมื่อเทียบกับ Apple คือ prefill
  บน Spark มันเร็วกว่า M5 Max มาก และถ้าเทียบด้วยโมเดลเดียวกัน การควอนไทซ์เดียวกัน คำถามเดียวกัน และตั้งค่า vllm ให้ใกล้เคียงกันที่สุด ในงานที่มีพรอมป์ต์ใหญ่และมีโอกาสแคชน้อย มักเกิดกรณีที่ Spark เครื่องเดียวตอบเสร็จก่อนที่ MBP จะ prefill เสร็จ
- การคำนวณของ GPU ที่พูดถึงตรงนี้น่าจะหมายถึงงานที่พึ่งพา แบนด์วิดท์หน่วยความจำ อย่างการสร้างโทเคน
  ในส่วนนั้น Apple ได้เปรียบ แต่สมรรถนะการคำนวณของ GPU บน Spark สูงกว่า 17 FP32 TFLOPS ของ M5 Max มาก อยู่ราว ๆ 2 เท่า
  มันมี CUDA core 6144 คอร์เหมือนเดสก์ท็อป 5070 เพียงแต่ถูกลดความเร็วลงเพราะหน่วยความจำที่ช้ากว่าและ TDP ที่ต่ำกว่า จึงได้ประมาณ 29.7 เทียบกับ 31 FP32 TFLOPS ของ 5070
- Lemire สนใจ CPU SIMD ในมุมที่ค่อนข้างแคบมาก ดังนั้นในตลาดเฉพาะนั้นอาจน่าสนใจ
  โดยรวมแล้ว Spark ก็โอเค แต่ไม่ถึงกับน่าทึ่ง
- อันนี้เป็น fluff ชัดเจน และการที่ทวีตไร้ค่านี้ขึ้นหน้าแรก HN ก็ดูมาจากนิสัยชอบยกบางบุคคลขึ้นหิ้งและปฏิบัติต่อทุกคำพูดของพวกเขาเหมือนคำพยากรณ์
  เหมือนเพิ่งไปรู้จักชิปที่คนในวงการรู้กันมานานแล้ว แถมแทบไม่รู้จักสินค้าคู่แข่ง แต่ก็โพสต์คำอย่าง “BEAST”, “GAME CHANGER” ออกมา
  ถ้าถามว่า DGX Spark เป็นตัวเปลี่ยนเกมไหม คำตอบโดยรวมคือทำให้ผิดหวังมาก และแล็ปท็อป Nvidia ราคาแพงอีกเครื่องก็คงไม่เปลี่ยนกระดานได้
Qualcomm Snapdragon X2 Elite Extreme เหนือกว่าชิป Nvidia อย่างมากในด้านประสิทธิภาพ CPU แบบคอร์เดียว และยังชนะผลิตภัณฑ์ท็อปของ Intel และ AMD ด้วย
มีหน่วยความจำแบบรวมศูนย์ด้วย และเป็น CPU เพียงตัวเดียวที่อยู่ในระดับเดียวกับ Apple M series ทั้งด้านประสิทธิภาพ CPU และประสิทธิภาพการใช้พลังงาน
ไม่ใช่ว่าต้องรอปลายปี เพราะตอนนี้ก็ซื้อมันในรูปแบบโน้ตบุ๊กได้แล้ว แต่ผู้คนยังประเมิน Qualcomm ต่ำเกินไป
- การรองรับระบบปฏิบัติการแย่มาก
  ถ้ารองรับ Linux ไม่ได้ก็แทบไม่มีความหมาย และแพลตฟอร์มสำคัญในสายนี้มีอยู่สองตัวคือ Linux และ Darwin
  Qualcomm ก็เหมือนที่ AMD เคยเป็นกับ GPU ตลอดหลายสิบปี คือประกาศเยอะ มีแฟนบนอินเทอร์เน็ตที่อ่านหน้าเว็บกันมาก แต่พอจะเอามาใช้งานจริงกลับกลายเป็นฝันร้าย
  Snapdragon X Elite ใช้งานบน Linux ไม่ได้ จึงไม่มีประโยชน์ในฐานะแพลตฟอร์ม และถึงขั้นที่ผู้ใช้สายฮาร์ดคอร์ทำให้ M1 ใช้งานได้ดีกว่า จนคนเลือกใช้ Mac รุ่นเก่าแทน Qualcomm
- X925 ในชิป Nvidia เป็นดีไซน์ CPU Arm รุ่นเก่าที่มีอายุ 2 ปี ดังนั้นจึงเป็นแค่การชนะตัวนั้น
  ตัวเทียบที่ควรใช้คือ X930 หรือ C1 ใน Mediatek Dimensity 9500 กล่าวคือฝั่ง Snapdragon 8 Elite Gen 5 / X2 Elite
  Qualcomm ยังนำอยู่ในด้านประสิทธิภาพ แต่ช่องว่างกำลังแคบลง และที่สำคัญกว่าคือ Nvidia กำลังสร้าง ecosystem ได้ดีกว่ามาก
  Nvidia มีช่องทางจัดจำหน่ายและพาร์ตเนอร์ที่ดีกว่ามากจากฐาน GPU เกมมิงบนพีซี และความสัมพันธ์กับนักพัฒนาเกมก็ unmatched ในอุตสาหกรรม
  Qualcomm ยังไม่แสดงให้เห็นถึงความสามารถในการลงมือทำจริงทั้งในตลาด CPU พีซีและเซิร์ฟเวอร์
- Microsoft ทำ พอร์ต Windows ลง Arm ได้เละเทะ จึงดัน Qualcomm ได้ไม่เต็มที่
- Qualcomm อยู่ในสถานการณ์แบบ “โดนหลอกครั้งแรกเป็นความผิดของเขา โดนหลอกครั้งที่สองจะไม่ยอมอีกแล้ว”
  อดีตมีประสบการณ์แย่ ๆ มากเกินไปจนคนลังเลก็ไม่แปลก ตอนนี้อาจดูเหมือนพยายามมากขึ้น แต่การกู้ชื่อเสียงในตลาดพีซียังต้องใช้เวลา
- บน Linux รองรับได้ดีจริงหรือ?
ข่าวประชาสัมพันธ์ของอุปกรณ์จริงอยู่ที่นี่
https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-...
น่าแปลกใจที่มีคนน้อยมากที่ชี้ว่า Microsoft และโดยเฉพาะ NVIDIA กำลังออกอุปกรณ์ที่โดยเนื้อแท้แล้วขัดแย้งกับ โมเดล AI คลาวด์แบบคิดค่าบริการตามการใช้งาน
เมื่อดูจากสัญญาณและประกาศอื่น ๆ เช่น Copilot แบบออฟไลน์ที่ดีขึ้นพร้อม BYOK และอนาคต AI แบบไม่จำกัด ทั้งสองบริษัทดูเหมือนจะเข้าใจแล้วว่า AI ที่อยู่บนคลาวด์อย่างเดียวไม่ทั้งยั่งยืน และไม่เป็นประโยชน์กับพวกเขาโดยเนื้อแท้
ถึงอย่างนั้น ท่าทีที่พยายามทำให้ OpenAI อ่อนแรงลงผ่านผลิตภัณฑ์แบบนี้ก็ยังเห็นได้ชัด
- ในงาน MS BUILD สัปดาห์ที่แล้ว คำว่า unmetered intelligence น่าจะเป็นสำนวนที่ถูกใช้บ่อยที่สุด
  Microsoft กำลังผลักดัน AI แบบโลคัลอย่างหนัก
- ก็อาจใช่ แต่ก็อาจเป็นแค่การวางเดิมพันทั้งสองทาง
ยังไม่แน่ใจว่า LLM แบบโลคัล จะถูกนำไปใช้กว้างขวางไหม เว้นแต่ราคาจะไม่ขึ้นจริง ๆ
การใช้โมเดลขนาดเล็กแบบโฮสต์ที่ถูกกว่าอย่าง Sonnet หรือ Kimi ก็ดูสมเหตุสมผล และอุปกรณ์พวกนี้ก็คงรันโมเดลระดับ Kimi ไม่ไหว ทั้งที่นั่นคือระดับขั้นต่ำสำหรับงานเอเจนต์ที่ไม่ใช่ของเล่น
การจ่าย $5,000 เพื่อเลี่ยงค่าสมาชิก $20 ฟังดูไม่สมเหตุสมผลนัก เว้นแต่จะมีเหตุผลด้านความปลอดภัยเฉพาะทาง
- ในทางกลับกัน ฉันกลับอยากเดิมพันว่าจีนจะเพิ่ม การผลิต DRAM ต่อเนื่องจนทำให้ราคาพัง และตลาดหุ้นสหรัฐที่พยุงอยู่บนความขาดแคลนนั้นก็จะลงตามไปด้วย
- ฉันคิดว่าเรายังแทบไม่ได้เห็นเลยว่า generative AI จะส่งผลต่อผลิตภัณฑ์ใหม่และเกมอย่างไรได้บ้าง
  เคยดู Dungeon Crawler Carl ไหม?
ดูเหมือนคนส่วนใหญ่ยังไม่เข้าใจจริง ๆ ว่าโน้ตบุ๊กแบบนี้จะให้อะไรได้บ้าง
ก่อนจะไปถึง AI แบบโลคัลเต็มตัว มีโอกาสสูงที่เราจะใช้ Hybrid AI ก่อน
การรันโมเดลใหญ่แบบโลคัลนั้นไม่สมจริง แต่ถ้ามองว่าใน agent workflow บางส่วนรันบนคลาวด์ และงานย่อยกว่ารันในเครื่อง นั่นเป็นการผสมผสานที่ยอดเยี่ยม
งานพื้นฐานไม่ได้ต้องใช้โมเดลอย่าง Opus/Code/DeepSeek/Kimi และโมเดลอย่าง Gemma4:12b/Qwen-27b ก็สามารถจัดการในเครื่องได้ด้วย latency ที่ต่ำกว่ามาก
ถ้ามีโน้ตบุ๊กที่รวมโมเดลขนาดใหญ่ระยะไกลกับโมเดลเฉพาะโดเมนแบบโลคัลอีก 5 ตัวได้ ฉันอยากใช้ทันทีเลย
พอนึกภาพได้ว่าใน OpenCode โมเดลเล็กจะตัดสินว่างานไหนควรรันในเครื่อง และจะใช้โมเดลโลคัลที่เหมาะกับงานนั้นหรือจะเรียกโมเดลบนคลาวด์
ความกังวลคือฮาร์ดแวร์นี้จะแรงพอรับมือกับ การสลับโมเดลโลคัลอย่างรวดเร็ว หรือไม่ ซึ่งฉันเดาว่าอาจไม่พอ แต่ก็หวังว่าฉันจะคิดผิด
- ถ้าดูจากความเร็วในการพัฒนาของโมเดลโลคัล จากแนวโน้มตอนนี้ ภายใน 2 ปีเราน่าจะได้เห็นประสิทธิภาพระดับใกล้เคียง frontier model บน RAM แบบรวมศูนย์ 128GB และการ quantize 6 บิต
  ตอนนี้ frontier model เองก็ทำ benchmark ได้ดีขึ้นด้วยแค่ 200,000 โทเค็น และการ distillation ก็ยังไปได้อีกไกล
ไม่ค่อยเข้าใจว่านี่เป็น “สัตว์ประหลาด” ตรงไหน
แบนด์วิดท์หน่วยความจำ 300GB/s สูงกว่า AMD Strix Halo ที่ 256GB/s เพียงเล็กน้อย และยังไม่ถึงครึ่งของ M5 Max 128GB ที่ 614GB/s ในคอนฟิก RAM 128GB เท่ากัน
น่าจะมีคนสนใจส่วนใหญ่เป็นสายคลั่ง AI เลยเน้นแบนด์วิดท์หน่วยความจำกัน แถมยังเป็น Windows อีก
- ต่างจาก M5 Max ตรงที่มันน่าจะทำ context prefill ที่ใช้งานได้จริง
  เวิร์กโฟลว์ 256k โทเค็นที่บน M5 อาจใช้เวลาเกือบครึ่งหนึ่งกว่าจะได้โทเค็นแรก ก็น่าจะรันได้จริงที่นี่
- ถ้า Nvidia จะทำให้ ARM CPU ใช้งานได้จริงแม้ในงานเดสก์ท็อปที่ไม่ใช่ด้าน inference หรือ training โดยตรง ก็ยังเหลืองานฝั่งซอฟต์แวร์อีกมาก
  AMD เป็นเครื่อง x86 จึงรันได้ทุกอย่าง, Apple ดูแลสแตก MacOS ทั้งหมดเอง, แต่ Nvidia นั้นน่าอายถึงขั้นที่ในแต่ละยุคของ Jetson ยังแทบจะตาม Ubuntu ได้แค่หนึ่งรีลีส
  น่าจะเอาพวกเอเจนต์ที่ชอบพูดไม่หยุดมาลงมือทำงาน รองรับระบบปฏิบัติการ จริง ๆ เสียที
อยากรู้จริง ๆ ว่ามันต่างจากของอย่าง AMD Ryzen AI Max ที่ซื้อได้อยู่แล้วและรองรับ หน่วยความจำแบบรวม 128GB ยังไง
- อาจเป็นเพราะ การรองรับ CUDA หรือจุดเด่นเฉพาะของ NVIDIA
ไม่รู้ว่าในปี 2026 จะยังมีใครยึดติดกับคำว่า “Windows PC” อยู่ทำไม
มันก็เป็นแค่คอมพิวเตอร์ส่วนบุคคล และปกติก็รันได้หลายระบบปฏิบัติการอย่างดี
คำว่า Windows PC ฟังดูเหมือนคนที่รับเงินจาก Microsoft หรือคนที่พูดเรื่องเทคโนโลยีแบบส่งเอกสาร Word ที่แทรกรูปมาให้
ไม่มีความจำเป็นต้องฝืนผูกความสนุกของอุปกรณ์ที่ไม่ยึดติดกับระบบปฏิบัติการ เข้ากับระบบปฏิบัติการห่วย ๆ ระบบหนึ่ง
- ก็แน่นอนว่าเป็นตลาดองค์กร
  น่าจะซื้อ PC ได้มากกว่าตลาดอื่นทั้งหมดรวมกันเสียอีก
  แม้แต่การใช้งานส่วนตัว คนที่ dual boot Windows กับระบบปฏิบัติการอื่นก็น่าจะเป็นคนส่วนน้อยมาก
  “Windows PC” เป็นคำที่ค่อนข้างสมเหตุสมผลในการแยก “ของที่ Apple ทำ” ออกจาก “ของที่คนอื่นทำ” และตลาด PC ที่ Apple ไม่ได้ทำแต่ไม่ได้ใช้ Windows เป็นค่าเริ่มต้นนั้นเล็กมากจริง ๆ
  พูดตรง ๆ ว่าการมีท่าทีดุดันขนาดนี้กับประเด็นนี้ดูแปลกมาก
- น่าจะเป็นคำที่ใช้เพื่อให้ชัดว่าไม่ได้พูดถึง Mac
  คำว่า PC เองก็คลุมเครือ เพราะอาจหมายถึงคอมพิวเตอร์ส่วนบุคคลทั้งหมดตามความหมายดั้งเดิม หรืออาจหมายถึงตระกูล IBM PC ที่ใช้เทียบกับ Mac ก็ได้
  นึกถึงโฆษณา “I'm a Mac, I'm a PC” ก็พอ
  ถ้าพูดแค่ PC ทุกวันนี้คนก็สับสนจริง ๆ ว่าหมายถึงแบบไหน ส่วน “IBM PC” ก็ดูล้าสมัย และ “IBM PC clone” ยิ่งแย่กว่าเดิม
  เพราะงั้น “Windows PC” จึงเป็นชื่อที่ค่อนข้างใช้ได้ และ “Non-Mac PC” ก็ฟังไม่ค่อยดี
  ไม่เห็นต้องพูดให้ดูหมิ่นกันเลย
- นี่ไม่ใช่ “Windows PC” ตามความหมายดั้งเดิมด้วยซ้ำ
  เหตุผลที่ยังใช้ Windows ในองค์กรหรือเดสก์ท็อปตามบ้านบางส่วน เช่น เกม ก็ยังคงเป็นเรื่อง ความเข้ากันได้ของฮาร์ดแวร์·ซอฟต์แวร์
  ใช้เพราะที่ทำงานสร้างโปรแกรม Windows และยังมีไดรเวอร์ที่ Win-for-ARM ยังไม่มี
  ดังนั้นสำหรับคนส่วนใหญ่ “Windows PC” ก็ยังหมายถึง x64 Windows PC อยู่ดี
  ถ้าความเข้ากันได้ของ Windows-Arm64 ยังไม่เพียงพอ ความเสี่ยงของ Microsoft ก็คือผู้คนอาจเลิกใช้ Windows ไปเลย เพราะยังไงก็ต้องใช้ทั้งซอฟต์แวร์และฮาร์ดแวร์ใหม่อยู่แล้ว
- หวังว่าคนที่พยายามจะรันอย่างอื่นที่ไม่ใช่ Windows บนอุปกรณ์ที่ Nvidia ทำ คงได้บทเรียนกันแล้ว
  แม้ Nvidia Hackintosh ต้องคำสาปจะฟังดูตลกมากก็เถอะ
  สำหรับผู้ใช้ทั่วไป ระบบปฏิบัติการคอมพิวเตอร์มีอยู่สามอย่างคือ Windows, Apple, ChromeOS; Nvidia คงไม่ไปทาง ChromeOS และ Apple ก็ไม่ชอบ Nvidia ดังนั้นระบบปฏิบัติการปกติที่ทำตลาดได้จึงเหลือแค่ Windows
  การตลาดทำให้ชัดว่าอุปกรณ์พวกนี้ไม่ใช่ Chromebook ราคาถูกที่ทำลายประสบการณ์เดสก์ท็อปของผู้คนจำนวนมาก
  Qualcomm เคยสัญญาเรื่องการรองรับ Linux แล้วทำไม่สำเร็จ และคนที่เคยเจ็บกับคำสัญญานั้นก็คงไม่อยากซื้อฮาร์ดแวร์นั้นอีก
  ถ้าสัญญาว่าเป็น Windows PC ก็จะลดเหตุผลในการบ่นว่า Linux, FreeBSD, SerenityOS บูตไม่ได้ และเมื่อดูจากความล้มเหลวของ Qualcomm แล้ว Nvidia ก็น่าจะกำลังเลือกทางที่ถูก
- การที่ Nvidia กำลังผลักดันอย่างหนักเพื่อ Windows ARM ดูเป็นข้อมูลที่เกี่ยวข้อง