1 คะแนน โดย GN⁺ 2024-02-25 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

การคลายการบีบอัด Oodle ล้มเหลวจากความไม่เสถียรของโปรเซสเซอร์ Intel

  • RAD รับทราบปัญหาที่อาจทำให้การคลายการบีบอัด Oodle Data ล้มเหลวหรือเกิดการแครชในเกมที่สร้างด้วย Unreal Engine
  • ปัญหานี้ส่งผลหลักกับโปรเซสเซอร์ Intel 13900K และ 14900K โดยส่งผลน้อยกว่ากับ 13700, 14700 และโปรเซสเซอร์ที่เกี่ยวข้อง
  • มีเพียงโปรเซสเซอร์ส่วนน้อยในกลุ่มนี้เท่านั้นที่แสดงอาการดังกล่าว
  • ปัญหาเกิดจากการผสมกันของการตั้งค่า BIOS กับความเร็วสัญญาณนาฬิกาสูงและการใช้พลังงานสูงของโปรเซสเซอร์เหล่านี้ ทำให้ระบบไม่เสถียรและมีพฤติกรรมที่คาดเดาไม่ได้ภายใต้โหลดสูง

ไม่ใช่บั๊กซอฟต์แวร์ แต่เป็นปัญหาฮาร์ดแวร์

  • ดูเหมือนว่าปัญหานี้ไม่ได้เกิดจากบั๊กซอฟต์แวร์ใน Oodle หรือ Unreal
  • การตั้งค่า BIOS ที่มองโลกในแง่ดีเกินไปทำให้โปรเซสเซอร์บางตัวทำงานเกินขอบเขตการทำงานภายใต้โหลดสูง จนความเร็วสัญญาณนาฬิกาและการใช้พลังงานทำให้เกิดการประมวลผลคำสั่งผิดพลาด
  • การคลายการบีบอัด Oodle Data ต้องมีการตรวจสอบความถูกต้องของข้อมูลเพิ่มเติม จึงสามารถตรวจพบความผิดปกติที่ไม่สม่ำเสมอได้อย่างรวดเร็ว ต่างจากโค้ดเกมเพลย์ การจำลอง เสียง หรือการเรนเดอร์อื่น ๆ

รูปแบบความล้มเหลวที่พบบ่อยเมื่อเริ่มเกมที่ใช้ Unreal Engine

  • รูปแบบความล้มเหลวที่พบบ่อยที่สุดคือข้อความผิดพลาด "DecompressShader(): Could not decompress shader (GetShaderCompressionFormat=Oodle)"
  • ปัญหานี้ไม่ได้ส่งผลเฉพาะกับ Oodle เท่านั้น และระบบที่ประสบความไม่เสถียรลักษณะนี้ยังแสดงความล้มเหลวในโปรแกรม benchmark และ stress test มาตรฐานด้วย
  • โปรแกรมที่ใช้งานโปรเซสเซอร์อย่างหนักในหลายเธรดอาจทำให้เกิดการแครชหรือพฤติกรรมที่คาดเดาไม่ได้

วิธีแก้ชั่วคราวเพื่อรับมือปัญหา

  • ไม่สามารถเข้าถึงข้อมูลของโปรเซสเซอร์เพื่อวินิจฉัยสาเหตุที่แน่ชัดและหาทางแก้ที่ดีที่สุดได้
  • ผู้ผลิตเมนบอร์ด/BIOS จำนวนมากตั้งค่าจากโรงงานให้ผลักโปรเซสเซอร์ออกนอกช่วงการทำงานที่ปลอดภัย
  • เนื่องจากปัญหานี้ส่งผลกับโปรเซสเซอร์เพียงส่วนน้อย ผู้ใช้บางรายจึงสามารถคืนโปรเซสเซอร์กับผู้ผลิตและได้รับตัวใหม่ที่ไม่มีปัญหาได้สำเร็จ
  • วิธีแก้ชั่วคราวอื่นต้องอาศัยการใช้ยูทิลิตีสำหรับจูนระบบหรือการเปลี่ยนการตั้งค่า BIOS
  • มีรายงานว่าการใช้ Intel XTU เพื่อลด performance core multiplier จาก x55 ลงเป็น x54 หรือ x53 เป็นวิธีที่ได้ผลสำหรับหลายคน

คำแนะนำในการปรับการตั้งค่า BIOS

  • หากเปิดใช้งานโอเวอร์คล็อกอยู่ ให้ปิดใช้งาน และหลีกเลี่ยงการใช้การโอเวอร์คล็อกแบบ "AI" หรือ "อัตโนมัติ"
  • ค้นหาขีดจำกัดที่ถูกต้องของโปรเซสเซอร์ของคุณบน ark.intel.com แล้วตั้งค่าขีดจำกัดพลังงานและแรงดันไฟให้อยู่ในช่วงปลอดภัยที่ Intel แนะนำ
  • ปิดการตั้งค่า BIOS ประเภท "enhanced turbo" หรือ "enhanced multithreading" เช่น "ASUS MultiCore Enhancement" หรือ "ASUS Performance Enhancement 3.0"

ขั้นตอนแก้ปัญหาเพิ่มเติมสำหรับเมนบอร์ด Intel, ASUS, Gigabyte, MSI

  • ติดตั้ง Intel XTU และรันการทดสอบ AVX2
  • หากการทดสอบ AVX2 ล้มเหลว ให้ลองเปลี่ยนการตั้งค่า BIOS เฉพาะสำหรับเมนบอร์ด ASUS, Gigabyte, MSI

ไม่สามารถให้การสนับสนุนผู้ใช้ปลายทางโดยตรงได้

  • ไม่สามารถให้การสนับสนุนโดยตรงแก่ผู้ใช้ปลายทางของเกมที่ได้รับผลกระทบจากปัญหานี้ และแนะนำให้ใช้ช่องทางสนับสนุนอย่างเป็นทางการของผู้จัดจำหน่ายเกม ผู้ผลิตโปรเซสเซอร์ และผู้ผลิตเมนบอร์ด

ความเห็นของ GN⁺

  • ปัญหานี้มีความสำคัญต่อผู้ใช้ที่ใช้โปรเซสเซอร์ Intel บางรุ่น และอาจจำเป็นต้องปรับการตั้งค่า BIOS เพื่อให้ระบบมีเสถียรภาพ
  • การเปลี่ยนการตั้งค่า BIOS อาจมีความเสี่ยง ดังนั้นผู้ใช้ควรดำเนินการด้วยความระมัดระวังและควรขอรับการสนับสนุนอย่างเป็นทางการ
  • บทความนี้ให้แนวทางที่เป็นรูปธรรมสำหรับแก้ปัญหาซอฟต์แวร์ที่มีสาเหตุมาจากปัญหาฮาร์ดแวร์ จึงเป็นข้อมูลที่มีประโยชน์สำหรับผู้ใช้ที่กำลังเผชิญปัญหาทางเทคนิค

1 ความคิดเห็น

 
GN⁺ 2024-02-25
ความคิดเห็นจาก Hacker News
  • มีการแชร์ประสบการณ์การใช้ AMD Threadripper 3970X และกระบวนการแก้ปัญหาที่เกี่ยวข้อง โดยร่วมตรวจสอบปัญหากับ AMD เป็นเวลาหลายเดือน และได้รับการชดเชยจาก AMD ปัจจุบันใช้งานระบบด้วยอิมเมจ BIOS แบบกำหนดเองที่ AMD จัดให้ และดูเหมือนว่าปัญหาน่าจะเป็นความรับผิดชอบของ Gigabyte
  • CPU Intel 13900k มีข้อบกพร่อง และเกิดปัญหาเมื่อใช้การตั้งค่าปริยาย ระบบล่มบ่อยจนต้องเสียเวลาไปมากในการแก้ไขปัญหา ได้เปลี่ยน CPU และขอ RMA (บริการรับคืนเพื่อซ่อม) กับ Intel แต่ Intel พยายามหลีกเลี่ยง RMA โดยอ้างเรื่องการรองรับ Linux จึงดำเนินการ RMA ผ่านหน่วยงานคุ้มครองผู้บริโภคของยุโรป และซื้อระบบใหม่พร้อมขายระบบเดิมออกไป จากนี้ไปไม่มีแผนจะซื้อผลิตภัณฑ์ของ Intel อีก
  • มีการกล่าวเชิงเสียดสีว่าต้องปิด hyperthreading, turbo mode, C-state และ efficiency core เพื่อบรรเทาปัญหาด้านความปลอดภัย ซึ่งก็แทบไม่ต่างจากการย้อนกลับไปใช้ชุดฟีเจอร์เมื่อ 20 ปีก่อน
  • ได้ประกอบระบบใหม่โดยใช้ CPU i9 149kf และเมนบอร์ด Asus Formula แต่ต้องเจอความยากลำบากกว่าจะทำให้ระบบเสถียรได้ โดยเมื่อใช้การตั้งค่าปริยายจะเกิดปัญหาเกมล่ม รวมถึงคอมไพล์ kernel และ emacs ไม่สำเร็จ จึงทำให้ระบบเสถียรด้วยการจำกัด turbo ไว้ที่ 5.4GHz และเปิดใช้การตั้งค่าเพื่อจำกัดกำลังไฟและอุณหภูมิ ตอนนี้ระบบเสถียรแล้ว แต่ก็เสียดายที่ไม่สามารถใช้ประสิทธิภาพได้เต็มตามที่โฆษณาไว้
  • มีการพูดถึงว่าเรื่องนี้ทำให้นึกถึงบทความคลาสสิกของ Raymond Chen
  • มีการรำลึกถึงปัญหาของ CPU Pentium III 1.13 GHz ในอดีต
  • ตัวถอดบีบอัด Zstd มักเป็นจุดแรกที่โต้ตอบกับข้อมูลที่ส่งผ่านเครือข่าย จึงไวต่อ bit flip มาก แม้จะเปิดการตรวจสอบข้อผิดพลาด มันก็มักตรวจพบปัญหาฮาร์ดแวร์ได้บ่อยกว่าโปรเซสอื่น ๆ โดย Zstd มีเพียง checksum ของข้อมูลต้นฉบับเพื่อรับประกันความถูกต้องของข้อมูล แต่ทำให้ตัดสินได้ยากว่าข้อมูลที่ถูกบีบอัดเสียหายหรือไม่
  • ดูเหมือนว่านี่เป็นหน้าที่สร้างขึ้นมาเพื่อตอบรับคำบ่นที่ไม่พึงประสงค์จากผู้ใช้ซึ่งพยายามไล่ตาม error log ของ "oodle" ชวนให้นึกถึงกรณีของ SQLite ในปี 2006
  • มีการแชร์ประสบการณ์ซื้อเมนบอร์ด ASUS TUF โดยต้องการเพียงฟังก์ชันพื้นฐาน แต่ BIOS กลับผลักดันการโอเวอร์คล็อกมากเกินไป จนต้องปรับการตั้งค่าหลายอย่างด้วยตนเอง รวมถึงการตั้งค่า RAM timing
  • มีการแสดงความประหลาดใจที่ Epic Games เข้าซื้อกิจการ RAD