- ศูนย์เวลาของ NIST ในเมืองโบลเดอร์ รัฐโคโลราโด สหรัฐฯ หยุดทำงานหลายวันจากไฟฟ้าดับ และเนื่องจากเครื่องกำเนิดไฟฟ้าสำรองขัดข้อง จึงเกิด ความคลาดเคลื่อนจากเวลาอ้างอิง UTC สูงสุด 5μs
- ศูนย์แห่งนี้ให้บริการ เซิร์ฟเวอร์ NTP 6 เครื่อง และแม้เครื่องกำเนิดไฟฟ้าจะเสีย ก็ยัง ควบคุมความคลาดเคลื่อนของเวลาให้อยู่ต่ำกว่า 5μs ได้ จึงแทบไม่ส่งผลต่อผู้ใช้ทั่วไป
- แต่อาจมีผลต่อ สถาบันวิจัยทางวิทยาศาสตร์และบริษัทอวกาศ ที่พึ่งพาการจับเวลาความแม่นยำสูง ซึ่ง NIST กำลังประสานงานโดยตรงอยู่
- ระบบ GPS และ WWV-Ft. Collins ทำหน้าที่สำรองได้ตามปกติ แสดงให้เห็นถึง ความซ้ำซ้อนของโครงสร้างพื้นฐานด้านเวลาทั่วสหรัฐฯ
- เหตุการณ์นี้สะท้อนให้เห็นถึง ความเสี่ยงจากการพึ่งพา GPS และความเปราะบางของโครงสร้างพื้นฐานด้านเวลา พร้อมตอกย้ำ ความจำเป็นในการพัฒนาระบบ PNT ทางเลือก
ไฟฟ้าดับและการเกิดความคลาดเคลื่อนของเวลา
- แคมปัส NIST ในเมืองโบลเดอร์ รัฐโคโลราโด เผชิญลมแรงเกิน 160 กม./ชม. (100mph) ทำให้บริษัทไฟฟ้า ตัดกระแสไฟเพื่อป้องกันความเสี่ยงไฟป่า
- แคมปัสทั้งหมดถูกปิดกั้นทำให้ พนักงานไม่สามารถเข้าออกได้ และการกู้คืนล่าช้า
- หนึ่งในเครื่องกำเนิดไฟฟ้าสำรองเสียหลังจากนั้นสองวัน ส่งผลให้ไฟเลี้ยงของ ชุดนาฬิกาหลัก (clock ensemble) สำหรับเซิร์ฟเวอร์ NTP ถูกตัด
- Jeff Sherman หัวหน้าทีม Time Realization and Distribution Group ถึงกับพิจารณา ปิดเซิร์ฟเวอร์เพื่อป้องกันการส่งสัญญาณเวลาที่ไม่แม่นยำ
- โชคดีที่ ระบบนาฬิกาในอาคารอื่นยังสามารถส่งสัญญาณเวลาได้ และมีพนักงานบางส่วนอยู่ในพื้นที่เพื่อ เปลี่ยนเส้นทางไฟฉุกเฉิน จนกู้คืนได้
- ระบบสำรองไฟแบตเตอรี่ (UPS) ช่วยประคองเวลาไว้จนกว่าเครื่องกำเนิดไฟฟ้าจะถูกเปลี่ยน และสุดท้าย ความคลาดเคลื่อนจาก UTC ถูกบันทึกว่าไม่เกิน 5μs
การให้บริการเซิร์ฟเวอร์ NTP และขอบเขตผลกระทบ
- NIST ให้บริการเวลาบนอินเทอร์เน็ตผ่าน เซิร์ฟเวอร์ NTP หลัก 6 เครื่อง
- จากผลคำสั่ง
sntp time-a-b.nist.gov ความคลาดเคลื่อนจากดีเลย์เครือข่ายของผู้ใช้ทั่วไปอยู่ที่ราว 35 มิลลิวินาที (35,000μs) ดังนั้น ความคลาดเคลื่อน 5μs จึงถือว่าเล็กน้อยมาก
- ด้วยเหตุนี้ NIST จึงคงการให้บริการเซิร์ฟเวอร์ต่อไปโดยไม่ปิดระบบ และแม้ว่า ความแม่นยำจะต่ำกว่าปกติราว 5,000 เท่า ก็แทบไม่กระทบผู้ใช้ส่วนใหญ่
- อย่างไรก็ตาม มหาวิทยาลัย อุตสาหกรรมอวกาศ และสถาบันวิจัยทางวิทยาศาสตร์ อ่อนไหวต่อความคลาดเคลื่อนระดับเล็กมาก จึงมีการ ประสานงานโดยตรงกับ NIST เพื่อปรับแก้
- ระบบ GPS ของสหรัฐฯ สลับไปยังแคมปัส WWV-Ft. Collins โดยอัตโนมัติ ทำให้ยังคงให้บริการได้โดยไม่เกิดการหยุดชะงักทั้งระบบ
ความเปราะบางของโครงสร้างพื้นฐานด้านเวลาและเทคโนโลยีทางเลือก
- ผู้เขียนระบุว่าตนเองใช้งาน นาฬิกา GPS บน Raspberry Pi 2 ชุด เพื่อรันเซิร์ฟเวอร์ NTP ส่วนตัว และชี้ให้เห็น ความเสี่ยงของการพึ่งพา GPS
- CISA เคยเตือนแล้วเกี่ยวกับ ความเสี่ยงจากการพึ่งพา GPS มากเกินไป ของสหรัฐฯ และภาครัฐกำลังผลักดัน การพัฒนาเทคโนโลยี PNT (Position, Navigation, Timing) ทางเลือก
- Broadcast Positioning System (BPS) กำลังถูกพูดถึงในฐานะตัวเลือกทดแทน GPS
- ผู้เขียนใช้งาน นาฬิกาอะตอมรูบิเดียมและ GPSDO เพื่อรักษาความแม่นยำในระดับไม่กี่นาโนวินาที และยัง รักษาเวลาได้นานหลายเดือนแม้สัญญาณ GPS มีปัญหา
- อย่างไรก็ตาม วงการ วิทยาศาสตร์ RF สื่อ และการเงิน ต้องการความแม่นยำระดับนาโนวินาที และส่วนใหญ่ อ้างอิงเวลาอ้างอิงของ NIST
บทเรียนและความน่าเชื่อถือของระบบ
- เหตุการณ์นี้พิสูจน์ว่า ระบบตอบสนองเหตุฉุกเฉินของ NIST ใช้งานได้จริง และแสดงให้เห็นว่า “ยังเดินระบบได้ตามปกติแม้มีความคลาดเคลื่อนเพียงเล็กน้อย”
- การผสานกันของ ระบบไฟฟ้าซ้ำซ้อน นาฬิกาหลายชุด และระบบสำรองด้วย GPS ช่วยรักษา เสถียรภาพของโครงสร้างพื้นฐานด้านเวลาทั่วประเทศ
- ผู้เขียนเน้นย้ำว่า “โครงสร้างพื้นฐานด้านเวลามีความเปราะบางมาก และจำเป็นต้องมีการสำรองหลายชั้น”
- แม้เป็นวิกฤตระดับไมโครวินาที ทีม NIST ก็แก้ปัญหาได้จนผู้ใช้ส่วนใหญ่แทบไม่ทันสังเกต
1 ความคิดเห็น
ความเห็นจาก Hacker News
โปรแกรม Time Over Fiber (TOF) ของ NIST น่าสนใจที่สุด
บริการนี้ให้การส่งผ่าน เวลาความแม่นยำสูง ผ่านใยแก้วนำแสง และว่ากันว่าลิงก์ที่เชื่อมต่อโดยตรงบางส่วนได้รับผลกระทบ
เพิ่งเคยได้ยินบริการแบบนี้เป็นครั้งแรก คิดว่าน่าจะถูกใช้กับ ภาคการเงิน (HFT, เกี่ยวข้องกับข้อกำหนด FINRA 4590) หรือ การซิงก์ 5G หรือไม่ก็สำหรับฐานข้อมูลระดับโลกอย่าง Google Spanner
ลิงก์ที่เกี่ยวข้อง: ประกาศของ NIST, คำอธิบายโปรแกรม TOF, FINRA Rule 4590, บทความเกี่ยวกับการซิงก์ 5G
ในระบบซื้อขายแบบเรียลไทม์ GPS ก็เพียงพอแล้ว และสิ่งที่สำคัญกว่าความแม่นยำระดับไมโครวินาทีคือ latency
ข้อกำหนดด้านกฎระเบียบก็ยอมให้คลาดเคลื่อนได้ 1 วินาที ดังนั้นจึงไม่ได้ต้องการความแม่นยำระดับ TOF
เช่นเวลาที่ต้องซิงก์ข้อมูลจากพื้นที่กว้างอย่างแม่นยำ เหมือนกรณีสังเกต คลื่นความโน้มถ่วง และ การปะทุของรังสีแกมมา พร้อมกัน
อย่างเช่น Schriever Space Force Base ก็เป็นจุดควบคุมหลักของ GPS
อีกทั้งยังสำคัญในฐานะ เครือข่ายเวลาแบบภาคพื้นดิน สำรองเมื่อสัญญาณ GNSS ขาดหาย
บทความที่เกี่ยวข้อง: ระบบตั้งเวลาภาคพื้นดินความแม่นยำสูงของจีน
จริง ๆ แล้วมีแค่ เซิร์ฟเวอร์ Boulder ที่มีปัญหาเรื่องการซิงก์
การพูดว่า “NIST ทั้งหมดออฟไลน์” นั้นเกินจริง
ตาม หน้าสถานะเซิร์ฟเวอร์ มีเพียง 5 จาก 16 เซิร์ฟเวอร์ NTP IPv4 ที่ได้รับผลกระทบ ที่เหลือยังทำงานปกติ
ผู้ใช้ส่วนใหญ่แทบไม่ได้รับผล เพราะปกติก็ไม่ควรใช้เซิร์ฟเวอร์ระดับบนสุดโดยตรงอยู่แล้ว
ส่วนตัวแนะนำให้ใช้ pool.ntp.org
จะมีโอกาสที่ความผิดพลาดจะแพร่กระจายไหม? แล้ว pool.ntp.org กระจายตัวพอที่จะหลีกเลี่ยงความสัมพันธ์ของความขัดข้องหรือความคลาดเคลื่อนได้หรือเปล่า
ขอติงเล็กน้อยว่า UTC เป็นตัวย่อของ “Coordinated Universal Time”
โดยจัดลำดับตัวอักษรให้ไม่เอนเอียงไปทางภาษาอังกฤษหรือฝรั่งเศส
และยังคำนึงถึงความสอดคล้องกับระบบตัวย่อเดิมอย่าง UT0, UT1, UT2 ด้วย
แม้จะออกนอกประเด็นไปหน่อย แต่ขอชม chrony
มันเสถียรกว่า NTP client ค่าเริ่มต้นของ OS เดิมมากในฮาร์ดแวร์หลายแบบ
ถือเป็นหลักฐานว่าประสิทธิภาพและความเสถียรได้รับการพิสูจน์แล้ว
เธรดนี้น่าสนใจมากจนอ่านต่อไม่หยุด
อาจเป็นเพราะวันนี้กิน Adderall มากเกินไปก็ได้
รู้จัก เทรดเดอร์ HFT อยู่ไม่กี่คนที่ว่ากันว่าทำเงินได้หลายแสนดอลลาร์จากเหตุการณ์นี้
เขาตั้งใจฉวยโอกาสจากระบบ หรือเป็นแค่ glitch ที่โชคดีเฉย ๆ กันแน่
เมื่อก่อนเคยพูดกันว่า “การส่งเวลาที่ผิดแย่กว่าการไม่ส่งเลย” เลยไม่ค่อยเข้าใจว่าทำไมครั้งนี้ถึงยังส่งเวลาที่คลาดเคลื่อนออกมา
ตาม เมลลิงลิสต์ของ NIST การส่งผ่านอินเทอร์เน็ตมักมี ความไม่แน่นอนระดับ 1ms อยู่แล้ว จึงเป็นคนละระดับกับความแม่นยำทางวิทยาศาสตร์
ตอนนั้นทั้งไฟฟ้าและการเข้าถึงเพื่อจัดการต่างก็ขาดหาย ทำให้ไม่รู้เลยว่านาฬิกาคลาดไปมากแค่ไหน
ถ้าพอไฟกลับมาแล้วเวลาที่ผิดถูกกระจายออกไปทันที ระบบทั่วโลกอาจเกิดปัญหาซิงก์ผิดพลาดได้
ดังนั้นการ ตัดออกอย่างปลอดภัย (scram) จึงดีกว่า
นิยายสั้นที่เกี่ยวข้อง: The Time Rift of 2100
เช่น สัญญาณเตือนไฟไหม้บอกผิด ๆ ว่า “ไม่มีปัญหา” อันตรายกว่าการไม่ตอบสนองเลย
ไม่เข้าใจชื่อวิดีโอที่ว่า “นาฬิกาของ NIST เกือบกลายเป็นหายนะ”
แค่ชดเชยเวลาด้วยแคมปัสอื่นไม่ได้เหรอ?
ถ้ามีกรณีที่ต้องการความแม่นยำระดับนั้นจริง ก็น่าจะต้องให้ผู้เชี่ยวชาญมาอธิบาย
อยากรู้ว่ากรณีสำคัญที่สุดที่ผู้คนต้องการ เวลาที่แม่นยำ คืออะไร
ใช้ White Rabbit เพื่อซิงก์ระบบจ่ายกำลัง RF กับอุปกรณ์เก็บข้อมูลให้ตรงกันในระดับ นาโนวินาที
ใช้ TrueTime เพื่อรับประกันความสอดคล้องของทรานแซกชันทั่วโลก
ถ้าดาวเทียม GPS คลาดระดับนั้น ความแม่นยำของตำแหน่งก็คงลดลงไปใกล้ Loran-C
เรื่องนี้เริ่มต้นมาจากบทความของ NPR
ลิงก์ต้นฉบับ