1 คะแนน โดย GN⁺ 2024-07-30 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ผลกระทบของ CrowdStrike ต่ออุตสาหกรรมการบิน

  • เมื่อวันที่ 19 กรกฎาคม 2024 CrowdStrike ได้แจกจ่ายการอัปเดตการตั้งค่าเซ็นเซอร์ไปยังระบบ Windows
  • การอัปเดตนี้ทำให้คอมพิวเตอร์ราว 8.5 ล้านเครื่องเกิดจอฟ้า ส่งผลกระทบต่อหลายหน่วยงาน เช่น โรงพยาบาล ธนาคาร และระบบ 911
  • Linux, Mac และโทรศัพท์มือถือไม่ได้รับผลกระทบ

ผลกระทบต่ออุตสาหกรรมการบินของสหรัฐฯ

  • มีการแสดงกราฟเปรียบเทียบจำนวนเที่ยวบินที่ขึ้นบินจากสหรัฐฯ รายชั่วโมงในวันที่ 19 กรกฎาคม
  • เมื่อเทียบกับวันที่ 12 กรกฎาคม ช่วง 0600 ถึง 1300 ลดลงเล็กน้อย และหลังจากนั้นเพิ่มขึ้นเล็กน้อย
  • ในสถิติสะสมที่เริ่มตั้งแต่ 0400 มีจำนวนเพิ่มขึ้น 2.6% เมื่อเทียบกับวันศุกร์ของสัปดาห์ก่อน

สถิติของสายการบิน

  • มีการแสดงสถิติของ 4 สายการบินหลักของสหรัฐฯ (Delta, United, American, Southwest)
  • Delta: -1087 เที่ยวบิน (-46%)
  • United: -596 เที่ยวบิน (-36%)
  • American: -376 เที่ยวบิน (-16%)
  • Southwest: +101 เที่ยวบิน (+3%)

สรุปสายการบิน

  • Delta ได้รับผลกระทบหนักที่สุด โดยมี United และ American ตามมา
  • Southwest ไม่ได้รับผลกระทบ
  • Delta ใช้เวลาฟื้นตัวนาน ขณะที่สายการบินอื่นกลับสู่ภาวะปกติได้เร็วกว่า

ข้อมูลและการวิเคราะห์

  • ใช้ข้อมูลดิบจาก ADS-B Exchange และประมวลผลด้วยโค้ดที่ตรวจจับการขึ้นบินของเครื่องบิน
  • นับการขึ้นบินเป็นหนึ่งเที่ยวบินเพื่อนำมาจัดทำสถิติ

สรุปจาก GN⁺

  • เป็นบทความที่วิเคราะห์ผลกระทบของเหตุขัดข้องด้าน IT ครั้งใหญ่ที่เกิดจากการอัปเดตของ CrowdStrike ต่ออุตสาหกรรมการบิน
  • มีการเสนอความเห็นหลากหลายว่าทำไมสายการบิน Delta จึงใช้เวลาฟื้นตัวนานกว่าสายการบินอื่น
  • บทความนี้เน้นย้ำความสำคัญของเสถียรภาพของระบบ IT และแผนรับมือเหตุฉุกเฉิน
  • โครงการอื่นที่มีฟังก์ชันคล้ายกันซึ่งแนะนำ ได้แก่ เครื่องมือจัดการและวิเคราะห์ล็อกอย่าง Splunk

1 ความคิดเห็น

 
GN⁺ 2024-07-30
ความคิดเห็นจาก Hacker News
  • ซอฟต์แวร์ติดตามลูกเรือของ Delta ได้รับผลกระทบอย่างหนัก ทำให้ใช้เวลานานในการกู้คืน

  • ชี้ให้เห็นว่าคอมพิวเตอร์จำนวนมากไม่ควรเชื่อมต่ออินเทอร์เน็ต

  • ดูเหมือนว่า Delta กำลังเตรียมฟ้องร้องอยู่แล้ว

  • มีบทความว่าที่ Southwest Airlines หลีกเลี่ยงปัญหาหยุดชะงักของ CrowdStrike และ Microsoft ได้เพราะใช้ Windows 3.1

  • สงสัยว่าทำไมสนามบิน Minneapolis-St Paul ถึงเจอการยกเลิกเที่ยวบินเร็วกว่าสนามบินอื่นในสหรัฐฯ

  • สงสัยว่าแผนกู้คืนจากภัยพิบัติที่ทันสมัยและซ้อมมาอย่างดีได้ผล หรือเป็นเพราะฝ่าย IT ไม่ได้จ่ายค่าใช้จ่ายด้านการสำรองและกู้คืน

  • สงสัยว่ามีการวิเคราะห์ในระดับโลกหรือไม่

  • สิ่งที่น่าสนใจของเหตุขัดข้องครั้งนี้คือระบบ "PROD" ซึ่งส่วนใหญ่รันบน Linux และซอฟต์แวร์ proprietary เก่า ๆ ไม่ได้รับผลกระทบมากนัก แต่ระบบ "CORP" ซึ่งส่วนใหญ่รันบน Windows กลับได้รับผลกระทบอย่างหนัก

    • ระบบธนาคารไม่มีปัญหาในการเคลื่อนย้ายเงิน แต่ระบบที่ใช้โต้ตอบกับผู้คนมีปัญหา
  • ปัญหารุนแรงขึ้นเพราะ Delta เอาความสามารถหลักทางธุรกิจไป outsource และประหยัดด้วยการกดสัญญาให้ต่ำที่สุด

    • หวังว่าค่าใช้จ่ายในการชดเชยลูกค้าจะสูงกว่าต้นทุนที่ประหยัดไป
    • ที่มา: คอมเมนต์ใน Reddit
  • Delta ไม่มีทั้งแผนกู้คืนจากภัยพิบัติที่เหมาะสมและแผนความต่อเนื่องทางธุรกิจด้าน IT

    • UA, AA, F9 มีแผนที่พร้อมใช้งานและนำมาใช้ได้ทันที ทำให้กู้คืนได้รวดเร็ว
    • UA และ AA วางแผนไว้ครอบคลุมทุกจุด ตั้งแต่ server farm, cloud solution ไปจนถึงสถานีผู้ใช้ปลายทางในสนามบิน
    • Delta outsource งาน IT ไปจำนวนมาก
    • UA และ AA ไม่ลังเลที่จะจ่ายค่าโอทีให้พนักงาน
    • UA และ AA ก็พึ่งพา Windows มากพอ ๆ กับ Delta
    • AA กู้คืนได้ภายในปลายวันศุกร์และกลับมาเดินงานตามปกติในวันเสาร์
    • UA กู้คืนได้ราว 12 ชั่วโมงถัดมา และกลับมาตารางบินปกติในบ่ายวันเสาร์
    • ความรับผิดชอบของปัญหานี้อยู่ที่การตัดสินใจด้าน IT ของ Delta 100%
    • พนักงาน IT ระดับล่างจะเป็นผู้รับคำตำหนิและผลกระทบส่วนใหญ่
  • ชอบที่ตอนนี้ "CrowdStrike" กลายเป็นคำพ้องความหมายของ "เหตุขัดข้องระดับโลก"

    • ไม่ใช่ชื่อเรียกน่ารักแบบ "heartbleed" แต่เป็นชื่อบริษัทที่ก่อปัญหาเอง