วิเคราะห์เหตุอินเทอร์เน็ตล่มของ CenturyLink/Level(3) วันที่ 30 สิงหาคม
(blog.cloudflare.com)-
บทวิเคราะห์เหตุขัดข้องอินเทอร์เน็ตครั้งใหญ่เมื่อบ่ายวานนี้
-
ตอนแรกเข้าใจกันว่าเป็นปัญหาฝั่ง CloudFlare แต่ภายหลังพบว่าเป็นเหตุขัดข้องจาก CenturyLink ซึ่งเป็นหนึ่งใน ISP รายใหญ่ที่สุดของโลก
-
การอัปเดต Flowspec ที่ผิดพลาดทำให้เกิดปัญหากับ BGP (Border Gateway Protocol)
→ Flowspec เป็นส่วนขยายของ BGP และเป็นเครื่องมือที่ช่วยกระจายกฎไฟร์วอลล์ไปยังเครือข่ายได้อย่างรวดเร็ว
(Cloudflare เคยทำให้เกิดเหตุขัดข้องจาก Flowspec เมื่อ 7 ปีก่อน จึงเลิกใช้งานไปแล้ว)
→ โดยปกติ BGP update จะมีขนาดราว 1.5~2MB แต่เมื่อมี Flowspec นี้รวมอยู่ด้วย ขนาดกลับพุ่งเกิน 20MB ทันทีจนเกิดปัญหา
- ข้อคาดเดาของ CloudFlare ว่าทำไมการกู้คืนจึงใช้เวลานานถึง 4 ชั่วโมง
→ กฎ Flowspec น่าจะทำให้เกิด BGP update ขนาดใหญ่จนไม่สามารถเข้าถึงเราเตอร์ได้
→ เป็นไปได้ว่าปัญหาเกิดจากกฎ Flowspec นี้มาจากลูกค้าของ CenturyLink ไม่ใช่จากตัว CenturyLink เอง จึงทำให้หาสาเหตุได้ยาก
→ เหตุการณ์เกิดขึ้นในช่วงเช้าวันอาทิตย์ตามเวลาสหรัฐฯ อีกทั้งเครือข่าย CenturyLink/Level(3) ก็มีขนาดใหญ่และซับซ้อนมาก
- เหตุขัดข้องของเครือข่ายนี้เมื่อวานทำให้ไม่สามารถเชื่อมต่อเกมออนไลน์จำนวนมากได้ เช่น LoL, PSN, Xbox Live, Steam และ WoW
3 ความคิดเห็น
ที่เกี่ยวข้องคือการแข่งขันโปร League of Legends ถูกระงับ ทำให้ต้องแข่งต่อบนเซิร์ฟเวอร์ปกติแทนเซิร์ฟเวอร์เฉพาะสำหรับการแข่งขัน
[LCK PO 2R] Gen.G vs DRX ที่เคยถูกระงับ ดำเนินเซ็ตที่เหลือต่อบนไลฟ์เซิร์ฟเวอร์ - http://www.inven.co.kr/webzine/news/?news=243826&site=lol
โอ้โห ถ้าเป็นตอนกำลังแข่งอยู่คงลำบากน่าดูเลยนะ
BGP ปลอดภัยหรือไม่? https://th.news.hada.io/topic?id=1932