- เว็บไซต์นี้เป็นหน้าสำหรับอัปเดตเหตุการณ์ระดับโลก โดยจะไม่รวมเหตุขัดข้องด้านฮาร์ดแวร์ทั่วไปหรือเหตุการณ์โครงสร้างพื้นฐานที่มีขอบเขตจำกัด
- หากต้องการดูเหตุการณ์ทั้งหมดที่อาจส่งผลต่อแอปแบบเฉพาะบุคคล สามารถตรวจสอบหน้าสถานะแบบเฉพาะบุคคลได้จากแดชบอร์ดของ Fly Organization
เหตุการณ์ที่ผ่านมา
27 พฤศจิกายน 2024
26 พฤศจิกายน 2024
- API หน่วงและเกิดข้อผิดพลาด timeout: แก้ไขแล้ว ประสิทธิภาพของ Machines API และ GraphQL API กลับสู่ภาวะปกติ
- การเชื่อมต่อลดลง: การ rollout โควตา CPU แบบเต็มรูปแบบทำให้ machine ของลูกค้าบางรายถูกจำกัด ส่งผลให้เกิดปัญหาเครือข่าย และได้ rollback การเปลี่ยนแปลงชั่วคราวเพื่อแก้ไขปัญหา
- ประสิทธิภาพ API ลดลง: แก้ไขแล้ว ขณะนี้ระบบกลับมาทำงานตามปกติหลังจากขยายระบบและใช้การแก้ไขกับ API
25 พฤศจิกายน 2024
- ประสิทธิภาพ API ลดลง: กำลังระบุปัญหาและดำเนินการแก้ไข ประสิทธิภาพของ Machines API และพร็อกซีลดลง
- การกู้คืนคลัสเตอร์ Corrosion: กำลังดำเนินกระบวนการกู้คืนและ reseed และยังคงทำงานอยู่บนบางโฮสต์
24 พฤศจิกายน 2024
23 พฤศจิกายน 2024
22 พฤศจิกายน 2024
- ค้นหา log ไม่ได้: แก้ไขแล้ว ส่งผลต่อแผงค้นหา log ของ Fly Metrics และ log แอปย้อนหลัง
21 พฤศจิกายน 2024
- บำรุงรักษาเครือข่ายฉุกเฉิน: เสร็จสิ้นแล้ว ผู้ให้บริการเครือข่ายได้ดำเนินการเปลี่ยนสวิตช์
20 พฤศจิกายน 2024
19 พฤศจิกายน 2024
- ค้นหา log ไม่ได้: แก้ไขแล้ว ส่งผลต่อแผงค้นหา log ของ Fly Metrics และ log แอปย้อนหลัง
18 พฤศจิกายน 2024
17 พฤศจิกายน 2024
16 พฤศจิกายน 2024
15 พฤศจิกายน 2024
14 พฤศจิกายน 2024
- การเชื่อมต่อ IPv6 ใน IAD ลดลง: แก้ไขแล้ว โดยร่วมมือกับผู้ให้บริการต้นทางเพื่อแก้ปัญหา
1 ความคิดเห็น
ความเห็นจาก Hacker News
ผู้ใช้รายหนึ่งระบุว่าเว็บไซต์ที่โฮสต์บน fly.io ล่มไป 5 นาที แต่หลังจากนั้นก็ทำงานได้เสถียร และกำลังใช้บริการมอนิเตอร์ฟรีเพื่อตรวจสอบทุก 5 นาที
fly.io ได้เผยแพร่ postmortem โดยระบุว่าในปี 2016 เคยใช้เซิร์ฟเวอร์ TLS แบบศูนย์กลางชื่อ Consul แต่ได้เปลี่ยนมาใช้ Corrosion ในปี 2020 ต่อมาในเดือนตุลาคม 2024 คีย์สำหรับลงนาม root key ของ Consul หมดอายุ ทำให้การเชื่อมต่อถูกตัดขาด และกู้คืนได้ด้วยการกระจาย SSL certificate ใหม่
พบว่าคีย์ TLS ของบริการอื่นก็หมดอายุเช่นกันจากปัญหาโครงสร้างพื้นฐานของ fly.io และเครื่องมือ log ยังไปทำให้ผู้ให้บริการเครือข่ายถูกโจมตีแบบ DDOS อีกด้วย ต้องใช้ความพยายามอย่างมากในการแก้ปัญหาหลายอย่างพร้อมกัน
มีการตั้งข้อสงสัยต่อความเสถียรของ fly.io โดยระบุว่าหากแพลตฟอร์มคลาวด์ไม่สามารถมอบความน่าเชื่อถือได้ การเช่า virtual server อาจเป็นทางเลือกที่ดีกว่า
API ของ Fly.io ยังไม่สามารถเข้าถึงได้ และผู้ใช้ไม่สามารถเข้าถึง deployment หรือฐานข้อมูลของตนได้ โดยสามารถตรวจสอบอัปเดตที่แม่นยำได้ผ่านหน้าชุมชน
มีความเห็นว่าจากประสบการณ์ส่วนตัวเมื่อเทียบ Fly.io กับ Railway.com แล้ว Railway ดีกว่าและการสนับสนุนก็ดีกว่าด้วย ขณะที่ Fly.io ไม่ตอบคำถามเกี่ยวกับการลบข้อมูล
มีการระบุว่าเคยเจอเหตุขัดข้องใหญ่ของ Fly.io หลายครั้ง และย้ำว่าความเสถียรของบริการควรเป็นสิ่งสำคัญสูงสุด
Turso ก็ประสบปัญหาที่เกี่ยวข้องกับเหตุขัดข้องของ Fly.io เช่นกัน และ CEO ได้ยืนยันเรื่องนี้บน Discord
มีการตั้งคำถามเกี่ยวกับราคาที่ต่ำของ Fly.io และอ้างถึงเอกสารทางเทคนิคที่อธิบายว่าอินสแตนซ์ถูกตรึงอยู่กับเซิร์ฟเวอร์จริงเครื่องเดียว ดังนั้นหากเซิร์ฟเวอร์ล่มก็ต้องกู้คืนจากแบ็กอัป
มีการกล่าวว่าเหตุขัดข้องมักเกิดขึ้นในสัปดาห์ที่มีวันหยุดสำคัญ และ MS 365/Teams/Exchange ก็ได้รับผลกระทบเช่นกัน พร้อมเสนอว่าในช่วงวันหยุดสำคัญควรหยุดการเปลี่ยนแปลงระบบ
มีการกล่าวถึงเหตุขัดข้องต่อเนื่องหลายครั้งในช่วงต้นปี 2023 ว่าก็เกี่ยวข้องกับปัญหาของ Corrosion เช่นกัน