1 คะแนน โดย GN⁺ 2024-11-27 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เว็บไซต์นี้เป็นหน้าสำหรับอัปเดตเหตุการณ์ระดับโลก โดยจะไม่รวมเหตุขัดข้องด้านฮาร์ดแวร์ทั่วไปหรือเหตุการณ์โครงสร้างพื้นฐานที่มีขอบเขตจำกัด
  • หากต้องการดูเหตุการณ์ทั้งหมดที่อาจส่งผลต่อแอปแบบเฉพาะบุคคล สามารถตรวจสอบหน้าสถานะแบบเฉพาะบุคคลได้จากแดชบอร์ดของ Fly Organization

เหตุการณ์ที่ผ่านมา

27 พฤศจิกายน 2024

  • ไม่มีรายงานเหตุการณ์

26 พฤศจิกายน 2024

  • API หน่วงและเกิดข้อผิดพลาด timeout: แก้ไขแล้ว ประสิทธิภาพของ Machines API และ GraphQL API กลับสู่ภาวะปกติ
  • การเชื่อมต่อลดลง: การ rollout โควตา CPU แบบเต็มรูปแบบทำให้ machine ของลูกค้าบางรายถูกจำกัด ส่งผลให้เกิดปัญหาเครือข่าย และได้ rollback การเปลี่ยนแปลงชั่วคราวเพื่อแก้ไขปัญหา
  • ประสิทธิภาพ API ลดลง: แก้ไขแล้ว ขณะนี้ระบบกลับมาทำงานตามปกติหลังจากขยายระบบและใช้การแก้ไขกับ API

25 พฤศจิกายน 2024

  • ประสิทธิภาพ API ลดลง: กำลังระบุปัญหาและดำเนินการแก้ไข ประสิทธิภาพของ Machines API และพร็อกซีลดลง
  • การกู้คืนคลัสเตอร์ Corrosion: กำลังดำเนินกระบวนการกู้คืนและ reseed และยังคงทำงานอยู่บนบางโฮสต์

24 พฤศจิกายน 2024

  • ไม่มีรายงานเหตุการณ์

23 พฤศจิกายน 2024

  • ไม่มีรายงานเหตุการณ์

22 พฤศจิกายน 2024

  • ค้นหา log ไม่ได้: แก้ไขแล้ว ส่งผลต่อแผงค้นหา log ของ Fly Metrics และ log แอปย้อนหลัง

21 พฤศจิกายน 2024

  • บำรุงรักษาเครือข่ายฉุกเฉิน: เสร็จสิ้นแล้ว ผู้ให้บริการเครือข่ายได้ดำเนินการเปลี่ยนสวิตช์

20 พฤศจิกายน 2024

  • ไม่มีรายงานเหตุการณ์

19 พฤศจิกายน 2024

  • ค้นหา log ไม่ได้: แก้ไขแล้ว ส่งผลต่อแผงค้นหา log ของ Fly Metrics และ log แอปย้อนหลัง

18 พฤศจิกายน 2024

  • ไม่มีรายงานเหตุการณ์

17 พฤศจิกายน 2024

  • ไม่มีรายงานเหตุการณ์

16 พฤศจิกายน 2024

  • ไม่มีรายงานเหตุการณ์

15 พฤศจิกายน 2024

  • ไม่มีรายงานเหตุการณ์

14 พฤศจิกายน 2024

  • การเชื่อมต่อ IPv6 ใน IAD ลดลง: แก้ไขแล้ว โดยร่วมมือกับผู้ให้บริการต้นทางเพื่อแก้ปัญหา

1 ความคิดเห็น

 
GN⁺ 2024-11-27
ความเห็นจาก Hacker News
  • ผู้ใช้รายหนึ่งระบุว่าเว็บไซต์ที่โฮสต์บน fly.io ล่มไป 5 นาที แต่หลังจากนั้นก็ทำงานได้เสถียร และกำลังใช้บริการมอนิเตอร์ฟรีเพื่อตรวจสอบทุก 5 นาที

  • fly.io ได้เผยแพร่ postmortem โดยระบุว่าในปี 2016 เคยใช้เซิร์ฟเวอร์ TLS แบบศูนย์กลางชื่อ Consul แต่ได้เปลี่ยนมาใช้ Corrosion ในปี 2020 ต่อมาในเดือนตุลาคม 2024 คีย์สำหรับลงนาม root key ของ Consul หมดอายุ ทำให้การเชื่อมต่อถูกตัดขาด และกู้คืนได้ด้วยการกระจาย SSL certificate ใหม่

  • พบว่าคีย์ TLS ของบริการอื่นก็หมดอายุเช่นกันจากปัญหาโครงสร้างพื้นฐานของ fly.io และเครื่องมือ log ยังไปทำให้ผู้ให้บริการเครือข่ายถูกโจมตีแบบ DDOS อีกด้วย ต้องใช้ความพยายามอย่างมากในการแก้ปัญหาหลายอย่างพร้อมกัน

  • มีการตั้งข้อสงสัยต่อความเสถียรของ fly.io โดยระบุว่าหากแพลตฟอร์มคลาวด์ไม่สามารถมอบความน่าเชื่อถือได้ การเช่า virtual server อาจเป็นทางเลือกที่ดีกว่า

  • API ของ Fly.io ยังไม่สามารถเข้าถึงได้ และผู้ใช้ไม่สามารถเข้าถึง deployment หรือฐานข้อมูลของตนได้ โดยสามารถตรวจสอบอัปเดตที่แม่นยำได้ผ่านหน้าชุมชน

  • มีความเห็นว่าจากประสบการณ์ส่วนตัวเมื่อเทียบ Fly.io กับ Railway.com แล้ว Railway ดีกว่าและการสนับสนุนก็ดีกว่าด้วย ขณะที่ Fly.io ไม่ตอบคำถามเกี่ยวกับการลบข้อมูล

  • มีการระบุว่าเคยเจอเหตุขัดข้องใหญ่ของ Fly.io หลายครั้ง และย้ำว่าความเสถียรของบริการควรเป็นสิ่งสำคัญสูงสุด

  • Turso ก็ประสบปัญหาที่เกี่ยวข้องกับเหตุขัดข้องของ Fly.io เช่นกัน และ CEO ได้ยืนยันเรื่องนี้บน Discord

  • มีการตั้งคำถามเกี่ยวกับราคาที่ต่ำของ Fly.io และอ้างถึงเอกสารทางเทคนิคที่อธิบายว่าอินสแตนซ์ถูกตรึงอยู่กับเซิร์ฟเวอร์จริงเครื่องเดียว ดังนั้นหากเซิร์ฟเวอร์ล่มก็ต้องกู้คืนจากแบ็กอัป

  • มีการกล่าวว่าเหตุขัดข้องมักเกิดขึ้นในสัปดาห์ที่มีวันหยุดสำคัญ และ MS 365/Teams/Exchange ก็ได้รับผลกระทบเช่นกัน พร้อมเสนอว่าในช่วงวันหยุดสำคัญควรหยุดการเปลี่ยนแปลงระบบ

  • มีการกล่าวถึงเหตุขัดข้องต่อเนื่องหลายครั้งในช่วงต้นปี 2023 ว่าก็เกี่ยวข้องกับปัญหาของ Corrosion เช่นกัน