- เว็บบริการที่ตรวจสอบสถานะการทำงานของเว็บไซต์ DownDetectorแบบเรียลไทม์จากหลายภูมิภาค
- วัดรหัสตอบกลับ HTTP และเวลาแฝง (latency) จากเซิร์ฟเวอร์ 3 ภูมิภาค ได้แก่ ลอนดอน โอ๊คแลนด์ และนิวยอร์ก
- ทุกภูมิภาคส่งคืนรหัส HTTP 200 (ตอบสนองปกติ) แสดงว่าเว็บไซต์ทำงานได้ตามปกติ
- เวลาแฝงเฉลี่ยแสดงอยู่ในช่วง 478~586ms ตามแต่ละภูมิภาค
- สามารถนำไปใช้เป็นเครื่องมือตรวจสอบความน่าเชื่อถือของแพลตฟอร์มเฝ้าระวังปัญหาขัดข้องหลักได้
ผลการตรวจสอบแยกตามภูมิภาค
- ภูมิภาค London, UK มีสถานะเป็น Up รหัส HTTP 200 และเวลาแฝง 547ms
- ภูมิภาค Auckland, NZ มีสถานะเป็น Up รหัส HTTP 200 และเวลาแฝง 478ms
- ภูมิภาค New York, US มีสถานะเป็น Up รหัส HTTP 200 และเวลาแฝง 586ms
- ทุกภูมิภาคให้ผลลัพธ์ตรงกันซ้ำ ๆ ยืนยันได้ว่าบริการ DownDetector กำลังให้บริการตามปกติ
ภาพรวมบริการ
- เว็บไซต์นี้เป็นหน้ามอนิเตอร์เฉพาะสำหรับเฝ้าตรวจสถานะของ DownDetector
- มีการวัดและแสดงผลรหัสตอบกลับ HTTP และเวลาแฝงของแต่ละภูมิภาคเป็นระยะ
- ให้ตัวชี้วัดอ้างอิงสำหรับตรวจสอบความพร้อมใช้งานของแพลตฟอร์มตรวจจับปัญหาขัดข้องเอง
- ไม่มีข้อมูลเพิ่มเติมในต้นฉบับ
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ในฐานะนักพัฒนาเดี่ยวที่อยู่ในยุโรป ฉันได้ย้ายอินฟราทั้งหมดไปใช้บริการจากยุโรปตั้งแต่ช่วงต้นปีนี้
เปลี่ยนจาก Cloudflare ไปเป็น Bunny.net, จาก AWS ไปเป็น Hetzner และเปลี่ยนอีเมลธุรกิจไปใช้ Infomaniak
จนถึงตอนนี้ยังไม่เคยมีดาวน์ไทม์แม้แต่ครั้งเดียว และความรู้สึกที่แยกออกจากบริการสหรัฐฯ อย่างสมบูรณ์นั้นดีมาก
ในสภาพแวดล้อมองค์กรใหญ่ มักได้ยินคำพูดแนว ๆ ว่า “ถ้าใช้ AWS คงไม่เกิดเรื่องแบบนี้” คล้ายกับที่เคยพูดถึง IBM ในอดีต
Hetzner มีชุดบริการที่เรียบง่ายกว่า AWS มาก จึงมีความซับซ้อนน้อยกว่า
แต่ปัจจัยด้านการรับรู้แบรนด์หรือความรู้สึกว่า ‘ดูเป็นมืออาชีพไหม’ ก็ยังมีผลมากอยู่ดี
จะเลือกอินฟราแบบไหนก็เป็นเรื่องของแต่ละคน แต่การรับรู้เรื่องความพร้อมใช้งานอาจไม่ตรงกับความเป็นจริง
มีประกาศบำรุงรักษาอยู่ แต่เซิร์ฟเวอร์นั้นไม่ได้อยู่ในรายการที่ได้รับผลกระทบ
ไม่ได้หมายความว่า Hetzner แย่ แค่ในยุโรปเองก็มีเหตุขัดข้องเล็กน้อยแบบนี้เกิดขึ้นได้
เลยยังไม่แน่ใจว่า Bunny.net จะทดแทนบทบาทนั้นได้หรือไม่
ตอน Cloudflare ล่มเมื่อวาน Downdetector ก็ดันล่มไปพร้อมกัน เลยทำให้ทุกคนขำกันมาก จังหวะมันพอดีเกินไป
มีมุกว่า “มี Down Detector สามตัวเดินเข้าไปในบาร์”
ตัวแรกตอบว่า “ไม่รู้”, ตัวที่สองก็ตอบว่า “ไม่รู้”, ตัวที่สามตอบว่า “ใช่”
มีการต่อมุกเมตาว่า “นี่มันทองชัด ๆ (GOLD)” แล้วก็ถามว่า “แล้วใครจะคอยตรวจสอบ down detector ที่คอยตรวจสอบ down detector อีกทีล่ะ”
จริง ๆ แล้ว Downdetector ไม่ได้ล่มทั้งระบบ แต่เป็นปัญหาที่โมดูลยืนยันว่าเป็นมนุษย์ของ Cloudflare
ดังนั้นในเชิงเทคนิคมันยัง “ปกติ” แต่ในทางปฏิบัติใช้งานไม่ได้
มีมุกอีกว่า “ต้องมี down detector อีกตัวไว้ตรวจว่า down detector ของคุณยังมีชีวิตอยู่ไหม”
แล้วก็มีคำพูดว่าเป็นโครงสร้างแบบ “Downdetectorsdown ที่ต่อกันไม่รู้จบ”
ถ้า down detector คอยส่ง heartbeat ให้กันและกันเพื่อตรวจสอบ ต่อให้บางตัวตายไป ระบบโดยรวมก็ยังอยู่รอดได้
ถ้ามีโครงสร้าง self-healing ก็จะทำให้เครือข่ายยืดหยุ่นขึ้นมาก
ยังมีคอมเมนต์แนวมีมว่า “Sup dawg, I heard you like down detectors”
มีการแชร์ status page ของ Downdetector โดยตรง
มีความเห็นว่า “Cloudflare ล่มจนทำให้ Downdetector ล่ม และเรื่องนั้นก็ไปเพิ่มภาระให้ CloudFront ต่ออีก”
พร้อมท้าให้ลองสร้างCDN ใหม่ที่รับโหลดระดับนั้นได้
มีคำถามว่า “Downdetector ตรวจจับได้อย่างไรว่าอะไรคือสถานะปกติ?”
ตอน Cloudflare ล่ม หน้าอินเด็กซ์อาจยังตอบ 200 ก็ได้
ถ้าจะใช้ headless browser จับภาพหน้าจอเพื่อตรวจสอบ ก็น่าจะโดน Cloudflare บล็อก
script.jsของfetchStatus()เรียกgenerateMockStatus()เพื่อสร้างเวลาในการตอบสนองแบบสุ่มนั่นแปลว่าไม่ได้ตรวจสอบสถานะจริง แต่เป็นการแสดงข้อมูลสถานะจำลองแทน