- ผู้ใช้จำนวนมากใช้โปรแกรมอ่านฟีด RSS เพื่อให้ติดตามเนื้อหาของเว็บไซต์ได้อย่างอัปเดตอยู่เสมอ
- แต่หากเปิดใช้งาน Cloudflare บนเว็บไซต์ ก็มีความเป็นไปได้ที่จะบล็อกผู้ใช้ RSS เหล่านี้ไม่ให้เข้าถึงเนื้อหาได้
- ในแดชบอร์ดของ Cloudflare มีเครื่องมือสำหรับบล็อกทราฟฟิกจากบอต โดยเฉพาะ Bot Fight Mode และตัวเลือกบล็อก "AI scrapers and crawlers"
- เมื่อเปิดใช้ฟีเจอร์เหล่านี้ ผู้ใช้ที่เข้าถึงเว็บไซต์ผ่านโปรแกรมอ่าน RSS อาจถูกบล็อกได้
วิธีที่ Cloudflare บล็อกโปรแกรมอ่าน RSS
- Cloudflare อาจมองการเข้าชมเว็บไซต์ว่าเป็น AI scraper หรือบอตแล้วทำการบล็อก
- เมื่อโปรแกรมอ่าน RSS พยายามอ่านเว็บไซต์ Cloudflare อาจแสดงการท้าทายที่ต้องให้มนุษย์เป็นผู้ผ่าน ซึ่งโปรแกรมอ่าน RSS ไม่สามารถทำได้
- ในบางกรณี Cloudflare ก็อาจบล็อกการเข้าถึงของโปรแกรมอ่าน RSS โดยไม่มีเหตุผลชัดเจน
การปลดบล็อกโปรแกรมอ่าน RSS ขณะใช้งาน Cloudflare
- แม้จะใช้ Cloudflare ก็ยังสามารถเพิ่มโปรแกรมอ่าน RSS ลงใน whitelist เพื่อยกเลิกการบล็อกได้
- ต้องค้นหา user agent ของโปรแกรมอ่าน RSS ที่ถูกบล็อกจากแดชบอร์ดวิเคราะห์ของ Cloudflare
- สามารถสร้างกฎแบบกำหนดเองโดยอิงจากสตริง user agent หรือที่อยู่ IP เพื่ออนุญาตทราฟฟิกได้
Cloudflare ควรมีวิธีที่ดีกว่านี้ในการอนุญาตโปรแกรมอ่าน RSS
- Cloudflare มีโปรแกรมยืนยันบอตที่ให้เจ้าของโปรแกรมอ่าน RSS สมัครด้วยตนเองได้ แต่โปรแกรมนี้ไม่ได้รับประกันผล และยังมีปัญหาหลายอย่าง
- กระบวนการยืนยันไม่เสถียร
- โปรแกรมอ่าน RSS ที่ผ่านการยืนยันแล้วก็ยังอาจถูกบล็อก
- การปลดบล็อกโปรแกรมอ่าน RSS ในหลายเว็บไซต์เป็นเรื่องยุ่งยาก
สรุปโดย GN⁺
- เครื่องมือความปลอดภัยของ Cloudflare มีประโยชน์ในการป้องกันบอตไม่ประสงค์ดีและการโจมตี แต่ก็ควรทำให้ผู้ใช้เครื่องมือ RSS เข้าถึงเนื้อหาของเว็บไซต์ได้ด้วย
- Cloudflare ควรมีวิธีที่ช่วยแก้ปัญหาการบล็อกโปรแกรมอ่าน RSS ได้อย่างง่ายดาย
- นี่เป็นข้อมูลสำคัญสำหรับเจ้าของเว็บไซต์ที่ใช้การตั้งค่าความปลอดภัยของ Cloudflare
1 ความคิดเห็น
ความเห็นจาก Hacker News
ผู้ดูแล NewsBlur กำลังประสบปัญหาในการดึง RSS feed เนื่องจากการบล็อกของ Cloudflare และผู้ใช้กำลังขอเงินคืน ได้แชร์รายการ IP address ให้ Cloudflare แล้วแต่ไม่ได้ผล หวังว่า Cloudflare จะเพิ่มรายการนี้เข้า allowlist
Listen Notes ใช้ Cloudflare เพื่อจัดการความปลอดภัยของบริการ และแยก subdomain ตามประเภททราฟฟิกเพื่อใช้กฎไฟร์วอลล์และกฎหน้าเว็บที่เหมาะกับแต่ละแบบ จึงช่วยให้มั่นใจได้ว่าบริการจะทำงานได้อย่างเหมาะสมที่สุด
เมื่อรัน Firefox บน OpenBSD พร้อมการตั้งค่าความเป็นส่วนตัวแบบเข้มงวด จะเกิดข้อผิดพลาด 403 Forbidden กับเว็บไซต์ที่มี Cloudflare อยู่ด้านหน้า ซึ่งดูเหมือนจะเป็นปัญหาของ Cloudflare
การเพิ่ม user agent เฉพาะเข้า whitelist เป็นงานทำมือที่ไม่สิ้นสุด และผู้ไม่หวังดีสามารถหลบเลี่ยงได้ จึงแนะนำให้สร้าง page rule ที่ปิดการบล็อกบอตแทน เพื่อแก้ปัญหาให้ RSS reader ทั้งหมด ปัญหาค่าเริ่มต้นของ Cloudflare นี้ยังไม่ได้รับการแก้มาหลายปีแล้ว
Cloudflare ต้องการรับฟังประสบการณ์จากเจ้าของ RSS reader ผ่านอีเมล jgc@cloudflare.com และมีแผนจะขอให้ทีมตรวจสอบปัญหานี้อย่างละเอียด
เจ้าของ RSS reader ระบุว่าคำขอซัพพอร์ตจำนวนมากเกิดจากปัญหา "feed ใช้งานไม่ได้" ซึ่งไม่ได้เกิดจาก Cloudflare เท่านั้น แต่ยังเกิดจากการตั้งค่าไฟร์วอลล์หลากหลายแบบด้วย
Cloudflare รบกวนการดึง feed ของ RSS reader และนอกจากขอให้เจ้าของเว็บไซต์เพิ่มข้อยกเว้นเป็นรายกรณีแล้ว ก็ไม่มีวิธีแก้ปัญหาอื่น
เว็บไซต์ที่ใช้ Cloudflare สามารถบล็อกผู้ใช้ Safari, Chrome หรือแม้แต่ผู้ใช้ทั้งหมดได้ ซึ่งสร้างความเสียหายให้เจ้าของเว็บไซต์ แต่เมื่อเข้าถึง Cloudflare เองกลับไม่ถูกบล็อก
เมื่อเว็บไซต์ของหน่วยงานรัฐถูกบล็อกเพราะ Cloudflare แทบเป็นไปไม่ได้เลยที่จะอธิบายปัญหาและขอให้แก้ไข ต่อให้แก้ได้แล้ว อีกไม่กี่สัปดาห์ปัญหาก็มักกลับมาอีก
Cloudflare รบกวนการเข้าถึงเว็บจาก IP ไทยและ fingerprint ของ Linux Firefox โดยผู้ดูแลเว็บไม่รู้ตัว จึงแก้ปัญหาด้วยการสร้าง RSS bridge โดยใช้ API เว็บสแครปปิงของ Scrapfly เว็บสมัยใหม่กำลังต่อต้านผู้ใช้ และห่างไกลจากอุดมคติของเว็บ 2.0 ที่ทุกอย่างจะเชื่อมต่อกันผ่าน API