3 คะแนน โดย GN⁺ 2024-10-18 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ผู้ใช้จำนวนมากใช้โปรแกรมอ่านฟีด RSS เพื่อให้ติดตามเนื้อหาของเว็บไซต์ได้อย่างอัปเดตอยู่เสมอ
    • แต่หากเปิดใช้งาน Cloudflare บนเว็บไซต์ ก็มีความเป็นไปได้ที่จะบล็อกผู้ใช้ RSS เหล่านี้ไม่ให้เข้าถึงเนื้อหาได้
  • ในแดชบอร์ดของ Cloudflare มีเครื่องมือสำหรับบล็อกทราฟฟิกจากบอต โดยเฉพาะ Bot Fight Mode และตัวเลือกบล็อก "AI scrapers and crawlers"
    • เมื่อเปิดใช้ฟีเจอร์เหล่านี้ ผู้ใช้ที่เข้าถึงเว็บไซต์ผ่านโปรแกรมอ่าน RSS อาจถูกบล็อกได้

วิธีที่ Cloudflare บล็อกโปรแกรมอ่าน RSS

  • Cloudflare อาจมองการเข้าชมเว็บไซต์ว่าเป็น AI scraper หรือบอตแล้วทำการบล็อก
  • เมื่อโปรแกรมอ่าน RSS พยายามอ่านเว็บไซต์ Cloudflare อาจแสดงการท้าทายที่ต้องให้มนุษย์เป็นผู้ผ่าน ซึ่งโปรแกรมอ่าน RSS ไม่สามารถทำได้
  • ในบางกรณี Cloudflare ก็อาจบล็อกการเข้าถึงของโปรแกรมอ่าน RSS โดยไม่มีเหตุผลชัดเจน

การปลดบล็อกโปรแกรมอ่าน RSS ขณะใช้งาน Cloudflare

  • แม้จะใช้ Cloudflare ก็ยังสามารถเพิ่มโปรแกรมอ่าน RSS ลงใน whitelist เพื่อยกเลิกการบล็อกได้
  • ต้องค้นหา user agent ของโปรแกรมอ่าน RSS ที่ถูกบล็อกจากแดชบอร์ดวิเคราะห์ของ Cloudflare
  • สามารถสร้างกฎแบบกำหนดเองโดยอิงจากสตริง user agent หรือที่อยู่ IP เพื่ออนุญาตทราฟฟิกได้

Cloudflare ควรมีวิธีที่ดีกว่านี้ในการอนุญาตโปรแกรมอ่าน RSS

  • Cloudflare มีโปรแกรมยืนยันบอตที่ให้เจ้าของโปรแกรมอ่าน RSS สมัครด้วยตนเองได้ แต่โปรแกรมนี้ไม่ได้รับประกันผล และยังมีปัญหาหลายอย่าง
    • กระบวนการยืนยันไม่เสถียร
    • โปรแกรมอ่าน RSS ที่ผ่านการยืนยันแล้วก็ยังอาจถูกบล็อก
    • การปลดบล็อกโปรแกรมอ่าน RSS ในหลายเว็บไซต์เป็นเรื่องยุ่งยาก

สรุปโดย GN⁺

  • เครื่องมือความปลอดภัยของ Cloudflare มีประโยชน์ในการป้องกันบอตไม่ประสงค์ดีและการโจมตี แต่ก็ควรทำให้ผู้ใช้เครื่องมือ RSS เข้าถึงเนื้อหาของเว็บไซต์ได้ด้วย
  • Cloudflare ควรมีวิธีที่ช่วยแก้ปัญหาการบล็อกโปรแกรมอ่าน RSS ได้อย่างง่ายดาย
  • นี่เป็นข้อมูลสำคัญสำหรับเจ้าของเว็บไซต์ที่ใช้การตั้งค่าความปลอดภัยของ Cloudflare

1 ความคิดเห็น

 
GN⁺ 2024-10-18
ความเห็นจาก Hacker News
  • ผู้ดูแล NewsBlur กำลังประสบปัญหาในการดึง RSS feed เนื่องจากการบล็อกของ Cloudflare และผู้ใช้กำลังขอเงินคืน ได้แชร์รายการ IP address ให้ Cloudflare แล้วแต่ไม่ได้ผล หวังว่า Cloudflare จะเพิ่มรายการนี้เข้า allowlist

  • Listen Notes ใช้ Cloudflare เพื่อจัดการความปลอดภัยของบริการ และแยก subdomain ตามประเภททราฟฟิกเพื่อใช้กฎไฟร์วอลล์และกฎหน้าเว็บที่เหมาะกับแต่ละแบบ จึงช่วยให้มั่นใจได้ว่าบริการจะทำงานได้อย่างเหมาะสมที่สุด

  • เมื่อรัน Firefox บน OpenBSD พร้อมการตั้งค่าความเป็นส่วนตัวแบบเข้มงวด จะเกิดข้อผิดพลาด 403 Forbidden กับเว็บไซต์ที่มี Cloudflare อยู่ด้านหน้า ซึ่งดูเหมือนจะเป็นปัญหาของ Cloudflare

  • การเพิ่ม user agent เฉพาะเข้า whitelist เป็นงานทำมือที่ไม่สิ้นสุด และผู้ไม่หวังดีสามารถหลบเลี่ยงได้ จึงแนะนำให้สร้าง page rule ที่ปิดการบล็อกบอตแทน เพื่อแก้ปัญหาให้ RSS reader ทั้งหมด ปัญหาค่าเริ่มต้นของ Cloudflare นี้ยังไม่ได้รับการแก้มาหลายปีแล้ว

  • Cloudflare ต้องการรับฟังประสบการณ์จากเจ้าของ RSS reader ผ่านอีเมล jgc@cloudflare.com และมีแผนจะขอให้ทีมตรวจสอบปัญหานี้อย่างละเอียด

  • เจ้าของ RSS reader ระบุว่าคำขอซัพพอร์ตจำนวนมากเกิดจากปัญหา "feed ใช้งานไม่ได้" ซึ่งไม่ได้เกิดจาก Cloudflare เท่านั้น แต่ยังเกิดจากการตั้งค่าไฟร์วอลล์หลากหลายแบบด้วย

  • Cloudflare รบกวนการดึง feed ของ RSS reader และนอกจากขอให้เจ้าของเว็บไซต์เพิ่มข้อยกเว้นเป็นรายกรณีแล้ว ก็ไม่มีวิธีแก้ปัญหาอื่น

  • เว็บไซต์ที่ใช้ Cloudflare สามารถบล็อกผู้ใช้ Safari, Chrome หรือแม้แต่ผู้ใช้ทั้งหมดได้ ซึ่งสร้างความเสียหายให้เจ้าของเว็บไซต์ แต่เมื่อเข้าถึง Cloudflare เองกลับไม่ถูกบล็อก

  • เมื่อเว็บไซต์ของหน่วยงานรัฐถูกบล็อกเพราะ Cloudflare แทบเป็นไปไม่ได้เลยที่จะอธิบายปัญหาและขอให้แก้ไข ต่อให้แก้ได้แล้ว อีกไม่กี่สัปดาห์ปัญหาก็มักกลับมาอีก

  • Cloudflare รบกวนการเข้าถึงเว็บจาก IP ไทยและ fingerprint ของ Linux Firefox โดยผู้ดูแลเว็บไม่รู้ตัว จึงแก้ปัญหาด้วยการสร้าง RSS bridge โดยใช้ API เว็บสแครปปิงของ Scrapfly เว็บสมัยใหม่กำลังต่อต้านผู้ใช้ และห่างไกลจากอุดมคติของเว็บ 2.0 ที่ทุกอย่างจะเชื่อมต่อกันผ่าน API