2 คะแนน โดย GN⁺ 2023-12-12 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • หลายเว็บไซต์มี RSS feed ให้ใช้งาน แต่กลับไม่มี ลิงก์ RSS/Subscribe หรือเมทาดาทาสำหรับการค้นหาอัตโนมัติ ทำให้ผู้ใช้หา URL ของฟีดได้ยาก
  • การแสดงลิงก์ RSS บนหน้าเว็บโดยตรง นอกเหนือจากการค้นหาอัตโนมัติของ feed reader ยังช่วยให้ผู้เยี่ยมชมรู้ว่า เว็บไซต์มี RSS และเพิ่มการเข้าถึงของเว็บแบบเปิดได้
  • การค้นหา RSS อัตโนมัติเป็นวิธีมาตรฐานที่มองหา type="application/rss+xml" ในแท็ก <link> ของ HTML และ feed reader อย่าง NetNewsWire สามารถใช้วิธีนี้เมื่อผู้ใช้ป้อน URL
  • หากใส่แท็ก <link> ที่มี rel="alternate", type, title, href ไว้ใน head ของเว็บไซต์ ก็สามารถเปิดเผย RSS feed ได้อย่างชัดเจน
  • หากมีหลายฟีด เช่น RSS, Atom, JSON Feed หรือ podcast feed ก็สามารถมี แท็ก <link> หลายตัว ได้ และปุ่ม RSS ก็ควรทำให้ดูเหมือนปุ่ม RSS

ให้ทั้งลิงก์ RSS และการค้นหาอัตโนมัติ

  • เวลาผู้ใช้มองหา RSS feed สิ่งแรกที่มักตรวจสอบคือ ลิงก์ RSS/Subscribe ภายในเว็บไซต์ แต่หลายเว็บไซต์ไม่มีลิงก์นี้
  • ผู้ใช้บางคนอาจแค่วาง URL ของเว็บไซต์ลงใน feed reader แล้วให้แอปค้นหาฟีดเอง แต่ถ้ามีลิงก์ RSS แสดงอยู่บนหน้า ผู้เยี่ยมชมก็จะรู้ได้ทันทีว่า รองรับ RSS หรือไม่
  • การค้นหา RSS อัตโนมัติคือการมองหารายการในแท็ก <link> ของเว็บไซต์ที่มี type เป็น application/rss+xml
return Array.from(document.getElementsByTagName('link')).find(l => l.type.includes('application/rss+xml'))?.href
  • วิธีนี้เป็นมาตรฐานที่เรียกว่า RSS auto-discovery ซึ่งช่วยให้เบราว์เซอร์และซอฟต์แวร์อื่น ๆ ค้นหา RSS feed ของเว็บไซต์ได้โดยอัตโนมัติ
  • feed reader อย่าง NetNewsWire สามารถใช้เมทาดาทานี้เพื่อค้นหาฟีดได้เมื่อมีการวาง URL ลงไป

เมทาดาทาฟีดที่ใส่ใน head

  • หากมี RSS feed คุณสามารถใส่ แท็กสำหรับการค้นหาอัตโนมัติ แบบนี้ไว้ใน head ของเว็บไซต์ได้
<link rel="alternate" type="application/rss+xml" title="My Cool Website" href="https://example.com/feed.xml"; />
  • สำหรับ Atom feed ให้ใช้ application/atom+xml ใน type
<link rel="alternate" type="application/atom+xml" title="My Cool Website" href="https://example.com/atom.xml"; />
  • หากมีหลายฟีด ก็สามารถใส่แท็ก <link> ได้หลายตัว
    • RSS feed ของเว็บไซต์
    • JSON Feed
    • podcast feed
<!-- Website RSS feed -->
<link rel="alternate" type="application/rss+xml" title="My Cool Website" href="https://example.com/feed.xml"; />

<!-- Website JSON feed -->
<link rel="alternate" type="application/json" title="My Cool Website but JSON" href="https://example.com/feed.json"; />

<!-- Podcast RSS feed -->
<link rel="alternate" type="application/rss+xml" title="My Cool Podcast" href="https://example.com/podcast.xml"; />
  • อัปเดตเมื่อวันที่ 9 ธันวาคม 2023 เพิ่มข้อเสนอว่าเมื่อใส่ปุ่ม RSS ก็ควรทำให้ ดูเหมือนปุ่ม RSS และใช้สีส้มแบบ RSS

2 ความคิดเห็น

 
ndrgrd 2023-12-14

มีหลายเว็บไซต์ที่ซ่อนเอาไว้อย่างมิดชิดเลยนะครับ เวลาที่อยากติดตามจริง ๆ ผมก็มักจะลองพิมพ์ /rss, /rss.xml, /index.xml, /feed, /feed.xml เข้าไปตรง ๆ

 
GN⁺ 2023-12-12
ความคิดเห็นจาก Hacker News
  • เคล็ดลับ: ช่อง YouTube ก็เผยแพร่ฟีด RSS เช่นกัน ดังนั้นแค่วาง URL ของช่องลงใน news reader ก็สมัครติดตามได้
    อาจมีฟีด RSS อยู่ในที่ที่คาดไม่ถึงด้วย จึงน่าใช้ส่วนขยายที่นำปุ่ม “สมัครติดตามด้วย RSS” กลับมาให้เบราว์เซอร์
    <https://addons.mozilla.org/en-US/firefox/addon/awesome-rss/>
    <https://chromewebstore.google.com/detail/rss-subscription-ex...>

    • ถ้าไม่อยากสมัครติดตามทั้งช่อง ดูเหมือนว่าวิธีเดียวกันนี้ใช้ได้กับ เพลย์ลิสต์รายรายการ ด้วย
      https://www.youtube.com/feeds/videos.xml?playlist_id=PLpg6WL...
  • เหตุผลหลักที่ฟีด RSS/Atom จำนวนมากไม่ถูกแสดงให้เห็นมีอยู่สองข้อ: บริการแนว Google Reader หายไป และเบราว์เซอร์เลิกสนับสนุน RSS พื้นฐาน รวมถึงการค้นพบฟีด
    ถ้านำฟีเจอร์ที่ควรอยู่ในเบราว์เซอร์กลับมา อย่างน้อยก็ใช้ค้นหาฟีดได้ แล้วหลังจากนั้นค่อยสมัครติดตามด้วยเครื่องมืออย่าง newsbeuter

    • มันเป็นเรื่องที่ตั้งใจไว้แล้ว เพราะ RSS เป็นวิธีเลี่ยงโฆษณา
      ลองคิดดูว่าเบราว์เซอร์ที่ใช้กันแพร่หลายที่สุดในทุกวันนี้ใครเป็นคนทำ
    • การที่บริการของบริษัทบางรายหายไป ไม่ได้แปลว่าจะใส่ลิงก์ "application/rss+xml" ในซอร์ส HTML ไม่ได้
      ตรงกันข้าม ยังมีเดสก์ท็อปแอปที่ “ยึดคืนไม่ได้” แบบ RSS reader ได้อีกมากมาย การไปพึ่งบริการที่อาจหายไปต่างหากที่แปลก และ RSS reader ก็ยังมีอยู่เยอะ แถมทำขึ้นมาเองก็ไม่ยากนัก
      ถ้าจะหาฟีดก็ตรวจซอร์ส HTML ได้ ปัญหาคือเวลาฟีดมีอยู่จริงแต่ไม่มีแสดงไว้ตรงไหนในไซต์เลย
    • เคยพบว่าปุ่ม RSS บนเว็บไซต์ของตัวเองมองไม่เห็น ตอนแรกไม่รู้สาเหตุ จนไปเช็ก ad blocker แล้วถึงรู้
      ยังมีกฎที่บล็อกไอคอน RSS อยู่ในอย่างน้อยสองรายการคือ AdGuard Widgets และ EasyList Social Widgets แต่ไม่ได้เปิดเป็นค่าเริ่มต้น
    • การใส่ การรองรับ RSS พื้นฐาน เป็นฟีเจอร์หลักของเบราว์เซอร์นั้นตั้งแต่แรกก็ไม่ได้สมเหตุสมผลเท่าไร และส่วนขยายเหมาะกว่ามาก
      บริการที่มาแทน Google Reader ก็มีมาก และยังให้ฟีเจอร์เกินกว่า RSS แบบง่าย ๆ ด้วย
      ในสื่อที่ปรับแต่งเพื่อการมีส่วนร่วมและการเสพติด RSS เป็นทางออกจากแพลตฟอร์ม จึงไม่แปลกที่ไม่ใช้กัน แม้แต่บล็อกส่วนตัวที่บทความพูดถึงเป็นหลัก ก็อาจอยากกักผู้อ่านไว้ในไซต์เพื่อให้เกิดการคลิก
      นี่เป็นความขัดแย้งทางผลประโยชน์ระหว่างผู้ให้คอนเทนต์กับผู้บริโภค โดยมากคือปัญหาเรื่องโฆษณา ไม่ใช่ปัญหาการ implement
  • อยากให้การที่มีคนสมัครติดตามฟีดบล็อก มองเห็นได้สำหรับผู้ดูแลไซต์ ด้วย
    เวลาอ่านบทความดี ๆ ก็ส่งอีเมลชมเจ้าของไซต์บ้าง หรือคอมเมนต์สั้น ๆ บน HN เพื่อบอกว่าสมัครติดตามฟีดแล้ว หวังว่าจะเป็นกำลังใจให้คนที่ทุ่มเทแรงกายแรงใจสร้างคอนเทนต์ดี ๆ ทำต่อไป
    ใน RSS reader ที่ทำเอง ถ้าสนใจก็ดูได้ที่ https://www.heyhomepage.com และจะเติมพารามิเตอร์อย่าง /?rss_ref=heyhomepage.com ให้ลิงก์ที่คลิก เจ้าของไซต์จะได้รับทราฟฟิกจากผม และถ้าดูสถิติผู้เข้าชม ก็จะรู้ได้ง่ายว่ามาจากไหน

    • ถ้าเป็นไปได้ แนะนำให้ใส่ชื่อ reader และจำนวนผู้สมัครติดตามทั้งหมดไว้ใน user agent ของคำขอ HTTP ด้วย
      https://darekkay.com/blog/rss-subscriber-count/
  • RSS เองก็ไม่ค่อยสม่ำเสมอนัก บางคนใส่คอนเทนต์ไว้ในฟีด บางคนใส่แค่ลิงก์
    ถ้ามีแค่ลิงก์ การจะดึงคอนเทนต์ด้วยโปรแกรมมักต้องใช้โค้ดเฉพาะสำหรับแต่ละไซต์ แม้จะมี scraper แบบทั่วไปอยู่บ้าง แต่ก็ต้องยอมรับได้หากมี noise แบบสุ่ม ๆ เช่นส่วน header ของไซต์ปนเข้ามาในข้อมูล
    คิดว่า การมาถึงของ LLM อาจทำให้เรื่องนี้มีตลาดขึ้นมาในที่สุด ผู้คนอาจขายข้อมูลอย่างบทความเป็นแหล่งข้อมูลสำหรับ pipeline การเรียนรู้ของเครื่องได้ และอาจเป็นเส้นทางหนึ่งในการหลุดพ้นจากโฆษณา
    ดังนั้นอยากให้เริ่มจากการทำให้ RSS ดีขึ้นก่อน มันเหมือนประภาคารกลางทะเลมืด

    • ไม่คิดว่า RSS จำเป็นต้องถูก “ปรับปรุง” เพื่อ scraper
    • NewsBlur มีสวิตช์ให้เลือกระหว่างมุมมองฟีดกับมุมมองข้อความ
      มุมมองข้อความมักดึงบทความเต็มจากเว็บไซต์ได้ แม้ในฟีดจะมีแค่สรุป
    • หมายความว่า RSS จะทำให้ การฟอกลิขสิทธิ์ ทำได้ดีขึ้นหรือ?
    • ผมทำ RSS reader/tracker ที่มีจุดยืนค่อนข้างชัดและจัดการเฉพาะลิงก์ โดยมีแนวคิดนี้เป็นแกน
      วิธีนี้ทำให้ได้ประสบการณ์ที่สม่ำเสมอ และผู้เขียนก็ได้รับการเข้าชมเว็บไซต์ของตัวเองด้วย
      ลองใช้ได้ที่นี่: https://lenns.io ยินดีมากถ้าได้รับฟีดแบ็ก
    • เลิกใช้ RSS เพราะประเด็นที่ว่า “บางคนใส่คอนเทนต์ไว้ในฟีด บางคนใส่แค่ลิงก์”
      ถ้ายังไงก็ต้องตามลิงก์ไปอยู่ดี ก็ขอไปที่เว็บไซต์ที่อยากอ่านโดยตรงเพื่อประหยัดเวลา
  • เหตุผลเก่า ๆ อย่างหนึ่งที่บางคนไม่อยากเปิดเผย RSS คืออยากพอจะรู้จำนวนผู้ติดตาม แต่ช่วงหลังฉันได้รู้ว่า RSS reader รายใหญ่หลายรายเปิดเผย ตัวเลขวิเคราะห์ระดับสูง
    ใช้ข้อมูลนั้นก็พอประเมินจำนวนผู้อ่าน RSS ได้เหมือนกัน ถ้า reader มากกว่านี้รองรับฟีเจอร์นี้ก็คงดี จาก RSS feed ทั้งหมดที่ฉันเปิดไว้ในผลิตภัณฑ์ ดูเหมือน client ที่รองรับโปรโตคอลปลอม ๆ นี้มีราว ๆ NewsBlur, Feedly, Feedbin, inoreader
    ได้รู้เรื่องนี้จากบทความของ Darek Kay https://darekkay.com/blog/rss-subscriber-count/

    • การที่ RSS reader รายใหญ่เปิดเผยจำนวนผู้ติดตามเป็นฟีเจอร์เสริมที่ดี แต่ก็มีผลผลักไปทาง การรวมศูนย์ อยู่บ้าง
      ฉันพยายามใส่พารามิเตอร์ URL อย่าง /?rss_ref=heyhomepage.com เพื่อบอกผู้ดูแลเว็บว่าฉันกำลังติดตามฟีดของเขาอยู่ ผู้ดูแลอาจเห็นหรือไม่เห็น RSS referrer นี้ในสถิติผู้เข้าชมของตนก็ได้
      ฉันไม่ได้เสพบทความทั้งชิ้นอยู่แต่ใน reader แต่ให้แสดงสรุปสั้น ๆ แล้วคลิกลิงก์ไปอ่านบทความ วิธีนี้ทำให้ฉันได้เพลิดเพลินกับเว็บส่วนตัวของพวกเขา และผู้ดูแลก็เห็นทราฟฟิกจากฉันได้ชัดขึ้น
    • เป็นวิธีที่พบได้บ่อยใน ไคลเอนต์พอดแคสต์ ที่ crawl ฝั่งเซิร์ฟเวอร์ด้วย และแทบทั้งหมดก็ทำแบบนั้นจริง ๆ
    • วิธีแก้ที่ง่ายที่สุดคือดู คำขอจากเซิร์ฟเวอร์ ไปเลย
      reader ของฉันเป็นแบบใช้เทอร์มินัล ดังนั้นการรองรับฟีเจอร์ analytics ด้วย JavaScript จึงทำให้เป้าหมายเดิมเลือนหายไป
  • ระบบค้นหาอัตโนมัติพังหรือหายไปในหลายไซต์ ดังนั้น feed reader ของฉันชื่อ Temboz จึงลอง suffix เหล่านี้ เผื่อว่าจะมี RSS หรือ Atom feed ซ่อนอยู่ที่ไหนสักแห่ง
    'feed', 'feed/', 'rss', 'atom', 'feed.xml', '/feed', '/feed/', '/rss', '/atom', '/feed.xml', 'index.atom', 'index.rss', 'index.xml', 'atom.xml', 'rss.xml', '/index.atom', '/index.rss', '/index.xml', '/atom.xml', '/rss.xml', '.rss', '/.rss', '?rss=1', '?feed=rss2'

  • ก่อนหน้านี้ฉันสร้าง https://hn-blogs.kronis.dev ไว้ โดยอิงจาก RSS/Atom feed ที่ผู้คนแชร์กันบน HN และตอนนี้ก็ยังทำงานอยู่เบื้องหลัง คอยดึงบทความล่าสุดทุกวัน
    ในไซต์มีลิงก์ไปยังโพสต์ HN ต้นฉบับกับบล็อกโพสต์ที่ฉันเขียนไว้ ส่วนบล็อกโพสต์อยู่ที่นี่: https://blog.kronis.dev/articles/ever-wanted-to-read-thousan...
    เป็นงานที่ค่อนข้างน่าสนใจ และดีที่เทคโนโลยีนี้ยังมีอยู่ แต่แต่ละคนมีวิธีผสานรวมต่างกันมาก บางครั้งชนิดของฟีดก็รายงานผิด บางครั้งก็ไม่ได้ metadata ของฟีดหรือรายการที่ต้องการครบ บางครั้งเกิดข้อผิดพลาดเครือข่าย หรือ XML parsing พังเพราะ control sequence ในข้อความ
    ยิ่งขนาด dataset ใหญ่ขึ้น ก็ยิ่งมั่นใจว่าจะเจอปัญหาที่อาจเกิดได้มากขึ้น ถ้าข้อผิดพลาดแบบไหนเกิดขึ้นได้ สุดท้ายก็ต้องรับมือกับมัน

  • บทความนี้เหมือนเจาะจงมาที่ฉัน เลยเพิ่ม ไอคอน RSS ไว้ที่ footer ของหน้าแล้ว
    https://github.com/gavinanderegg/gavinanderegg.github.io/com...
    ฉันเคยคิดว่าลิงก์ "application/rss+xml" ก็พอแล้ว แต่ก็เข้าใจว่าทุกวันนี้คนคงไม่คาดเดาว่าทุกไซต์จะมีลิงก์แบบนั้น ในฐานะคนที่อ่านบล็อกผ่าน RSS เป็นหลัก การทำให้ชัดเจนขึ้นถือว่าดีมาก
    [1] https://mastodon.social/@gavinanderegg/111362850402497489

    • หน้าเว็บของฉันเองก็ไม่ได้ทำให้ RSS feed เห็นชัดเหมือนกัน ฉันไม่ค่อยถนัด HTML เลยอ้างอิงวิธีที่คุณทำบนไซต์ของคุณ แล้วปรับให้เข้ากับไซต์ของฉัน
      ตอนนี้เราทั้งคู่ก็ถือว่าเปิดเผย RSS แล้ว
  • ฉันใช้ miniflux อยู่ เวลาหาฟีด ถ้าลองใส่โดเมนเข้าไปเฉย ๆ สักสามในสี่ครั้งมันจะหาเจอจากที่ไหนสักแห่งอย่าง /rss, feed
    ถ้าแสดงให้เห็นชัดเจนก็คงดี บางทีอาจเพราะมันมากับ framework แบบฟรี ๆ อยู่แล้ว เลยไม่จำเป็นต้องเอามาโชว์ก็ได้ แต่นี่อาจเป็นความคิดที่ซื่อเกินไป

  • ความจริงที่ว่า RSS ถูกกดทับไว้ ทำให้ฉันโมโหทุกครั้งที่นึกถึง

    • ใครเป็นคนกดทับกันล่ะ? Google อาจฆ่า news reader ของตัวเองไปก็จริง แต่ RSS ไม่ได้พึ่ง Google จึงไม่เคยหยุดอยู่แล้ว
      ฉันชอบมากที่ Wordpress ใส่ feed ให้อัตโนมัติกับทุกไซต์บนอินเทอร์เน็ต
      ฉันมองสิ่งนี้เหมือนตัวกรอง คอนเทนต์ clickbait โง่ ๆ ก็ไปที่อื่น ส่วนคอนเทนต์คุณภาพที่คนสร้างรับผิดชอบเองโดยตรงก็เข้ามาอยู่ใน feed reader ของฉันได้ดี สำหรับฉันมันแทบจะเป็นโชคดีในคราบอย่างอื่น
      แน่นอนว่าการดูแลชุด feed ดี ๆ ต้องใช้ความพยายามเพิ่ม แต่ของดี ๆ ในชีวิตก็เป็นแบบนั้นไม่ใช่หรือ? ความพยายามนี้ทบต้นสะสมและตอบแทนอย่างรวดเร็ว
      RSS จงเจริญ เว็บเปิดจงเจริญ!