5 คะแนน โดย GN⁺ 2024-10-22 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เครื่องมือสำหรับแปลงเว็บไซต์เป็น ePub
  • สามารถดึงรายการหน้า HTML จากเว็บไซต์และคอมไพล์เป็นหนังสือ ePub เพื่อนำเข้าไปยัง eReader ที่ต้องการได้
  • ผู้ใช้ขั้นสูงที่สามารถเขียน JavaScript ได้ สามารถเพิ่มการกำหนด parser เพิ่มเติมเพื่อปรับแต่งการพาร์สของเว็บไซต์ได้

เว็บไซต์ที่รองรับ

  • Novel Update
  • Wuxia World
  • เว็บไซต์ส่วนใหญ่จาก awesome-read-the-docs
  • เว็บไซต์แบบกำหนดเองที่ใช้ element UL/OL เป็นสารบัญ หรือใช้ regular expression กับข้อความลิงก์ หรือใช้ query selector
  • เว็บแอปแบบกำหนดเองที่ใช้องค์ประกอบชื่อเรื่อง (header) ที่กำหนดไว้ล่วงหน้า และปุ่มถัดไป (ที่คลิกได้)

สรุปโดย GN⁺

  • Epublifier เป็นเครื่องมือที่ช่วยแปลงคอนเทนต์จากเว็บไซต์ให้อยู่ในรูปแบบ ePub เพื่อให้อ่านบน eReader ได้สะดวก
  • เครื่องมือนี้รองรับเว็บไซต์อย่าง Novel Update และ Wuxia World เป็นพิเศษ และผู้ใช้ขั้นสูงสามารถปรับแต่งการพาร์สผ่าน JavaScript ได้
  • เครื่องมือนี้มีประโยชน์สำหรับผู้ใช้ที่ต้องการอ่านคอนเทนต์จากเว็บแบบออฟไลน์ และเครื่องมือที่มีความสามารถคล้ายกันคือ Calibre

1 ความคิดเห็น

 
GN⁺ 2024-10-22
ความคิดเห็นบน Hacker News
  • Calibre รองรับหลายเว็บไซต์
  • ส่วนขยายนี้พยายามอธิบายว่าทำไมจึงแตกต่างจากตัว scraper อื่น
    • มันถูกสร้างมาเพื่อสร้าง EPub สำหรับเว็บไซต์ที่ตัว scraper แบบดั้งเดิมทำงานได้ไม่ดี
    • ตัว scraper แบบบรรทัดคำสั่งทั่วไปและส่วนขยายอื่น ๆ มักทำงานได้เฉพาะกับเว็บไซต์ที่กำหนดไว้ล่วงหน้า
    • อาจต้องมีการตั้งค่าที่ซับซ้อนหรือเขียนโค้ด
    • บางเว็บไซต์ใช้ JavaScript เพื่อสร้างหรือดึงข้อความแบบไดนามิก
    • เนื่องจากทำงานในเบราว์เซอร์ จึงมีโอกาสถูกตรวจจับและบล็อกน้อยกว่า
    • มันไม่ได้มีไว้สำหรับการใช้งานซ้ำ ๆ หรือการทำงานเบื้องหลัง
    • มี UI เพื่อให้ scrape ได้ง่ายแม้ไม่มีการตั้งค่าสำหรับเว็บไซต์นั้น
    • ไม่ได้คาดหวังประสิทธิภาพที่ดีกว่าบนเว็บไซต์ที่โปรแกรม/ส่วนขยายอื่นจัดการได้อยู่แล้ว
    • ผู้เขียนทำมันขึ้นมาเพราะไม่อยากยึดติดกับเว็บไซต์ใดเว็บไซต์หนึ่ง
  • สิ่งที่น่าสนใจของโปรแกรมนี้คือ UI สำหรับดึงคอนเทนต์จากเว็บไซต์ใดก็ได้
  • ถ้ามันจัดการเว็บไซต์ที่ทุกส่วนถูกซ่อนไว้หลัง accordion ได้ก็คงยอดเยี่ยม
  • กำลังทำอะไรคล้าย ๆ กันอยู่
    • กำลังพัฒนาเว็บ scraper และตัวแยกวิเคราะห์ ePub สำหรับบล็อก เว็บนิยาย และอื่น ๆ
    • กำลังพัฒนาแอปคู่แบบ PWA สำหรับการอ่านออฟไลน์ด้วย
  • บางครั้งก็อยากได้บทความของ Paul Graham เป็น ePub
  • เคยทำเวอร์ชันง่าย ๆ ที่บันทึกไฟล์ ePub ลงในระบบไฟล์ของเซิร์ฟเวอร์
    • ใช้ Postlight Parser เพื่อแสดงมุมมองเอกสารแบบย่อของเว็บไซต์
  • เครื่องมือนี้ยอดเยี่ยมมาก
    • ยุคที่ต้องแคชเว็บเพจจำนวนมากไว้สำหรับการเดินทางแบบออฟไลน์ได้ผ่านไปแล้ว
  • สงสัยว่ารองรับ fanfiction.net หรือไม่
  • น่าจะชอบใช้มันกับเว็บไซต์ที่มีเอกสารจำนวนมากอย่าง AWS, VueJS, MDN, w3schools, realpython, betterstack