6 คะแนน โดย xguru 2020-03-04 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ไลบรารีโอเพนซอร์สสำหรับการแปลงข้อมูลที่รวดเร็ว พัฒนาบนพื้นฐาน XPDF และเขียนด้วยภาษา C

  • มีไฟล์รันได้สำหรับ Windows/Mac/Linux

  • ดึงข้อความภายใน PDF ออกมาพร้อมฟอนต์และพิกัด x,y

1 ความคิดเห็น

 
xguru 2020-03-04

มี pdf2json เวอร์ชัน JavaScript ที่ใช้ pdf.js อยู่ก่อนแล้ว แต่ตัวนี้ใช้ XPDF

https://github.com/mozilla/pdf.js/

https://github.com/modesty/pdf2json

ฟังก์ชันทั่วไปของ PDF ใช้ Apache PDFBox ได้

https://pdfbox.apache.org/

PDFBox เป็นไลบรารี Java ที่สามารถสร้าง PDF, ดึงข้อมูล, แยกและรวมไฟล์, แปลงเป็นรูปภาพ ฯลฯ ได้ทั้งหมด