<p>- PDF แบบ "sandwich" : ไฟล์ PDF ที่มีแต่ภาพซึ่งผ่านการทำ OCR แล้วแทรกข้อความแบบมองไม่เห็นไว้ด้านหลังภาพของแต่ละหน้า<br /> → สามารถค้นหาข้อความ และเลือกคัดลอกได้<br /> - ใช้เป็นเครื่องมือบรรทัดคำสั่งสำหรับทำ OCR หนังสือหรือนิตยสารที่สแกนมา<br /> → รองรับข้อความหลายคอลัมน์ด้วย <br /> - tesseract + unpaper + convert + ghostscript <br /> → รองรับทุกภาษาที่ tesseract รองรับ (รวมถึงภาษาเกาหลี)<br /> - Linux/Mac รองรับการประมวลผลแบบขนานบนระบบมัลติโปรเซสเซอร์ </p>

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น