<p>- PDF แบบ "sandwich" : ไฟล์ PDF ที่มีแต่ภาพซึ่งผ่านการทำ OCR แล้วแทรกข้อความแบบมองไม่เห็นไว้ด้านหลังภาพของแต่ละหน้า<br />
→ สามารถค้นหาข้อความ และเลือกคัดลอกได้<br />
- ใช้เป็นเครื่องมือบรรทัดคำสั่งสำหรับทำ OCR หนังสือหรือนิตยสารที่สแกนมา<br />
→ รองรับข้อความหลายคอลัมน์ด้วย <br />
- tesseract + unpaper + convert + ghostscript <br />
→ รองรับทุกภาษาที่ tesseract รองรับ (รวมถึงภาษาเกาหลี)<br />
- Linux/Mac รองรับการประมวลผลแบบขนานบนระบบมัลติโปรเซสเซอร์ </p>
ยังไม่มีความคิดเห็น