3 คะแนน โดย GN⁺ 2024-03-17 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ดาวน์โหลด

    • TextSnatcher เป็นแอปพลิเคชันที่ช่วยคัดลอกข้อความจากรูปภาพได้อย่างง่ายดาย และทำงาน OCR ได้ภายในไม่กี่วินาที
  • คุณสมบัติ

    • รองรับหลายภาษา
    • ฟังก์ชันลากเลือกข้อความจากรูปภาพเพื่อคัดลอก
    • สามารถลากเหนือรูปภาพใดก็ได้แล้ววางได้
    • ใช้งานได้รวดเร็วและง่าย
    • ใช้ Tesseract OCR 4.x สำหรับการรู้จำอักขระ
    • สามารถศึกษาข้อมูลเพิ่มเติมเกี่ยวกับ Tesseract และสนับสนุนโครงการ Tesseract ด้วยการกดดาวได้
  • สกรีนแคสต์

    • textsnatcher-eng.mp4
    • textsnatcher-tamil.mp4
  • ภาพหน้าจอ

    • มีภาพหน้าจอของแอปพลิเคชันให้ดู
  • การสนับสนุน

    • มีคำแนะนำเกี่ยวกับวิธีสนับสนุนนักพัฒนา
  • โพสต์บนโซเชียลมีเดีย

    • แชร์โพสต์บน LinkedIn เกี่ยวกับเหตุผลที่สร้าง TextSnatcher
  • การพึ่งพา

    • มีรายการการพึ่งพาที่จำเป็นก่อนติดตั้งและรันแอปพลิเคชัน
      • การพึ่งพาขณะรัน: scrot, tesseract-ocr, ข้อมูลภาษา tesseract
      • การพึ่งพาขณะบิลด์: granite, gtk+-3.0, gobject-2.0, gdk-pixbuf-2.0, libhandy-1, libportal-0.5
  • วิธีติดตั้ง บิลด์ และรัน

    • มีคำสั่งสำหรับโคลน TextSnatcher จากที่เก็บ GitHub และบิลด์พร้อมติดตั้งด้วย Meson
  • แรงบันดาลใจ

    • ได้รับแรงบันดาลใจจาก ReadMe ของ TextSnatcher โครงสร้างแอปพลิเคชัน และ TextSniper ซึ่งเป็นแอปพลิเคชันบน MacOS
    • สร้างขึ้นเพื่อ Linux ด้วย ❤️

ความเห็นของ GN⁺

  • TextSnatcher เป็นเครื่องมือที่ใช้งานสะดวกสำหรับดึงข้อความจากภาพ โดยเฉพาะน่าจะมีประโยชน์กับผู้ใช้ Linux
  • เมื่อเทียบกับแอปพลิเคชันอื่นที่ใช้เทคโนโลยี OCR ก็มีข้อดีจากการใช้เอนจิน Tesseract OCR ทั้งในด้านอัตราการรู้จำที่สูงและการรองรับหลายภาษา
  • ในฐานะโครงการโอเพนซอร์ส นักพัฒนาสามารถตรวจสอบโค้ดและมีส่วนร่วมได้ พร้อมทั้งสามารถพัฒนาอย่างต่อเนื่องด้วยการสนับสนุนจากชุมชน
  • การที่ผู้ใช้ต้องบิลด์และติดตั้งเองอาจเป็นอุปสรรคเริ่มต้นสำหรับผู้ใช้ที่ไม่เชิงเทคนิคบางส่วน แต่ก็เป็นแนวปฏิบัติที่พบได้บ่อยในชุมชน Linux
  • เมื่อนำเทคโนโลยีนี้มาใช้ ผู้ใช้ควรคำนึงถึงการจัดการการพึ่งพาและความเข้ากันได้ของระบบ และเนื่องจากเป็นโอเพนซอร์สจึงคาดหวังการอัปเดตด้านความปลอดภัยและเสถียรภาพอย่างต่อเนื่องได้

1 ความคิดเห็น

 
GN⁺ 2024-03-17
ความคิดเห็นจาก Hacker News
  • ความคิดเห็นเกี่ยวกับการใช้งานและการแก้ไขสคริปต์:

    • ผู้ใช้คนหนึ่งระบุว่า Dibby053 ใช้สคริปต์ที่คัดลอกจาก StackOverflow และได้ปรับให้ทำงานได้บน KDE, GNOME, Wayland และ X11 พร้อมทั้งเพิ่มฟังก์ชันการแจ้งเตือนสถานะเข้าไปด้วย
    • มีการระบุว่าสคริปต์นี้มี dependency อย่าง tesseract-ocr, imagemagick เป็นต้น และจะใช้เครื่องมือที่ต่างกันไปตามสภาพแวดล้อมของผู้ใช้เพื่อจับภาพหน้าจอ จากนั้นปรับคุณภาพภาพเพื่อเพิ่มความแม่นยำในการรู้จำข้อความก่อนคัดลอกไปยังคลิปบอร์ด
  • ความคิดเห็นเกี่ยวกับประสิทธิภาพของ Tesseract:

    • ผู้ใช้คนหนึ่งตั้งข้อสงสัยว่า Tesseract ยังนับเป็นเทคโนโลยีที่ทันสมัยจริงหรือไม่ โดยเล่าว่าจากประสบการณ์ของตน มันแปลงข้อความได้ไม่แม่นยำ โดยเฉพาะกับเอกสารสแกนความละเอียดต่ำและข้อความที่ไม่ใช่ภาษาอังกฤษ
    • ผู้ใช้อีกรายแนะนำเครื่องมือจับภาพหน้าจอใน Microsoft PowerToys สำหรับผู้ใช้ Windows พร้อมเน้นย้ำเรื่องคีย์ลัดที่ใช้งานสะดวก
    • ผู้ใช้คนหนึ่งบอกว่าประสบการณ์ที่เคยใช้ Tesseract ในอดีตค่อนข้างน่าผิดหวัง และสงสัยว่าเทคโนโลยีได้พัฒนาขึ้นจนแทบไม่ต้องทำ post-processing ด้วยมือแล้วหรือยัง
    • ผู้ใช้คนหนึ่งประเมินว่าหลังจากทดสอบด้วยแอป Flatpak แล้ว ผลลัพธ์อาจไม่สมบูรณ์แบบ แต่ข้อความที่ชัดเจนส่วนใหญ่สามารถรู้จำได้ค่อนข้างดี
  • ความคิดเห็นเกี่ยวกับโซลูชันลักษณะเดียวกันบนแพลตฟอร์มอื่น:

    • มีการพูดถึงเครื่องมือ OCR สำหรับผู้ใช้ macOS และให้การประเมินเชิงบวกต่อผู้พัฒนาด้วย
    • บน iOS มีโซลูชันที่ใช้คำสั่งลัดเพื่อจับภาพหน้าจอ ดึงข้อความออกมา และแปลภาษาได้ นอกจากนี้ใน iOS เวอร์ชันใหม่ยังสามารถเลือกและคัดลอกข้อความจากในภาพได้โดยตรงในแอปรูปภาพ
  • ความคิดเห็นเกี่ยวกับโซลูชันสำหรับลินุกซ์เดสก์ท็อป:

    • ผู้ใช้คนหนึ่งกล่าวถึงแอป Flatpak โดยบอกว่าไม่ใช่ทุกลินุกซ์ดิสโทรที่รองรับ Flatpak แต่ตนจะลองใช้งานบน Fedora VM และประเมินว่าแม้จะมีเครื่องมือหลายตัวที่ใช้ Tesseract แต่เมื่อภาพมี noise มากหรือข้อความบิดเบี้ยว ประสิทธิภาพก็จะไม่ดีนัก