5 คะแนน โดย GN⁺ 2024-01-04 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ตอบคำถามจากผู้อ่านเกี่ยวกับวิธีทำ OCR ฟรีบน Mac โดยใช้ CLI หรือ Python
  • แบ่งปันวิธีตั้งค่า 'บริการ' OCR ภายในเครื่องแบบฟรีผ่าน Terminal, CLI และ Python บน Mac
  • เปิดแอป Shortcuts แล้วสร้างชอร์ตคัตใหม่ จากนั้นลากแอ็กชัน "Extract Text from Image" เพื่อตั้งค่าให้ดึงข้อความจากรูปภาพ
  • เลือก "Shortcut Input" และวางแอ็กชัน "Copy to Clipboard" ไว้ใต้แอ็กชัน "Extract text from ..."
  • ตั้งชื่อชอร์ตคัต แล้วสามารถลองรัน OCR จาก Terminal ด้วยคำสั่ง shortcuts run ocr-text -i <이미지 경로>
  • ใน Python สามารถใช้โมดูล subprocess เพื่อรัน OCR และแสดงผลลัพธ์

ความเห็นของ GN⁺

  • บทความนี้มีข้อมูลที่เป็นประโยชน์สำหรับผู้ใช้ Mac โดยเสนอวิธีใช้ความสามารถ OCR ได้ฟรี ซึ่งช่วยเพิ่มประสิทธิภาพในการทำงานกับเอกสาร
  • ด้วยการตั้งค่าอย่างง่ายผ่านแอป Shortcuts ผู้ใช้ก็สามารถดึงข้อความจากภาพได้ ทำให้แม้แต่ผู้ที่ไม่มีความรู้ด้านการเขียนโปรแกรมก็เข้าถึงได้ง่าย
  • นอกจากนี้ยังอธิบายวิธีสร้างกระบวนการอัตโนมัติผ่าน Python จึงเป็นเนื้อหาที่น่าสนใจสำหรับนักพัฒนาด้วย

1 ความคิดเห็น

 
GN⁺ 2024-01-04
ความคิดเห็นจาก Hacker News
  • ประสบการณ์ที่น่าประทับใจกับเฟรมเวิร์ก Vision ของ Apple

    • ผู้เขียนโพสต์ต้นฉบับ (OP) ใช้เฟรมเวิร์ก Vision ของ Apple ในโปรเจกต์ส่วนตัวที่นำสกรีนช็อตสเปรดชีตหลายหมื่นภาพมาทำ OCR แล้วนำเข้าไปยังฐานข้อมูล Postgres
    • เนื่องจาก macOS กับ Nvidia ใช้งานร่วมกันไม่ได้ จึงลองใช้วิธี OCR อื่น ๆ บน CPU แต่เครื่องมืออย่าง Tesseract มักให้ผลลัพธ์ที่ผิดพลาด
    • เฟรมเวิร์ก Vision ให้ผลลัพธ์คุณภาพสูงที่สุดเท่าที่เจ้าตัวเคยเห็น และใช้ทรัพยากรประมวลผลน้อยที่สุด
    • มีปัญหาเรื่องความเสถียรของเฟรมเวิร์กอยู่บ้าง แต่ก็อาจเป็นข้อผิดพลาดจากวิธีที่ผู้ใช้ติดตั้งหรือเขียนใช้งานเอง
    • ใช้งานร่วมกันระหว่าง vision.py และ ocrmac ของ RHetTbull และพอใจกับประสิทธิภาพบน Hackintosh i7 6700k
    • แม้จะไม่ใช่โปรแกรมเมอร์ แต่ถ้ามีเวลามากพอก็สามารถแก้ปัญหาได้ เพียงแต่ใช้เวลาค่อนข้างมาก
  • ประสบการณ์คล้ายกันบน Windows และเครื่องมือ OCR ของ Microsoft PowerToys

    • ผู้ใช้อีกรายหนึ่งลองทำงานลักษณะคล้ายกันบน Windows และพบว่า PowerToys ซึ่งเป็นโปรเจกต์ของ Microsoft ที่ติดตั้งไว้แล้ว มีเครื่องมือ OCR ที่ดีมากรวมอยู่ด้วย
    • กด Win+Shift+T แล้วเลือกพื้นที่ที่จะสแกน จากนั้นข้อความจะถูกคัดลอกไปยังคลิปบอร์ด
  • เครื่องมือ OCR โอเพนซอร์สที่ให้ใช้ฟรี

    • มีผู้ใช้คนหนึ่งพัฒนาเครื่องมือ OCR แบบโอเพนซอร์สฟรีที่มีทั้ง CLI และ UI
  • ฟีเจอร์ OCR อัตโนมัติในแอปพลิเคชันบน Mac

    • ผู้ใช้คนหนึ่งพบว่าแอปบน Mac หลายตัว เช่น Safari, Preview และ Notes จะทำ OCR กับภาพโดยอัตโนมัติ ทำให้สามารถเลือกข้อความในภาพแล้วคัดลอกและวางไปที่อื่นได้อย่างง่ายดาย
  • คำชมต่อเครื่องมือ OCR ขนาดเล็กสำหรับ Mac

    • ผู้ใช้คนหนึ่งเป็นแฟนตัวยงของเครื่องมือ OCR ขนาดเล็กที่ติดตั้งบน Macbook ผ่าน brew
  • เครื่องมือ OCR ที่แนะนำสำหรับ Windows: Text Extractor ใน PowerToys

    • ความเห็นที่แนะนำผู้ใช้ Windows ให้ลองใช้ Text Extractor ของ PowerToys
  • ฟังก์ชัน OCR ที่มีมาให้ใน macOS Ventura

    • ตั้งแต่ macOS Ventura ขึ้นไป มีการรวมฟังก์ชัน OCR พื้นฐานไว้ใน UI สำหรับจับภาพแล้ว และเมื่อสแกนเป็น PDF ด้วยสแกนเนอร์ที่รองรับ AirPrint จะมีช่องทำเครื่องหมาย OCR แสดงในแผงด้านขวา
  • โซลูชันดึงข้อความด้วย PyXA

    • PyXA มีโซลูชันสำหรับดึงข้อความจากภาพหนึ่งภาพหรือหลายภาพพร้อมกันโดยใช้เฟรมเวิร์ก Vision
    • เนื่องจากเป็นเพียงส่วนหนึ่งของแพ็กเกจ จึงอาจมากเกินความจำเป็นสำหรับงานครั้งเดียว แต่ก็เป็นอีกตัวเลือกหนึ่ง
  • ความสามารถของ Raycast ในการค้นหาและคัดลอกข้อความในภาพ

    • Raycast มีให้ใช้เฉพาะบน macOS และมีความสามารถในการค้นหาข้อความในภาพรวมถึงคัดลอกข้อความนั้นได้
    • มีการให้ลิงก์วิดีโอเดโมอย่างเป็นทางการ
  • คำถามเกี่ยวกับเทคโนโลยีคล้ายฟีเจอร์ 'Copy Subject' ของ Apple Vision

    • ผู้ใช้คนหนึ่งพึ่งพาฟีเจอร์ 'Copy Subject' ของ Apple Vision อย่างมาก และรู้สึกว่าการเข้าถึงฟีเจอร์นี้มีข้อจำกัดมาก จึงสอบถามถึงเทคโนโลยีที่คล้ายกัน