7 คะแนน โดย xguru 2020-03-02 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เครื่องมือวิเคราะห์และสืบค้นข้อมูลสำหรับงานข่าวสืบสวนที่สร้างโดย OCCRP ซึ่งเชี่ยวชาญด้านการสืบสวนอาชญากรรมองค์กรและการทุจริต

  • ค้นหาข้ามข้อมูลแบบบูรณาการทั้งข้อมูลมีโครงสร้าง (DB) / ไม่มีโครงสร้าง (PDF, XLS, DOC เป็นต้น)

  • มีความสามารถด้านการแบ่งขอบเขตข้อมูลและการจัดการสิทธิ์การเข้าถึง รองรับการแชร์อย่างยืดหยุ่นระหว่างทีมข้ามชาติ

  • ทำการครอว์ลอย่างต่อเนื่องจากแหล่งข้อมูลสาธารณะหลายร้อยแห่ง

  • มีการวิเคราะห์การสืบสวนเชิงภาพ

  • รองรับการนำเข้าข้อมูล

  • เอกสารเกือบทุกประเภทตั้งแต่ HTML/XML, PDF, RTF, Epub ไปจนถึงเอกสารออฟฟิศส่วนใหญ่ (Doc, PPT)

  • ฟอร์แมตตารางอย่าง XLS/CSV รวมถึง DBF, SQLite, Access

  • อีเมลแบบ RFC822 MIME, กล่องจดหมายอย่าง Outlook PST/OLM, Mbox, Vcard

  • Zip, Rar, Tar, 7Zip, Gzip

  • JPEG, PNG, GIF, TIFF, SVG สามารถทำ OCR ด้วย Tesseract 4 หรือ Google Vision API เพื่อดึงข้อความออกมาได้

1 ความคิดเห็น

 
xguru 2020-03-02

OCCRP ซึ่งเป็นผู้สร้าง เป็นองค์กรแบบนี้ครับ

"OCCRP สื่อสืบสวนเชิงลึกที่เชี่ยวชาญด้านอาชญากรรมองค์กรและการทุจริต" https://newstapa.org/article/_DNLi

สามารถลองใช้งานกับข้อมูลจริงได้ที่ https://aleph.occrp.org/

วิดีโอตัวอย่างที่ OpenOil ทำขึ้นอธิบาย Aleph ได้อย่างเข้าใจง่าย

( OpenOil เป็นบริษัทที่สร้างเฟรมเวิร์กข้อมูลแบบเปิดเพื่อจัดการทรัพยากรธรรมชาติทั่วโลก เช่น ก๊าซ น้ำมัน ถ่านหิน เป็นต้น )

https://www.youtube.com/watch?v=bg96HcR_2Jc

เนื่องจากเป็นเครื่องมือที่สร้างโดยองค์กรสืบสวนที่เชี่ยวชาญด้าน "การทุจริต" โมเดลข้อมูลพื้นฐานจึงเป็น "Follow the Money"

มันติดตามได้ดีว่าเงินไหลเวียนระหว่างบริษัทใด / บุคคลใด อย่างไร

ด้วยเหตุนี้ ประเภทเอนทิตีของชุดข้อมูลที่รองรับพื้นฐานจึงมีดังนี้

  • Airplane, Assessment, Asset, Bank Account, Company, Contract, Court case, Customs Declaration, Land, Legal Entity