-
เครื่องมือวิเคราะห์และสืบค้นข้อมูลสำหรับงานข่าวสืบสวนที่สร้างโดย OCCRP ซึ่งเชี่ยวชาญด้านการสืบสวนอาชญากรรมองค์กรและการทุจริต
-
ค้นหาข้ามข้อมูลแบบบูรณาการทั้งข้อมูลมีโครงสร้าง (DB) / ไม่มีโครงสร้าง (PDF, XLS, DOC เป็นต้น)
-
มีความสามารถด้านการแบ่งขอบเขตข้อมูลและการจัดการสิทธิ์การเข้าถึง รองรับการแชร์อย่างยืดหยุ่นระหว่างทีมข้ามชาติ
-
ทำการครอว์ลอย่างต่อเนื่องจากแหล่งข้อมูลสาธารณะหลายร้อยแห่ง
-
มีการวิเคราะห์การสืบสวนเชิงภาพ
-
รองรับการนำเข้าข้อมูล
-
เอกสารเกือบทุกประเภทตั้งแต่ HTML/XML, PDF, RTF, Epub ไปจนถึงเอกสารออฟฟิศส่วนใหญ่ (Doc, PPT)
-
ฟอร์แมตตารางอย่าง XLS/CSV รวมถึง DBF, SQLite, Access
-
อีเมลแบบ RFC822 MIME, กล่องจดหมายอย่าง Outlook PST/OLM, Mbox, Vcard
-
Zip, Rar, Tar, 7Zip, Gzip
-
JPEG, PNG, GIF, TIFF, SVG สามารถทำ OCR ด้วย Tesseract 4 หรือ Google Vision API เพื่อดึงข้อความออกมาได้
1 ความคิดเห็น
OCCRP ซึ่งเป็นผู้สร้าง เป็นองค์กรแบบนี้ครับ
"OCCRP สื่อสืบสวนเชิงลึกที่เชี่ยวชาญด้านอาชญากรรมองค์กรและการทุจริต" https://newstapa.org/article/_DNLi
สามารถลองใช้งานกับข้อมูลจริงได้ที่ https://aleph.occrp.org/
วิดีโอตัวอย่างที่ OpenOil ทำขึ้นอธิบาย Aleph ได้อย่างเข้าใจง่าย
( OpenOil เป็นบริษัทที่สร้างเฟรมเวิร์กข้อมูลแบบเปิดเพื่อจัดการทรัพยากรธรรมชาติทั่วโลก เช่น ก๊าซ น้ำมัน ถ่านหิน เป็นต้น )
https://www.youtube.com/watch?v=bg96HcR_2Jc
เนื่องจากเป็นเครื่องมือที่สร้างโดยองค์กรสืบสวนที่เชี่ยวชาญด้าน "การทุจริต" โมเดลข้อมูลพื้นฐานจึงเป็น "Follow the Money"
มันติดตามได้ดีว่าเงินไหลเวียนระหว่างบริษัทใด / บุคคลใด อย่างไร
ด้วยเหตุนี้ ประเภทเอนทิตีของชุดข้อมูลที่รองรับพื้นฐานจึงมีดังนี้