- คลังข้อมูลโอเพนซอร์ส ที่จัดโครงสร้างข้อมูลจาก CIA World Factbook ตั้งแต่ปี 1990 ถึง 2025 เพื่อให้ค้นหาและวิเคราะห์ได้
- ครอบคลุม 281 ประเทศและดินแดน, ฉบับรายปี 36 ปี, และ ฟิลด์ข้อมูล มากกว่า 1 ล้านรายการ
- มีฟีเจอร์ โปรไฟล์ประเทศ รายปี, ข้อมูลอนุกรมเวลา, การค้นหาแบบข้อความเต็ม, และการวิเคราะห์เครือข่ายด้าน ภูมิศาสตร์·การสื่อสาร·การค้า
- รวมเครื่องมือวิเคราะห์ เช่น แดชบอร์ดตามภูมิภาค COCOM, การเปรียบเทียบตัวชี้วัดระหว่างประเทศ, และ การแสดงภาพแนวโน้มระดับโลก
- อ้างอิงจากข้อมูลสาธารณสมบัติ และเป็น โครงการอิสระที่ไม่เกี่ยวข้องกับ CIA หรือรัฐบาลสหรัฐฯ
ภาพรวม
- คลังข้อมูลที่เก็บรักษาและจัดโครงสร้าง ข้อมูลภูมิรัฐศาสตร์ ตลอด 36 ปี
- อ้างอิงจากข้อมูลที่พาร์สจาก CIA World Factbook ต้นฉบับ
- มี 281 เอนทิตี, 36 ฉบับ, ระเบียนประเทศ-ปี 9,500 รายการ, และฟิลด์ข้อมูล 1,061,341 รายการ
- ข้อมูลทั้งหมด ค้นหาได้ และสามารถติดตามการเปลี่ยนแปลงของรายงานประเทศในแต่ละปีได้
องค์ประกอบของแพลตฟอร์ม
- Factbook Archive / Reference Library
- เปิดดูได้ทุกฉบับตั้งแต่ปี 1990–2025
- แสดงข้อมูลฟิลด์ต้นฉบับตามเดิม และค้นหาการเปลี่ยนแปลงรายปีได้
- Intelligence Analysis / Analytic Workspace
- เวิร์กสเปซการวิเคราะห์ที่จัดตามภูมิภาคของ กองบัญชาการรบของกระทรวงกลาโหมสหรัฐฯ (COCOM)
- มี แผนที่ระบายสี (Choropleth), การเปรียบเทียบอนุกรมเวลา, รายงานวิเคราะห์รายประเทศ (รูปแบบ ICD 203) และ ฟังก์ชันเปรียบเทียบตัวชี้วัด
ฟีเจอร์หลัก
- Library: จัดหมวดหมู่เอนทิตีทั้งหมดตามประเภท พร้อมธงชาติ
- Country Profile: ดูข้อมูลฟิลด์ทั้งหมดของแต่ละประเทศ
- Full-Text Search: ค้นหาคีย์เวิร์ดจากฟิลด์มากกว่า 1 ล้านรายการด้วย ไวยากรณ์ Z39.58
- Field Time Series: ติดตามแนวโน้มของฟิลด์ข้อมูลเฉพาะตลอด 36 ปี
- Factbook Quiz: แบบทดสอบความรู้รอบโลก 4 โหมด
- Factbook Export: สร้างรายงานประเทศสำหรับพิมพ์ที่รวมทุกฟิลด์
เครื่องมือวิเคราะห์ข่าวกรอง
- Regional Dashboard: แผนที่โลกที่แสดงภูมิภาค COCOM และเมืองหลวง
- Timeline Map: แสดงข้อมูลตลอด 36 ปีในรูปแบบภาพเคลื่อนไหว
- Communications Analysis: แสดงตัวชี้วัดการเข้าถึงอินเทอร์เน็ต·มือถือ·บรอดแบนด์
- Map Compare: เปรียบเทียบแผนที่สองปีแบบซิงก์กัน
- COCOM Region Detail: แสดงตัวชี้วัดสำคัญ (KPI) รายภูมิภาค
- Intelligence Dossier: รายงานวิเคราะห์รายประเทศตามเกณฑ์ ICD 203
- Global Rankings: จัดอันดับประเทศตามตัวชี้วัด
- Global Trends: แนวโน้มตัวชี้วัดระดับโลกตลอดทุกฉบับ
- Compare Countries: เปรียบเทียบตัวชี้วัดระหว่างประเทศ
- Field Explorer: สำรวจฟิลด์ข้อมูลทั้งหมดและสถิติความครอบคลุม
- Change Detection: ตรวจจับการเปลี่ยนแปลงของฟิลด์รายปี
- Dissolved States: ข้อมูลประเทศและดินแดนที่ไม่มีอยู่แล้ว
- Trade Networks: กราฟเครือข่ายความสัมพันธ์ทางการค้า
- Organization Networks: กราฟความสัมพันธ์การเป็นสมาชิกองค์กรระหว่างประเทศ
- Query Builder: สร้างคิวรีการวิเคราะห์แบบกำหนดเอง
- Text Diff: เปรียบเทียบข้อความรายปีและไฮไลต์การเปลี่ยนแปลง
ข้อมูลโครงการ
- ข้อมูลทั้งหมดรวบรวมจาก ข้อมูลสาธารณสมบัติของรัฐบาลสหรัฐฯ (CIA World Factbook)
- ไม่เกี่ยวข้องกับ CIA หรือรัฐบาลสหรัฐฯ
- การวิเคราะห์เป็นไปตาม มาตรฐานการวิเคราะห์ ICD 203
- เปิดเผยซอร์สโค้ดและวิธีการผ่าน GitHub repository
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ถ้ารัฐบาลชุดถัดไปนำ ข้อมูลที่เก็บถาวรไว้ นี้มาใช้สร้างกลับขึ้นมาใหม่ได้ก็คงยอดเยี่ยมมาก
มีคนนำโปรเจ็กต์มาโพสต์ แล้วชุมชนก็ช่วยหาบั๊กกันแบบเรียลไทม์ จากนั้นผู้สร้างก็แก้ทันที
ปัญหาการชนกันของรหัสประเทศ FIPS กับ ISO เป็นตัวอย่างที่ดีว่าบั๊ก หายากแบบนี้ จับได้ก็ด้วยสายตาจำนวนมากเท่านั้น
น่าประทับใจที่ผู้สร้างไม่ตั้งการ์ดและตอบสนองต่อฟีดแบ็กอย่างกระตือรือร้น
มีคำอธิบายว่าเป็น “แคชชุดข้อมูลโปรไฟล์ประเทศในรูปแบบต้นฉบับจาก CIA.gov (1:1)”
ดูข้อมูลรายละเอียดได้ที่ cache.factbook.json
แต่ผมคิดว่าสิ่งที่จำเป็นคือการทำข้อมูลปี 1990~2025 ให้อยู่ในรูป ฐานข้อมูล SQL เพื่อให้ query ได้
ชุดข้อมูลนี้เหมาะมากสำหรับการทดสอบความสามารถของ GraphRAG
น่าจะเอาไปทำเกมจำลองโลกที่อิงข้อมูลจริงได้ด้วย
เนื้อหาต้นฉบับที่ CIA เผยแพร่ยังคงเดิมทุกอย่าง และผมแค่เก็บกวาด noise ด้าน formatting ในขั้นตอน parsing เท่านั้น
นอกจากนี้ยังสร้างตาราง lookup สำหรับแม็ประหว่างรหัส FIPS 10-4, ISO Alpha-2/3 และ MasterCountryID เพื่อให้เชื่อมโยงกันได้
ผมมีแผนจะเพิ่มข้อมูลเหล่านี้ลง GitHub ด้วย
ถ้าคลิกหัวข้อ “Germany” ใน Factbook ปี 2002 จะถูกพาไปหน้า “Gambia” ทุกครั้ง
ยังไม่เห็นอาการแบบนี้กับประเทศอื่น
ลิงก์ Amazon
ดูได้จาก หน้าวิเคราะห์แนวโน้ม
ขอบคุณที่แจ้ง!
ตัวอย่าง: ข้อมูลการสมัครใช้งานบรอดแบนด์ประจำที่ของอินเดีย
ตัวอย่างเช่น “18.17 million” ถูกอ่านเป็นแค่ 18.17 ทำให้กราฟดิ่งลงผิดปกติ
ผมเพิ่มการจัดการหน่วยเข้าไปและแก้บั๊กเรียบร้อยแล้ว เพิ่ง deploy ไปเมื่อกี้
ขอบคุณที่แจ้งเข้ามา