ลองนับจำนวน Yurt/Ger ทั้งหมดในมองโกเลียด้วยแมชชีนเลิร์นนิง
(monroeclinton.com)- ดำเนินโครงการเพื่อนับจำนวน Yurt (Ger) ทั่วมองโกเลียโดยตรงด้วย อัลกอริทึมแมชชีนเลิร์นนิง
- ฝึกโมเดล YOLO ให้ระบุ Yurt จากภาพถ่ายดาวเทียมเดี่ยว และทำ data labeling ขนาดใหญ่ แบบอัตโนมัติ
- ใช้ distributed server, Docker Swarm, FastAPI และอื่น ๆ ให้ worker กว่า 120 ตัวประมวลผล image tile แบบขนานและรวมผลลัพธ์
- สุดท้ายตรวจพบ Yurt 172,689 หลัง และผลลัพธ์นี้ช่วยทำความเข้าใจการเติบโตของเมืองในมองโกเลียและ ปัญหาโครงสร้างพื้นฐานด้านที่อยู่อาศัย
- ยังให้มุมมองเกี่ยวกับ เขต Ger ของมองโกเลีย รวมถึงภูมิหลังทางสังคมและความท้าทายด้านการพัฒนา
นับ Yurt ในมองโกเลียด้วยแมชชีนเลิร์นนิง – ภาพรวมโครงการ
ความสงสัยเกี่ยวกับสังคมมองโกเลียยุคปัจจุบัน
- เพื่อทำความเข้าใจประวัติศาสตร์ของจักรวรรดิมองโกลและภาพของมองโกเลียยุคใหม่ ผู้เขียนไม่ได้เริ่มจากการวิเคราะห์ข้อมูล แต่หันไปสำรวจมุมมองดาวเทียมบน Google Maps อย่างจริงจัง
- จากภาพถ่ายดาวเทียมของอูลานบาตอร์ พบ กลุ่ม Yurt ขนาดมหาศาลที่ทอดยาวหลายกิโลเมตร และจึงตัดสินใจลองนับด้วยตัวเองว่ามีอยู่กี่หลังแน่
การเตรียมข้อมูลและการทำลาเบล
- เก็บภาพถ่ายดาวเทียมอัตโนมัติจาก Google Maps รอบอูลานบาตอร์ในรูปแบบ tile (256x256 px)
- นำ tile เข้า Label Studio แล้วทำ bounding box ให้ Yurt ทีละหลังด้วยมือ เพื่อสร้าง annotated data
- เลือกใช้ YOLO11 (ultralytics) เป็นอัลกอริทึมสำหรับ object detection และใช้ annotated dataset สำหรับฝึกโมเดล
การฝึกโมเดลและขยายชุดข้อมูล
- นอกเหนือจากการฝึกโมเดลบนพื้นฐานของ YOLO11 ยังเพิ่มระดับการทำงานอัตโนมัติด้วยวงจร feedback แบบวนซ้ำ labeling → retraining → labeling
- ช่วงแรกข้อมูลยังน้อยทำให้ความแม่นยำต่ำ แต่ด้วย การทำลาเบลเพิ่มแบบต่อเนื่อง และการขยายจำนวนตัวอย่าง อัตราการตรวจจับจึงดีขึ้น
- แทนที่จะฝึกบนโน้ตบุ๊ก ผู้เขียนเช่า GPU จาก vast.ai เพื่อรันงานขนาดใหญ่ในสภาพแวดล้อม Docker container และเมื่อฝึกเสร็จจะอัปโหลดผลลัพธ์ของโมเดลและ metadata ไปยัง S3 โดยอัตโนมัติ
การสร้างระบบค้นหาระดับประเทศ
การเพิ่มประสิทธิภาพขอบเขตการค้นหา
- คำนวณจำนวน tile ของแต่ละระดับซูมโดยอิงจากพื้นที่ทั้งหมดของมองโกเลีย
- เนื่องจากความหนาแน่นประชากรต่ำ จึงใช้ overpass turbo ดึงจุดที่น่าจะมีผู้คนอาศัยอยู่ เพื่อตัดพื้นที่ไร้ผู้อยู่อาศัยออก
- จากนั้นใช้พื้นที่รอบจุดดังกล่าว (buffer 2 กม.) เพื่อลดชุด tile ที่ต้องตรวจจริงลงอย่างมาก
การประมวลผลแบบกระจายขนาดใหญ่
- ใช้ Docker Swarm สร้างคลัสเตอร์จากเซิร์ฟเวอร์ 8 เครื่อง (รวม 128 vCPU)
- แยกบทบาทเป็น API server (FastAPI) และ worker:
- API: จัดการขอบเขตการค้นหาและชุด tile ที่จะมอบหมายให้ worker รวมถึงติดตามความคืบหน้าและสถานะ
- Worker: รับขอบเขตการค้นหาจาก API แล้วใช้โมเดลตรวจหา Yurt ใน tile ก่อนส่งผลกลับไปลงทะเบียนที่ API
การรวมผลลัพธ์
- ประมวลผลขอบเขตการค้นหาราว 270,000 ชุดและภาพหลายล้านภาพแบบขนาน
- สุดท้ายยืนยันได้ Yurt 172,689 หลัง โดยอิงจากผลตรวจจับที่มีความน่าจะเป็นตั้งแต่ 40% ขึ้นไป
- เปิดเผย dataset เพื่อใช้วิเคราะห์การใช้ที่ดิน โรงแรม และการกระจายตัวของ Yurt ใกล้เหมืองขนาดเล็ก เป็นต้น
Yurt กับบริบททางสังคมของมองโกเลีย
ประวัติและความเปลี่ยนแปลงของเขต Ger
- ในอดีต Yurt เป็นรูปแบบที่อยู่อาศัยดั้งเดิมของ ชนเผ่าเร่ร่อนมองโกเลีย แต่เมื่อเกิดความเป็นเมืองและอุตสาหกรรม บทบาทการใช้งานก็เปลี่ยนไปในหลายด้าน
- ช่วงต้นศตวรรษที่ 20 Yurt ยังถูกใช้เพื่อวัตถุประสงค์สาธารณะ เช่น โรงเรียนชั่วคราว และเมื่อประชากรไหลเข้าสู่เมืองใหญ่ ก็เกิด เขต Ger ในพื้นที่อย่างอูลานบาตอร์
"สำมะโนประชากรปี 1979 ระบุว่าประชากร 51% อาศัยอยู่ในเขตเมือง สะท้อนการขยายตัวของความเป็นเมืองอย่างรวดเร็วในทศวรรษ 1970 และเขต Ger ก็ขยายตัวตามชานเมืองจากปัญหาการขาดแคลนที่อยู่อาศัยและโครงสร้างพื้นฐาน"
ความท้าทายด้านความเป็นเมืองและโครงสร้างพื้นฐาน
- ผู้คนที่ย้ายมาจากชนบทนำ Yurt ของตนเข้ามาตั้งถิ่นฐานในเมือง และใช้เป็นที่อยู่อาศัยทั้งที่ยังไม่มีโครงสร้างพื้นฐานอย่างเป็นทางการรองรับ
- การออก กฎหมายเกี่ยวกับกรรมสิทธิ์ที่ดิน ในปี 2002 ทำให้เกิดกระบวนการรับรองสถานะทางกฎหมายของถิ่นฐานในเขต Ger
- แม้รัฐบาลจะผลักดันนโยบายพัฒนาใหม่ เช่น Ulaanbaatar 2020 Master Plan แต่ความคืบหน้าในทางปฏิบัติยังค่อนข้างช้า
"เจ้าของที่ดินในเขต Ger อาจขายหรือแลกเปลี่ยนที่ดินกับผู้พัฒนาเพื่อสร้างอพาร์ตเมนต์ใหม่ แต่บ่อยครั้งมูลค่าอพาร์ตเมนต์ต่ำกว่ามูลค่าที่ดิน หรือการพัฒนาดำเนินไปอย่างล่าช้า"
นัยสำคัญและมุมมองในอนาคต
- สะท้อนว่าการทำให้เขต Ger เข้าสู่ระบบอย่างเป็นทางการและการจัดหาโครงสร้างพื้นฐานยังคงเป็นโจทย์ทางสังคมและนโยบาย
- เป้าหมายระยะยาวของรัฐบาลมองโกเลียคือการขยาย ที่อยู่อาศัย น้ำประปา ไฟฟ้า และโครงสร้างพื้นฐานเมือง ไปยังเขต Ger
- จำเป็นต้องมีการกำหนดนโยบายบนฐานข้อมูลและการติดตามอย่างต่อเนื่อง
คำถามสำหรับการสำรวจเพิ่มเติม
- ปัจจัยหลักที่ทำให้เกิดความเป็นเมืองและอุตสาหกรรมในมองโกเลียและประเทศอื่น ๆ
- ความแตกต่างระหว่างชาวมองโกเลียที่เลือกตั้งถิ่นฐานในเมืองกับผู้ที่ยังคงอยู่ที่เดิม
- อุปสรรคที่ภาครัฐเผชิญในการพัฒนาเขต Ger
- ปัจจัยเบื้องหลังความแตกต่างของความเร็วในการพัฒนาระหว่างประเทศ
เอกสารอ้างอิง
- อ้างอิงงานวิจัย รายงาน และฐานข้อมูลด้านนโยบาย สังคมวิทยา และโครงสร้างพื้นฐานที่สำคัญ
- “Distributional Effects of Ger Area Redevelopment in Ulaanbaatar, Mongolia.”
- Ulaanbaatar 2020 Master Plan and Development Approach for 2030.
- “Educational Import: Local Encounters with Global Forces in Mongolia.”
- Mongolia: A Country Study. Federal Research Division, Library of Congress.
- Poverty Mapping in Mongolia with AI-Based Ger Detection Reveals Urban Slums Persist after the COVID-19 Pandemic. arXiv.
สรุป
- ใช้เทคโนโลยีและข้อมูลเพื่อสำรวจปัญหาสังคม พร้อมนำเสนอมุมมองใหม่ต่อ ภูมิหลังทางสังคมและรูปแบบการอยู่อาศัย
- เป็นกรณีตัวอย่างของการประยุกต์ใช้เทคนิคและเครื่องมือโอเพนซอร์สหลายชนิดร่วมกันอย่างเป็นรูปธรรม เช่น แมชชีนเลิร์นนิง, Docker, FastAPI
1 ความคิดเห็น
ความเห็นจาก Hacker News
เมื่อพูดถึงย่านเกอร์/ยูร์ตในเมือง ก็ควรระวังอย่ามองข้ามความสำคัญทางวัฒนธรรมของวิถีเร่ร่อนและวัฒนธรรมเกอร์ ช่วงหลังจากการเปลี่ยนแปลงสภาพภูมิอากาศ (การกลายเป็นทะเลทราย) และเหตุผลทางเศรษฐกิจ ผู้คนจำนวนมากจำใจต้องเลิกใช้ชีวิตแบบเร่ร่อนและย้ายมาอยู่ใกล้เมืองอย่างอูลานบาตอร์ ซึ่งหลายคนมักคิดว่าเป็นเพียงชั่วคราวและเข้ามาอยู่เมืองอย่างไม่เต็มใจ ไม่ใช่แค่ปัญหาขาดแคลนที่อยู่อาศัยเท่านั้น แต่ยังมีมิติทางจิตใจที่ไม่อยากย้ายเข้าอพาร์ตเมนต์หรือสิ่งปลูกสร้างถาวร เพราะมันเหมือนเป็นสัญลักษณ์ว่าพวกเขาได้ละทิ้งวิถีเร่ร่อนอย่างสิ้นเชิง จึงมักเห็นการตั้งเกอร์ไว้ข้างอาคารถาวร เพิ่มเกอร์ในลานบ้านญาติ หรือขยายใช้เป็นวิธีรักษาอัตลักษณ์ทางวัฒนธรรม ซึ่งเห็นได้จากภาพแรก ๆ
หลายปีก่อนตอนขี่มอเตอร์ไซค์ข้ามมองโกเลีย มีเรื่องที่ทำให้ประหลาดใจคือ แม้บ้านถาวรจะดีแค่ไหน ก็แทบจะต้องมีเกอร์อยู่ในสวนหลังบ้านเสมอ จากมุมมองคนนอกก็สงสัยว่าทำไมต้องมีบ้านหลังที่สอง แต่พอถามคนท้องถิ่นกลับเจอสายตาเหมือนคำถามนี้แปลกมาก เกอร์ฝังลึกอยู่ในวัฒนธรรม เป็นทั้งสัญลักษณ์สถานะ พื้นที่รับรองแขก พื้นที่ใช้ชีวิตกลางแจ้ง และใช้งานได้หลากหลาย
อยากเล่าประสบการณ์จากพระราชวังในคีวา ประเทศอุซเบกิสถาน ซึ่งชัดเจนว่าเป็นพระราชวังแบบดั้งเดิมที่มีทางเข้าและห้องหรูหรามากมาย แต่ตรงมุมหนึ่งของลานชั้นในที่ล้อมกำแพงมิดชิดกลับมีพื้นที่วงกลมเฉพาะสำหรับตั้งเกอร์อยู่ด้วย ข่านในภูมิภาคนี้ก็มักอวดสายเลือดเจงกีสข่าน และมีค่านิยมว่าถึงจะอาศัยในเมือง ก็ไม่สมศักดิ์ศรีข่านนักหากต้องค้างคืนใต้หลังคาถาวร อีกทั้งญาติที่มาเยือนก็มักไม่ค่อยชอบเห็นภาพแบบนั้น
วิกิ Toshhovli Palace
[ภาพพื้นที่วงกลมในลานรับรอง](https://en.wikipedia.org/wiki/Toshhovli_Palace#/media/File:KhivaTach_Khaouli_reception_yard_Iwan.JPG)
มองโกเลียเพิ่งเผชิญฤดูหนาวที่โหดร้ายหลายครั้งจนเกิดการอพยพครั้งใหญ่จากทุ่งหญ้า จำนวนฝูงปศุสัตว์ลดลงมาก ทำให้คนส่วนใหญ่หลั่งไหลเข้าสู่เมือง และแม้อยากย้ายเข้าอาคารถาวร ก็ยังไม่มีที่เพียงพอให้เข้าอยู่
เท่าที่ได้ยินมา หลายคนน่าจะมีเกอร์อย่างน้อยหนึ่งหลังอยู่แล้ว และย้ายได้ค่อนข้างง่ายเมื่อจำเป็น เช่น เคยได้ยินว่าถ้ามีงานพิเศษก็อาจย้ายกลับไปบ้านชนบทอีกครั้ง
มองว่าการใช้ชีวิตในเกอร์ไม่จำเป็นต้องถูกตีความว่าเป็นความล้มเหลวของนโยบายสาธารณะเสมอไป แต่อาจเป็นเพียงทางเลือกทางวัฒนธรรมมากกว่า ในอดีตเจงกีสข่านก็อาศัยในเกอร์ และในความเป็นจริง บางคนอยู่เพราะความจำเป็น ขณะที่บางคนเลือกเอง ดังนั้นจึงยากจะตัดสินว่าภาพเช่นนี้เป็นเรื่องลบโดยตัวมันเอง
ในอูลานบาตอร์มีเกอร์แบบมาตรฐานอยู่ สามารถหาซื้อชิ้นส่วนหรือเกอร์สำเร็จรูปได้ง่ายในตลาดขนาดใหญ่ ณ ปี 2017 ราคาประมาณหลังละ 1,000 ดอลลาร์ ด้วยเงินเท่านี้ก็ได้บ้านหลังเล็กที่กันความหนาวได้ดีและเคลื่อนย้ายง่าย และในมองโกเลียก็สามารถไปตั้งถิ่นฐานนอกเขตเมืองได้แทบทุกที่ (แต่ถ้ามีแกะ 2,000 ตัวมาด้วย ก็ควรคุยกับคนท้องถิ่นเรื่องสิทธิใช้ทุ่งหญ้าก่อน) สุดท้ายแล้วการเลือกเกอร์จึงไม่ใช่แค่เรื่องประเพณีและวัฒนธรรม แต่ยังเป็นการตัดสินใจที่สมเหตุสมผลในบริบทนั้นด้วย
เพิ่มเติมแบบขำ ๆ ว่าตามมารยาทควรเรียกเต็นท์บ้านแบบตุรกีว่า yurt และแบบมองโกเลียว่า ger แล้วก็แซวว่าที่ฝรั่งเศสเรียก chabadou ที่แคนาดาเรียก plumbus และที่อเมริกาเรียก plip ถ้ามีคนท้องถิ่นมาเรียก chabadou ของตัวเองว่า ger ก็อดหงุดหงิดนิด ๆ ไม่ได้
สงสัยว่าปกติแล้วต้องทำฐานรากแบบไหนเพื่อวางเกอร์
มีคนพูดว่าจำนวนยูร์ตที่นำ machine learning มาใช้ในมองโกเลียมีอยู่ 0 หลัง
รู้สึกว่าไม่น่าใช่ และเดาว่าน่าจะมีอยู่พอสมควรด้วยซ้ำ
ตอนแรกนึกว่า yurt เป็นอาชีพหรือประเภทของคน เลยเข้าใจหัวข้อผิดไป
ขอบคุณสำหรับความขำ อ่านแล้วได้หัวเราะดี
ในฐานะคนที่ไม่ใช่เจ้าของภาษา กำลังคิดว่าประโยคที่ถูกต้องกว่านี้ควรเป็นแบบไหน เช่น “เราได้นับยูร์ตทั้งหมดในมองโกเลียด้วย machine learning”
น่าเสียดายที่ไม่ได้ใช้ยูร์ต 89,259 หลังที่มีการวาดเส้นขอบไว้แล้วใน OpenStreetMap (OSM) เป็นข้อมูลนำเข้า แต่ก็น่าจะมีปัญหาในการจัดแนวเส้นขอบกับภาพ Google Maps
สถิติแท็ก ger ใน OSM ของมองโกเลีย
คาดว่าโมเดลน่าจะตรวจจับยูร์ตที่อยู่ตรงขอบ tile ได้ไม่ค่อยดี และก็รู้สึกแปลกใจที่จำนวนนี้น้อยกว่าที่คาดเมื่อเทียบกับประชากร 3 ล้านคน
สำหรับประเด็นที่ว่า “จำนวนเกอร์น้อยเมื่อเทียบกับประชากร 3 ล้านคน” ถ้าผลนับจริงคือ 172,700 หลัง สมมติว่าแต่ละหลังเป็นที่อยู่อาศัยของครอบครัว และมีคนอยู่หลังละ 4 คน (ซึ่งความจริงอาจมากกว่านั้น) ก็จะได้ราว 690,000 คน หรือประมาณ 20% ของประชากรมองโกเลีย 3.5 ล้านคน ซึ่งดูสมเหตุสมผลทีเดียว
แชร์ตัวเลขที่เคยเดาคร่าว ๆ ก่อนกดลิงก์ด้วย โดยจากประชากรมองโกเลีย 3 ล้านคน มี 1.5 ล้านคนอยู่ในเมืองหลวง สมมติว่าอีกประมาณ 1 ล้านคนอยู่นอกเขตเมือง และคิดที่ 1 เกอร์ต่อ 4 คน ก็จะได้ 250,000 หลัง พอรวมเกอร์สำหรับรับแขก เก็บของ หรือที่ตั้งในลานบ้านเพื่อใช้ประกอบอื่น ๆ ก็น่าจะราว 300,000 หลัง ซึ่งเกือบสองเท่าของผลจากแอป ML
แนวคิดใช้ OSM หรือแหล่งคล้ายกันเป็น label นั้นถูกพูดถึงบ่อยในโปรเจ็กต์ด้านภูมิสารสนเทศ/แมชชีนเลิร์นนิง แต่ OSM ถูกจำกัดโดยไลเซนส์ไม่ให้ใช้ภาพจาก Google Maps จึงมีปัญหาทางกฎหมายมากมายเรื่องการจัดหาภาพหรือเผยแพร่ต่อ แม้จะใช้เพื่อการวิจัยก็ตาม Google ทำสัญญารับสิทธิช่วงจากแหล่งภาพภายนอกหลายแห่งและจัดการ IP อย่างเข้มงวด ปัญหาการจัดแนวระหว่างภาพกับ label ก็ใหญ่ และตัว label เองอาจเป็นพิกัด GPS ไม่ใช่ตัวภาพโดยตรง อีกทั้งสิ่งปลูกสร้างเคลื่อนย้ายได้อย่างเกอร์ย่อมทำให้ความครบถ้วนและความสอดคล้องของ label ต่ำลงโดยหลีกเลี่ยงไม่ได้ ความสมบูรณ์ของ OSM ยังขึ้นกับความเคลื่อนไหวของชุมชนในแต่ละพื้นที่มากด้วย ถึงอย่างนั้นก็ยังใช้ตรวจสอบไขว้ระหว่าง label ภายในกับค่าทำนายได้ สำหรับการตรวจจับระดับ tile มักจะทิ้งผลทำนายตรงขอบ และใช้ overlap window กับ NMS จัดการผลซ้ำ
172,000 กว่าหลังยังถือว่าเป็นจำนวนมหาศาลอยู่ดี และย้ำว่าหากเทียบจำนวนเกอร์ต่อประชากรแล้ว ก็น่าจะสูงกว่าที่ไหนในโลกอย่างชัดเจน
อยากย้ำว่าการดาวน์โหลดภาพดาวเทียมจาก Google Maps โดยตรงนั้นผิดข้อกำหนดการใช้งาน และในทางปฏิบัติก็มักถูกบล็อกง่ายมาก จึงแปลกใจที่มีคนดาวน์โหลด tile ครอบคลุมทั้งมองโกเลียได้
ถ้าไม่นับเรื่องการผูกขาดตลาด ก็ไม่เข้าใจเหตุผลของนโยบายแบบนี้เลย
ถ้าโดนบล็อกก็แค่สร้างบัญชีใหม่ก็ได้
ผลลัพธ์น่าสนใจมาก เลยสงสัยว่าอัตรา false positive จริง ๆ อยู่ที่เท่าไร เช่น ถังเก็บของ ไซโล หรือสระว่ายน้ำกลางแจ้ง ถูกจัดประเภทผิดเป็นเกอร์บ้างหรือไม่
เป็นเรื่องราวแนว Geo/ML ที่เคยเจอสมัยมหาวิทยาลัย เลยดีใจมากที่ได้เห็นอีกครั้ง รัฐบาลออสเตรเลียก็ทุ่มเงินก้อนโตทุกปีทำงานคล้ายกัน แต่เมื่อเทียบกับผลของผู้เขียนแล้ว กลับยิ่งรู้สึกว่ารัฐบาลของเราทำงานได้ไม่มีประสิทธิภาพกว่ามาก น่าหงุดหงิดที่ยังจัดประเภทที่ดินพื้นฐานไม่ได้ และแม้แต่การนับวัตถุเล็ก ๆ รูปเกอร์ก็ยังทำได้ไม่ดี
จากผลที่ว่า “ตรวจพบเกอร์ทั้งหมด 172,689 หลังที่มี prediction score มากกว่า 40%” ก็สงสัยว่าควรตีความคำว่า prediction score อย่างไร
ตอนแรกเข้าใจชื่อเรื่องผิด คิดว่าหมายถึงยูร์ตทุกหลังในมองโกเลียกำลัง “ใช้” machine learning
ผู้เขียนบอกว่าใช้โซลูชันกึ่งเชิงพาณิชย์ (ใช้ฟรีเพื่อการศึกษา) และก็อยากรู้ว่า topology/architecture ของโมเดลดีปเลิร์นนิงเป็นแบบไหน รวมถึงสงสัยว่ายังมีแนวทางที่ดีกว่านี้หรือไม่