6 คะแนน โดย GN⁺ 2025-06-20 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ดำเนินโครงการเพื่อนับจำนวน Yurt (Ger) ทั่วมองโกเลียโดยตรงด้วย อัลกอริทึมแมชชีนเลิร์นนิง
  • ฝึกโมเดล YOLO ให้ระบุ Yurt จากภาพถ่ายดาวเทียมเดี่ยว และทำ data labeling ขนาดใหญ่ แบบอัตโนมัติ
  • ใช้ distributed server, Docker Swarm, FastAPI และอื่น ๆ ให้ worker กว่า 120 ตัวประมวลผล image tile แบบขนานและรวมผลลัพธ์
  • สุดท้ายตรวจพบ Yurt 172,689 หลัง และผลลัพธ์นี้ช่วยทำความเข้าใจการเติบโตของเมืองในมองโกเลียและ ปัญหาโครงสร้างพื้นฐานด้านที่อยู่อาศัย
  • ยังให้มุมมองเกี่ยวกับ เขต Ger ของมองโกเลีย รวมถึงภูมิหลังทางสังคมและความท้าทายด้านการพัฒนา

นับ Yurt ในมองโกเลียด้วยแมชชีนเลิร์นนิง – ภาพรวมโครงการ

ความสงสัยเกี่ยวกับสังคมมองโกเลียยุคปัจจุบัน

  • เพื่อทำความเข้าใจประวัติศาสตร์ของจักรวรรดิมองโกลและภาพของมองโกเลียยุคใหม่ ผู้เขียนไม่ได้เริ่มจากการวิเคราะห์ข้อมูล แต่หันไปสำรวจมุมมองดาวเทียมบน Google Maps อย่างจริงจัง
  • จากภาพถ่ายดาวเทียมของอูลานบาตอร์ พบ กลุ่ม Yurt ขนาดมหาศาลที่ทอดยาวหลายกิโลเมตร และจึงตัดสินใจลองนับด้วยตัวเองว่ามีอยู่กี่หลังแน่

การเตรียมข้อมูลและการทำลาเบล

  • เก็บภาพถ่ายดาวเทียมอัตโนมัติจาก Google Maps รอบอูลานบาตอร์ในรูปแบบ tile (256x256 px)
  • นำ tile เข้า Label Studio แล้วทำ bounding box ให้ Yurt ทีละหลังด้วยมือ เพื่อสร้าง annotated data
  • เลือกใช้ YOLO11 (ultralytics) เป็นอัลกอริทึมสำหรับ object detection และใช้ annotated dataset สำหรับฝึกโมเดล

การฝึกโมเดลและขยายชุดข้อมูล

  • นอกเหนือจากการฝึกโมเดลบนพื้นฐานของ YOLO11 ยังเพิ่มระดับการทำงานอัตโนมัติด้วยวงจร feedback แบบวนซ้ำ labeling → retraining → labeling
  • ช่วงแรกข้อมูลยังน้อยทำให้ความแม่นยำต่ำ แต่ด้วย การทำลาเบลเพิ่มแบบต่อเนื่อง และการขยายจำนวนตัวอย่าง อัตราการตรวจจับจึงดีขึ้น
  • แทนที่จะฝึกบนโน้ตบุ๊ก ผู้เขียนเช่า GPU จาก vast.ai เพื่อรันงานขนาดใหญ่ในสภาพแวดล้อม Docker container และเมื่อฝึกเสร็จจะอัปโหลดผลลัพธ์ของโมเดลและ metadata ไปยัง S3 โดยอัตโนมัติ

การสร้างระบบค้นหาระดับประเทศ

การเพิ่มประสิทธิภาพขอบเขตการค้นหา

  • คำนวณจำนวน tile ของแต่ละระดับซูมโดยอิงจากพื้นที่ทั้งหมดของมองโกเลีย
    • เนื่องจากความหนาแน่นประชากรต่ำ จึงใช้ overpass turbo ดึงจุดที่น่าจะมีผู้คนอาศัยอยู่ เพื่อตัดพื้นที่ไร้ผู้อยู่อาศัยออก
    • จากนั้นใช้พื้นที่รอบจุดดังกล่าว (buffer 2 กม.) เพื่อลดชุด tile ที่ต้องตรวจจริงลงอย่างมาก

การประมวลผลแบบกระจายขนาดใหญ่

  • ใช้ Docker Swarm สร้างคลัสเตอร์จากเซิร์ฟเวอร์ 8 เครื่อง (รวม 128 vCPU)
  • แยกบทบาทเป็น API server (FastAPI) และ worker:
    • API: จัดการขอบเขตการค้นหาและชุด tile ที่จะมอบหมายให้ worker รวมถึงติดตามความคืบหน้าและสถานะ
    • Worker: รับขอบเขตการค้นหาจาก API แล้วใช้โมเดลตรวจหา Yurt ใน tile ก่อนส่งผลกลับไปลงทะเบียนที่ API

การรวมผลลัพธ์

  • ประมวลผลขอบเขตการค้นหาราว 270,000 ชุดและภาพหลายล้านภาพแบบขนาน
  • สุดท้ายยืนยันได้ Yurt 172,689 หลัง โดยอิงจากผลตรวจจับที่มีความน่าจะเป็นตั้งแต่ 40% ขึ้นไป
  • เปิดเผย dataset เพื่อใช้วิเคราะห์การใช้ที่ดิน โรงแรม และการกระจายตัวของ Yurt ใกล้เหมืองขนาดเล็ก เป็นต้น

Yurt กับบริบททางสังคมของมองโกเลีย

ประวัติและความเปลี่ยนแปลงของเขต Ger

  • ในอดีต Yurt เป็นรูปแบบที่อยู่อาศัยดั้งเดิมของ ชนเผ่าเร่ร่อนมองโกเลีย แต่เมื่อเกิดความเป็นเมืองและอุตสาหกรรม บทบาทการใช้งานก็เปลี่ยนไปในหลายด้าน
  • ช่วงต้นศตวรรษที่ 20 Yurt ยังถูกใช้เพื่อวัตถุประสงค์สาธารณะ เช่น โรงเรียนชั่วคราว และเมื่อประชากรไหลเข้าสู่เมืองใหญ่ ก็เกิด เขต Ger ในพื้นที่อย่างอูลานบาตอร์

"สำมะโนประชากรปี 1979 ระบุว่าประชากร 51% อาศัยอยู่ในเขตเมือง สะท้อนการขยายตัวของความเป็นเมืองอย่างรวดเร็วในทศวรรษ 1970 และเขต Ger ก็ขยายตัวตามชานเมืองจากปัญหาการขาดแคลนที่อยู่อาศัยและโครงสร้างพื้นฐาน"

ความท้าทายด้านความเป็นเมืองและโครงสร้างพื้นฐาน

  • ผู้คนที่ย้ายมาจากชนบทนำ Yurt ของตนเข้ามาตั้งถิ่นฐานในเมือง และใช้เป็นที่อยู่อาศัยทั้งที่ยังไม่มีโครงสร้างพื้นฐานอย่างเป็นทางการรองรับ
  • การออก กฎหมายเกี่ยวกับกรรมสิทธิ์ที่ดิน ในปี 2002 ทำให้เกิดกระบวนการรับรองสถานะทางกฎหมายของถิ่นฐานในเขต Ger
  • แม้รัฐบาลจะผลักดันนโยบายพัฒนาใหม่ เช่น Ulaanbaatar 2020 Master Plan แต่ความคืบหน้าในทางปฏิบัติยังค่อนข้างช้า

"เจ้าของที่ดินในเขต Ger อาจขายหรือแลกเปลี่ยนที่ดินกับผู้พัฒนาเพื่อสร้างอพาร์ตเมนต์ใหม่ แต่บ่อยครั้งมูลค่าอพาร์ตเมนต์ต่ำกว่ามูลค่าที่ดิน หรือการพัฒนาดำเนินไปอย่างล่าช้า"

นัยสำคัญและมุมมองในอนาคต

  • สะท้อนว่าการทำให้เขต Ger เข้าสู่ระบบอย่างเป็นทางการและการจัดหาโครงสร้างพื้นฐานยังคงเป็นโจทย์ทางสังคมและนโยบาย
  • เป้าหมายระยะยาวของรัฐบาลมองโกเลียคือการขยาย ที่อยู่อาศัย น้ำประปา ไฟฟ้า และโครงสร้างพื้นฐานเมือง ไปยังเขต Ger
  • จำเป็นต้องมีการกำหนดนโยบายบนฐานข้อมูลและการติดตามอย่างต่อเนื่อง

คำถามสำหรับการสำรวจเพิ่มเติม

  • ปัจจัยหลักที่ทำให้เกิดความเป็นเมืองและอุตสาหกรรมในมองโกเลียและประเทศอื่น ๆ
  • ความแตกต่างระหว่างชาวมองโกเลียที่เลือกตั้งถิ่นฐานในเมืองกับผู้ที่ยังคงอยู่ที่เดิม
  • อุปสรรคที่ภาครัฐเผชิญในการพัฒนาเขต Ger
  • ปัจจัยเบื้องหลังความแตกต่างของความเร็วในการพัฒนาระหว่างประเทศ

เอกสารอ้างอิง

  • อ้างอิงงานวิจัย รายงาน และฐานข้อมูลด้านนโยบาย สังคมวิทยา และโครงสร้างพื้นฐานที่สำคัญ
    • “Distributional Effects of Ger Area Redevelopment in Ulaanbaatar, Mongolia.”
    • Ulaanbaatar 2020 Master Plan and Development Approach for 2030.
    • “Educational Import: Local Encounters with Global Forces in Mongolia.”
    • Mongolia: A Country Study. Federal Research Division, Library of Congress.
    • Poverty Mapping in Mongolia with AI-Based Ger Detection Reveals Urban Slums Persist after the COVID-19 Pandemic. arXiv.

สรุป

  • ใช้เทคโนโลยีและข้อมูลเพื่อสำรวจปัญหาสังคม พร้อมนำเสนอมุมมองใหม่ต่อ ภูมิหลังทางสังคมและรูปแบบการอยู่อาศัย
  • เป็นกรณีตัวอย่างของการประยุกต์ใช้เทคนิคและเครื่องมือโอเพนซอร์สหลายชนิดร่วมกันอย่างเป็นรูปธรรม เช่น แมชชีนเลิร์นนิง, Docker, FastAPI

1 ความคิดเห็น

 
GN⁺ 2025-06-20
ความเห็นจาก Hacker News
  • เมื่อพูดถึงย่านเกอร์/ยูร์ตในเมือง ก็ควรระวังอย่ามองข้ามความสำคัญทางวัฒนธรรมของวิถีเร่ร่อนและวัฒนธรรมเกอร์ ช่วงหลังจากการเปลี่ยนแปลงสภาพภูมิอากาศ (การกลายเป็นทะเลทราย) และเหตุผลทางเศรษฐกิจ ผู้คนจำนวนมากจำใจต้องเลิกใช้ชีวิตแบบเร่ร่อนและย้ายมาอยู่ใกล้เมืองอย่างอูลานบาตอร์ ซึ่งหลายคนมักคิดว่าเป็นเพียงชั่วคราวและเข้ามาอยู่เมืองอย่างไม่เต็มใจ ไม่ใช่แค่ปัญหาขาดแคลนที่อยู่อาศัยเท่านั้น แต่ยังมีมิติทางจิตใจที่ไม่อยากย้ายเข้าอพาร์ตเมนต์หรือสิ่งปลูกสร้างถาวร เพราะมันเหมือนเป็นสัญลักษณ์ว่าพวกเขาได้ละทิ้งวิถีเร่ร่อนอย่างสิ้นเชิง จึงมักเห็นการตั้งเกอร์ไว้ข้างอาคารถาวร เพิ่มเกอร์ในลานบ้านญาติ หรือขยายใช้เป็นวิธีรักษาอัตลักษณ์ทางวัฒนธรรม ซึ่งเห็นได้จากภาพแรก ๆ

    • หลายปีก่อนตอนขี่มอเตอร์ไซค์ข้ามมองโกเลีย มีเรื่องที่ทำให้ประหลาดใจคือ แม้บ้านถาวรจะดีแค่ไหน ก็แทบจะต้องมีเกอร์อยู่ในสวนหลังบ้านเสมอ จากมุมมองคนนอกก็สงสัยว่าทำไมต้องมีบ้านหลังที่สอง แต่พอถามคนท้องถิ่นกลับเจอสายตาเหมือนคำถามนี้แปลกมาก เกอร์ฝังลึกอยู่ในวัฒนธรรม เป็นทั้งสัญลักษณ์สถานะ พื้นที่รับรองแขก พื้นที่ใช้ชีวิตกลางแจ้ง และใช้งานได้หลากหลาย

    • อยากเล่าประสบการณ์จากพระราชวังในคีวา ประเทศอุซเบกิสถาน ซึ่งชัดเจนว่าเป็นพระราชวังแบบดั้งเดิมที่มีทางเข้าและห้องหรูหรามากมาย แต่ตรงมุมหนึ่งของลานชั้นในที่ล้อมกำแพงมิดชิดกลับมีพื้นที่วงกลมเฉพาะสำหรับตั้งเกอร์อยู่ด้วย ข่านในภูมิภาคนี้ก็มักอวดสายเลือดเจงกีสข่าน และมีค่านิยมว่าถึงจะอาศัยในเมือง ก็ไม่สมศักดิ์ศรีข่านนักหากต้องค้างคืนใต้หลังคาถาวร อีกทั้งญาติที่มาเยือนก็มักไม่ค่อยชอบเห็นภาพแบบนั้น
      วิกิ Toshhovli Palace
      [ภาพพื้นที่วงกลมในลานรับรอง](https://en.wikipedia.org/wiki/Toshhovli_Palace#/media/File:KhivaTach_Khaouli_reception_yard_Iwan.JPG)

    • มองโกเลียเพิ่งเผชิญฤดูหนาวที่โหดร้ายหลายครั้งจนเกิดการอพยพครั้งใหญ่จากทุ่งหญ้า จำนวนฝูงปศุสัตว์ลดลงมาก ทำให้คนส่วนใหญ่หลั่งไหลเข้าสู่เมือง และแม้อยากย้ายเข้าอาคารถาวร ก็ยังไม่มีที่เพียงพอให้เข้าอยู่

    • เท่าที่ได้ยินมา หลายคนน่าจะมีเกอร์อย่างน้อยหนึ่งหลังอยู่แล้ว และย้ายได้ค่อนข้างง่ายเมื่อจำเป็น เช่น เคยได้ยินว่าถ้ามีงานพิเศษก็อาจย้ายกลับไปบ้านชนบทอีกครั้ง

    • มองว่าการใช้ชีวิตในเกอร์ไม่จำเป็นต้องถูกตีความว่าเป็นความล้มเหลวของนโยบายสาธารณะเสมอไป แต่อาจเป็นเพียงทางเลือกทางวัฒนธรรมมากกว่า ในอดีตเจงกีสข่านก็อาศัยในเกอร์ และในความเป็นจริง บางคนอยู่เพราะความจำเป็น ขณะที่บางคนเลือกเอง ดังนั้นจึงยากจะตัดสินว่าภาพเช่นนี้เป็นเรื่องลบโดยตัวมันเอง

  • ในอูลานบาตอร์มีเกอร์แบบมาตรฐานอยู่ สามารถหาซื้อชิ้นส่วนหรือเกอร์สำเร็จรูปได้ง่ายในตลาดขนาดใหญ่ ณ ปี 2017 ราคาประมาณหลังละ 1,000 ดอลลาร์ ด้วยเงินเท่านี้ก็ได้บ้านหลังเล็กที่กันความหนาวได้ดีและเคลื่อนย้ายง่าย และในมองโกเลียก็สามารถไปตั้งถิ่นฐานนอกเขตเมืองได้แทบทุกที่ (แต่ถ้ามีแกะ 2,000 ตัวมาด้วย ก็ควรคุยกับคนท้องถิ่นเรื่องสิทธิใช้ทุ่งหญ้าก่อน) สุดท้ายแล้วการเลือกเกอร์จึงไม่ใช่แค่เรื่องประเพณีและวัฒนธรรม แต่ยังเป็นการตัดสินใจที่สมเหตุสมผลในบริบทนั้นด้วย

    • เพิ่มเติมแบบขำ ๆ ว่าตามมารยาทควรเรียกเต็นท์บ้านแบบตุรกีว่า yurt และแบบมองโกเลียว่า ger แล้วก็แซวว่าที่ฝรั่งเศสเรียก chabadou ที่แคนาดาเรียก plumbus และที่อเมริกาเรียก plip ถ้ามีคนท้องถิ่นมาเรียก chabadou ของตัวเองว่า ger ก็อดหงุดหงิดนิด ๆ ไม่ได้

    • สงสัยว่าปกติแล้วต้องทำฐานรากแบบไหนเพื่อวางเกอร์

  • มีคนพูดว่าจำนวนยูร์ตที่นำ machine learning มาใช้ในมองโกเลียมีอยู่ 0 หลัง

    • รู้สึกว่าไม่น่าใช่ และเดาว่าน่าจะมีอยู่พอสมควรด้วยซ้ำ

    • ตอนแรกนึกว่า yurt เป็นอาชีพหรือประเภทของคน เลยเข้าใจหัวข้อผิดไป

    • ขอบคุณสำหรับความขำ อ่านแล้วได้หัวเราะดี

    • ในฐานะคนที่ไม่ใช่เจ้าของภาษา กำลังคิดว่าประโยคที่ถูกต้องกว่านี้ควรเป็นแบบไหน เช่น “เราได้นับยูร์ตทั้งหมดในมองโกเลียด้วย machine learning”

  • น่าเสียดายที่ไม่ได้ใช้ยูร์ต 89,259 หลังที่มีการวาดเส้นขอบไว้แล้วใน OpenStreetMap (OSM) เป็นข้อมูลนำเข้า แต่ก็น่าจะมีปัญหาในการจัดแนวเส้นขอบกับภาพ Google Maps
    สถิติแท็ก ger ใน OSM ของมองโกเลีย
    คาดว่าโมเดลน่าจะตรวจจับยูร์ตที่อยู่ตรงขอบ tile ได้ไม่ค่อยดี และก็รู้สึกแปลกใจที่จำนวนนี้น้อยกว่าที่คาดเมื่อเทียบกับประชากร 3 ล้านคน

    • สำหรับประเด็นที่ว่า “จำนวนเกอร์น้อยเมื่อเทียบกับประชากร 3 ล้านคน” ถ้าผลนับจริงคือ 172,700 หลัง สมมติว่าแต่ละหลังเป็นที่อยู่อาศัยของครอบครัว และมีคนอยู่หลังละ 4 คน (ซึ่งความจริงอาจมากกว่านั้น) ก็จะได้ราว 690,000 คน หรือประมาณ 20% ของประชากรมองโกเลีย 3.5 ล้านคน ซึ่งดูสมเหตุสมผลทีเดียว

    • แชร์ตัวเลขที่เคยเดาคร่าว ๆ ก่อนกดลิงก์ด้วย โดยจากประชากรมองโกเลีย 3 ล้านคน มี 1.5 ล้านคนอยู่ในเมืองหลวง สมมติว่าอีกประมาณ 1 ล้านคนอยู่นอกเขตเมือง และคิดที่ 1 เกอร์ต่อ 4 คน ก็จะได้ 250,000 หลัง พอรวมเกอร์สำหรับรับแขก เก็บของ หรือที่ตั้งในลานบ้านเพื่อใช้ประกอบอื่น ๆ ก็น่าจะราว 300,000 หลัง ซึ่งเกือบสองเท่าของผลจากแอป ML

    • แนวคิดใช้ OSM หรือแหล่งคล้ายกันเป็น label นั้นถูกพูดถึงบ่อยในโปรเจ็กต์ด้านภูมิสารสนเทศ/แมชชีนเลิร์นนิง แต่ OSM ถูกจำกัดโดยไลเซนส์ไม่ให้ใช้ภาพจาก Google Maps จึงมีปัญหาทางกฎหมายมากมายเรื่องการจัดหาภาพหรือเผยแพร่ต่อ แม้จะใช้เพื่อการวิจัยก็ตาม Google ทำสัญญารับสิทธิช่วงจากแหล่งภาพภายนอกหลายแห่งและจัดการ IP อย่างเข้มงวด ปัญหาการจัดแนวระหว่างภาพกับ label ก็ใหญ่ และตัว label เองอาจเป็นพิกัด GPS ไม่ใช่ตัวภาพโดยตรง อีกทั้งสิ่งปลูกสร้างเคลื่อนย้ายได้อย่างเกอร์ย่อมทำให้ความครบถ้วนและความสอดคล้องของ label ต่ำลงโดยหลีกเลี่ยงไม่ได้ ความสมบูรณ์ของ OSM ยังขึ้นกับความเคลื่อนไหวของชุมชนในแต่ละพื้นที่มากด้วย ถึงอย่างนั้นก็ยังใช้ตรวจสอบไขว้ระหว่าง label ภายในกับค่าทำนายได้ สำหรับการตรวจจับระดับ tile มักจะทิ้งผลทำนายตรงขอบ และใช้ overlap window กับ NMS จัดการผลซ้ำ

    • 172,000 กว่าหลังยังถือว่าเป็นจำนวนมหาศาลอยู่ดี และย้ำว่าหากเทียบจำนวนเกอร์ต่อประชากรแล้ว ก็น่าจะสูงกว่าที่ไหนในโลกอย่างชัดเจน

  • อยากย้ำว่าการดาวน์โหลดภาพดาวเทียมจาก Google Maps โดยตรงนั้นผิดข้อกำหนดการใช้งาน และในทางปฏิบัติก็มักถูกบล็อกง่ายมาก จึงแปลกใจที่มีคนดาวน์โหลด tile ครอบคลุมทั้งมองโกเลียได้

    • ถ้าไม่นับเรื่องการผูกขาดตลาด ก็ไม่เข้าใจเหตุผลของนโยบายแบบนี้เลย

    • ถ้าโดนบล็อกก็แค่สร้างบัญชีใหม่ก็ได้

  • ผลลัพธ์น่าสนใจมาก เลยสงสัยว่าอัตรา false positive จริง ๆ อยู่ที่เท่าไร เช่น ถังเก็บของ ไซโล หรือสระว่ายน้ำกลางแจ้ง ถูกจัดประเภทผิดเป็นเกอร์บ้างหรือไม่

  • เป็นเรื่องราวแนว Geo/ML ที่เคยเจอสมัยมหาวิทยาลัย เลยดีใจมากที่ได้เห็นอีกครั้ง รัฐบาลออสเตรเลียก็ทุ่มเงินก้อนโตทุกปีทำงานคล้ายกัน แต่เมื่อเทียบกับผลของผู้เขียนแล้ว กลับยิ่งรู้สึกว่ารัฐบาลของเราทำงานได้ไม่มีประสิทธิภาพกว่ามาก น่าหงุดหงิดที่ยังจัดประเภทที่ดินพื้นฐานไม่ได้ และแม้แต่การนับวัตถุเล็ก ๆ รูปเกอร์ก็ยังทำได้ไม่ดี

    • กำลังจะบอกว่าดีใจที่มีนักพัฒนา/ศิลปินสดในท้องถิ่นที่มีประสบการณ์คล้ายกัน แต่พอเห็นชื่อผู้เขียนก็ถึงกับตกใจ
  • จากผลที่ว่า “ตรวจพบเกอร์ทั้งหมด 172,689 หลังที่มี prediction score มากกว่า 40%” ก็สงสัยว่าควรตีความคำว่า prediction score อย่างไร

    • ตัวตรวจจับวัตถุจะให้คะแนนความเชื่อมั่นกับกรอบขอบเขตที่ตรวจพบแต่ละอัน ยิ่งคะแนนสูงก็ยิ่งหมายถึงโมเดลมั่นใจว่ากรอบนั้นถูกต้อง ปกติในงานลักษณะนี้ ผู้ใช้จะตั้ง threshold แล้วถือว่าค่าที่สูงกว่าจุดนั้นเป็นการตรวจจับจริง ส่วนที่ต่ำกว่าจะถูกทิ้ง ค่า threshold อาจกำหนดแบบตามใจหรือมีหลักการอยู่บ้าง
  • ตอนแรกเข้าใจชื่อเรื่องผิด คิดว่าหมายถึงยูร์ตทุกหลังในมองโกเลียกำลัง “ใช้” machine learning

  • ผู้เขียนบอกว่าใช้โซลูชันกึ่งเชิงพาณิชย์ (ใช้ฟรีเพื่อการศึกษา) และก็อยากรู้ว่า topology/architecture ของโมเดลดีปเลิร์นนิงเป็นแบบไหน รวมถึงสงสัยว่ายังมีแนวทางที่ดีกว่านี้หรือไม่