1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • คำสั่ง DAO 216-26 ของกระทรวงพาณิชย์สหรัฐฯ เมื่อวันที่ 4 มิถุนายน 2026 ทำให้วิธีปกป้องสถิติสาธารณะของ BEA และ U.S. Census Bureau ย้อนกลับไปใช้เทคนิคแบบทศวรรษ 1970 ซึ่งอาจสั่นคลอนทั้งประโยชน์ใช้สอยของข้อมูลสาธารณะที่ละเอียด และการคุ้มครองผู้ตอบแบบสำรวจไปพร้อมกัน
  • คำสั่งนี้ห้ามใช้เทคนิคจำกัดการเปิดเผยสมัยใหม่ เช่น ความเป็นส่วนตัวเชิงอนุพันธ์ (differential privacy) และการเติม noise และอนุญาตเฉพาะ coarsening เช่น การปัดเศษ การรวมกลุ่ม การจัดเป็นช่วง และ suppression ซึ่งเป็นทางเลือกสุดท้ายเท่านั้น
  • ตัวอย่างโรงเบียร์ใน County Business Patterns แสดงให้เห็นว่า coarsening แบบง่าย ๆ อาจทำให้สถิติอุตสาหกรรมและภูมิภาคใช้การไม่ได้ หรือเมื่อค่ารวมหลายชุดถูกนำมาประกอบกัน ก็สามารถใช้พีชคณิตระดับมัธยมปลายสร้างค่าของธุรกิจรายตัวกลับขึ้นมาได้
  • Census Act กำหนดให้การเปิดเผยข้อมูลที่ทำให้ระบุข้อมูลที่บุคคลหรือธุรกิจเฉพาะรายให้ไว้ได้เป็นความผิดทางอาญา และอัตราการตอบสำมะโนกับความเชื่อมั่นต่อสถิติของรัฐบาลกลางพึ่งพา การรับประกันความลับ อย่างมาก
  • ไม่ว่าภายในชุมชนวิทยาศาสตร์จะมีความเห็นต่างกันอย่างไรเกี่ยวกับเทคนิคคุ้มครองข้อมูลส่วนบุคคล แนวทางที่ผู้เล่นทางการเมือง ไม่ใช่ผู้เชี่ยวชาญของหน่วยงานสถิติรัฐบาลกลาง เป็นผู้สั่งห้ามการเลือกวิธีการโดยฝ่ายเดียว ควรถูกปฏิเสธ

การคุ้มครองความลับของสถิติสาธารณะที่ DAO 216-26 เปลี่ยนแปลง

  • เมื่อวันที่ 4 มิถุนายน 2026 รัฐมนตรีว่าการกระทรวงพาณิชย์สหรัฐฯ ออก DAO 216-26 เพื่อจำกัด เทคนิคคุ้มครองความลับ ที่สามารถใช้ได้ในสิ่งพิมพ์เผยแพร่ทั้งหมดของ BEA และ U.S. Census Bureau
  • คำสั่งนี้ทำให้เครื่องมือคุ้มครองสถิติสาธารณะย้อนกลับไปสู่เทคนิคช่วงต้นทศวรรษ 1970 และถอยหลังจากการคุ้มครองเจ้าของข้อมูลกับพัฒนาการด้านวิธีวิทยาที่สั่งสมมากว่าครึ่งศตวรรษ
  • ด้วยความก้าวหน้าของเทคโนโลยีคุ้มครองความลับ Census Bureau จึงสามารถแชร์ข้อมูลได้มากขึ้นในระดับที่ละเอียดขึ้น
  • ผลลัพธ์คือ ประโยชน์ใช้สอยของสถิติอาจลดลง จำนวนสถิติที่เปิดเผยได้อาจลดลง หรือระดับการคุ้มครองอาจอ่อนลง

ภูมิหลังทางการเมืองและความขัดแย้งทางกฎหมาย

  • เบื้องหลังของ DAO 216-26 มีผลประโยชน์ทางการเมืองทำงานอย่างเข้มข้นกว่า ความสมเหตุสมผลทางวิทยาศาสตร์
  • คำสั่งนี้ถูกวิจารณ์ว่าข้ามขั้นตอนทางปกครองที่กฎหมายกำหนด
  • เป็นการทำตามคำมั่นของผู้ออกแบบ Project 2025 ของ Heritage Foundation และสะท้อนวาทกรรมกับความเข้าใจผิดของ Center for Renewing America (CRA) ซึ่งก่อตั้งโดย Russell Vought ผู้อำนวยการ OMB
  • เอกสารอธิบายความเป็นส่วนตัวเชิงอนุพันธ์ของ CRA เกี่ยวกับ 2020 Census ระบุว่า “แม้จะเพิ่มคำถามเรื่องสัญชาติลงใน Census ตราบใดที่ยังใช้ differential privacy ก็เป็นไปไม่ได้ที่จะยืนยันสถานะของบุคคลได้”
  • แต่การปกปิดข้อมูลลักษณะเฉพาะของบุคคลเช่นนี้เป็นสิ่งที่ Census Act หรือ 13 U.S. Code Section 9 กำหนดไว้
    • มาตรานี้กำหนดให้การเปิดเผยที่ทำให้ระบุข้อมูลที่บุคคลใดบุคคลหนึ่งให้ไว้ได้เป็นความผิดทางอาญา
    • ความลับยังสำคัญต่อการทำให้ผู้คนตอบแบบสำมะโนด้วย

เทคนิคที่ถูกห้ามและเทคนิคที่อนุญาต

  • DAO 216-26 ไม่เพียงห้าม ความเป็นส่วนตัวเชิงอนุพันธ์ แต่ยังห้ามเทคนิคหลีกเลี่ยงการเปิดเผยสมัยใหม่ รวมถึงเทคนิคเก่าบางส่วนด้วย
  • เทคนิคหลักที่อนุญาตถูกจำกัดอยู่ที่ “coarsening”
    • เป็นวิธีลดระดับรายละเอียดหรือความเฉพาะเจาะจงของสถิติที่เผยแพร่
    • การปัดเศษ การรวม การจัดกลุ่ม และการใช้ช่วง จัดอยู่ในหมวดนี้
  • “suppression” คือวิธีลบค่าบางค่าออกอย่างชัดเจน แต่อนุญาตให้ใช้เป็น ทางเลือกสุดท้าย เท่านั้น
  • “noise infusion” คือวิธีแก้ไขชุดข้อมูลด้วยการเพิ่มค่าสุ่มหรือ noise เข้าไป และอยู่ในกลุ่มที่ถูกห้าม
  • การเติม noise เป็นเทคนิคที่สร้างขึ้นเพื่อรับมือกับความต้องการข้อมูลละเอียดที่เพิ่มขึ้น ภายใต้กฎหมายความลับที่ห้ามเปิดเผยข้อมูลซึ่งสามารถระบุตัวตนซ้ำได้

ขอบเขตผลกระทบต่อผลิตภัณฑ์ข้อมูลเดิม

  • coarsening และ suppression โดยทั่วไปเพียงพอสำหรับสถิติรวมระดับประเทศ เช่น Principal Federal Economic Indicators
  • แต่เทคนิคเหล่านี้ไม่เหมาะกับข้อมูลธุรกิจและประชากรในระดับภูมิศาสตร์และอุตสาหกรรมที่ละเอียด
  • การห้ามเติม noise มีผลเท่ากับห้ามเทคนิคหลีกเลี่ยงการเปิดเผยหลักของการเผยแพร่ข้อมูลหลายสิบชุดในช่วง 30 ปีที่ผ่านมา
    • input noise infusion ถูกใช้กับ Quarterly Workforce Indicators มาตั้งแต่ปี 2002 และเคยมีแผนใช้กับสถิติของ BEA ด้วย
    • swapping ถูกใช้กับสิ่งพิมพ์เผยแพร่ของ decennial census ตั้งแต่ปี 1990
    • differential privacy ถูกใช้ตั้งแต่ปี 2008 ในการแชร์ข้อมูลรูปแบบการเดินทางไปทำงาน OnTheMap และในสิ่งพิมพ์เผยแพร่ที่อิง 2020 Census
    • จนก่อนมีคำสั่งล่าสุด differential privacy ยังเคยอยู่ในแผนสำหรับ 2030 Census ด้วย
  • มีการระบุว่า BEA Working Paper WP2026-9 ถูกกระทรวงพาณิชย์ลบออกไปแล้ว

ปัญหาที่ตัวอย่าง County Business Patterns แสดงให้เห็น

  • DAO 216-26 เข้ากันได้ยากกับ พันธะสองด้าน ของ Census Bureau ที่ต้องให้ทั้งความลับและความเหมาะสมต่อการใช้งานไปพร้อมกัน
  • ตัวอย่าง County Business Patterns ของ Nathan Goldschlag แสดงให้เห็นแรงตึงเครียดที่เกิดขึ้นเมื่อแยกสถิติกิจกรรมทางธุรกิจตามอุตสาหกรรมและภูมิศาสตร์
    • หากเคาน์ตีเล็ก ๆ มีโรงเบียร์เพียงแห่งเดียว และเปิดเผยจำนวนพนักงานที่แน่นอน ข้อมูลของธุรกิจหนึ่งรายก็จะถูกเปิดเผยโดยตรง
    • หากมีโรงเบียร์สองแห่ง เจ้าของรายหนึ่งสามารถนำจำนวนพนักงานทั้งหมดมาลบพนักงานของธุรกิจตัวเอง เพื่อรู้จำนวนพนักงานของคู่แข่งได้
    • แม้มีสามแห่งขึ้นไป หากไม่เปิดเผยยอดรวมจำนวนพนักงาน ผู้ประกอบการที่กำลังพิจารณาเข้าสู่ตลาดก็จะหาข้อมูลที่จำเป็นได้ยาก
  • ในตัวอย่างนี้ coarsening ทำให้สถิติที่เผยแพร่ใช้การไม่ได้

สถานการณ์ที่สร้างข้อมูลกลับขึ้นมาได้แม้ใช้เพียง coarsening

  • ตัวอย่างเพิ่มเติมแสดงให้เห็นว่า coarsening อาจล้มเหลวแม้ในการรักษาความลับ
  • ในเคาน์ตีสมมติแห่งหนึ่งมีเมืองสองเมืองชื่อ North Bend และ South Bend โดยแต่ละเมืองมีโรงเบียร์หนึ่งแห่ง
    • North Bend มีบริษัทบรรจุขวดแบบเคลื่อนที่
    • South Bend มีบริษัทบรรจุขวดแบบประจำที่
    • มีธุรกิจเกี่ยวกับเบียร์ทั้งหมด 4 แห่ง
    • โรงเบียร์ใน North Bend และบริษัทบรรจุขวดใน South Bend เป็นบริษัทที่มีเจ้าของเปิดเผยต่อสาธารณะ
  • CBP เผยแพร่สถิติห้ารายการ
    • จำนวนพนักงานทั้งหมดของธุรกิจเกี่ยวกับเบียร์ใน North Bend
    • จำนวนพนักงานทั้งหมดของธุรกิจเกี่ยวกับเบียร์ใน South Bend
    • จำนวนพนักงานของธุรกิจโรงเบียร์ทั้งเคาน์ตี
    • จำนวนพนักงานของธุรกิจบรรจุขวดทั้งเคาน์ตี
    • จำนวนพนักงานของบริษัทที่มีเจ้าของเปิดเผยต่อสาธารณะทั้งเคาน์ตี
  • ในกรณีนี้จะเกิด สมการ 5 สมการกับตัวแปรไม่ทราบค่า 4 ตัว และใช้เพียง A·B·C·E สี่ค่าก็สามารถแก้หาจำนวนพนักงานที่แน่นอนของแต่ละบริษัทได้ด้วยพีชคณิตระดับมัธยมปลาย
  • แม้ coarsening ตามภูมิศาสตร์ อุตสาหกรรม และรูปแบบความเป็นเจ้าของจะถูกใช้ด้วยเจตนาดี แต่หากมันมีปฏิสัมพันธ์กันในทางแย่ ก็สามารถสร้างค่าทั้งหมดกลับขึ้นมาได้ครบถ้วน
  • noise infusion จะรบกวนชุดสมการนี้เพื่อป้องกันการสร้างข้อมูลกลับขึ้นมาอย่างแม่นยำ

ข้อจำกัดในการปฏิบัติของการกลับสู่ “tradstat”

  • กระทรวงพาณิชย์อ้างว่าคำสั่งนี้เป็นการกลับไปใช้เทคนิคสถิติแบบดั้งเดิมของทศวรรษ 1970 หรือ “tradstat” และเป็นผลดีต่อผู้บริโภคข้อมูล
  • FAQ ของ BEA ระบุว่าการอัปเดตวิธีจำกัดการเปิดเผยนี้ช่วยคุ้มครองผู้ตอบแบบสำรวจและ “ให้ข้อมูลเศรษฐกิจที่จำเป็นมากขึ้นแก่สาธารณะ”
  • แต่ตัวอย่างของ Goldschlag แสดงให้เห็นว่า coarsening อาจทำงานในทางตรงกันข้าม
  • โดยนิยามแล้ว coarsening ลด การเข้าถึงข้อมูลละเอียด
  • ในตัวอย่างที่ coarsening สามแบบมีปฏิสัมพันธ์กันอย่างเลวร้าย หากไม่มีการเติม noise ความลับอาจถูกทำลายได้ด้วยการคำนวณพื้นฐานเท่านั้น
  • ในสำมะโนประชากร วิธีเติม noise แบบเป็นทางการ เช่น differential privacy มีบทบาทในการเก็บลักษณะเฉพาะของบุคคล เช่น สถานะสัญชาติ ไว้เป็นความลับ

เหตุผลที่ความลับสำคัญต่อสถิติรัฐบาลกลาง

  • ภายในชุมชนวิทยาศาสตร์ยังคงมีการถกเถียงกันต่อเนื่องว่า วิธีที่ดีที่สุดในการคุ้มครองความลับของข้อมูลผู้ตอบแบบสำรวจคืออะไร
  • อย่างไรก็ตาม DAO 216-26 ถูกนิยามว่าเป็นมาตรการที่ขับเคลื่อนด้วย ผลประโยชน์ทางการเมือง มากกว่าวิทยาศาสตร์
  • คำสั่งนี้อาจทำให้ความเชื่อมั่นของสาธารณะต่อกระบวนการสำมะโนตกอยู่ในความเสี่ยง
  • เจ้าหน้าที่รัฐจะพยายามทำตามคำสั่งควบคู่กับการปฏิบัติตามกฎหมายที่กำหนดให้ต้องคุ้มครองความลับของผู้ตอบแบบสำรวจ
    • อาจผลิตข้อมูลได้น้อยลง
    • อาจทำให้ข้อมูลหยาบเกินไปจนใช้ไม่ได้
    • ภายใต้แรงกดดันทางการเมือง อาจต้องเปิดเผยข้อมูลที่ถูกแกะการปกปิดได้ง่ายเหมือนตัวอย่างโรงเบียร์
  • ไม่ว่าจะเลือกทางใด การรับประกันความลับของผู้ตอบแบบสำรวจก็จะยากขึ้น และธุรกิจกับบุคคลจำนวนมากอาจไม่ตอบแบบสำรวจ
  • สิ่งนี้อาจก่อผลลัพธ์ที่ทำลายล้างต่อหน่วยงานที่จัดหา “ข้อมูลของประชาธิปไตย”

การตอบสนองที่จำเป็น

  • แทนที่จะให้ผู้เล่นทางการเมืองกดทับผู้เชี่ยวชาญด้านสถิติของรัฐบาล จำเป็นต้องมี การลงทุนอย่างลึกซึ้ง ในหน่วยงานสถิติของสหรัฐฯ
  • ต้องรับประกันบุคลากรและการสนับสนุน เพื่อให้หน่วยงานสามารถปรับปรุงวิธีการด้วยเครื่องมือที่ดีที่สุด
  • ไม่ว่าจะมีมุมมองต่อเทคนิคเพิ่มการคุ้มครองข้อมูลส่วนบุคคลแบบใด แนวทางต่อต้านวิทยาศาสตร์ในการดำเนินงานสถิติรัฐบาลกลางควรถูกปฏิเสธร่วมกัน
  • การดำเนินการที่เสนอมีดังนี้
    • แชร์บทความนี้กับเครือข่ายวิชาชีพและชุมชน
    • ค้นหา ช่องทางติดต่อผู้แทนสภาผู้แทนราษฎร และแจ้งข้อกังวลต่อ Congressional representative
    • เรียกร้องให้ถอน DAO ปฏิบัติตามขั้นตอนทางปกครองที่เหมาะสม และให้ผู้เชี่ยวชาญของหน่วยงานสถิติรัฐบาลกลางเป็นผู้เลือกวิธีทางเทคนิคที่สร้างสมดุลระหว่างประโยชน์ใช้สอยกับความลับ
    • เพื่อช่วยอนุรักษ์ Census working paper และเอกสารต่าง ๆ สามารถอาสากับ แถลงการณ์เรื่อง differential privacy ของ Data Rescue Project หรือใช้ Save Page Now ของ Internet Archive ได้
  • หน้าเว็บที่อธิบาย noise infusion และ differential privacy เริ่มถูกนำลงออฟไลน์แล้ว จึงจำเป็นต้องเก็บถาวรหน้าวิธีวิทยาและเอกสารทางเทคนิคที่เกี่ยวข้อง

1 ความคิดเห็น

 
GN⁺ 4 시간 전
ความคิดเห็นบน Hacker News
  • คำสั่ง DAO-216-26 ที่รัฐมนตรีว่าการกระทรวงพาณิชย์สหรัฐฯ ออกเมื่อวันที่ 4 มิถุนายน 2026 ห้ามใช้ differential privacy รวมถึงเทคนิคสมัยใหม่และเก่าหลายอย่าง และจำกัดเทคนิคหลีกเลี่ยงการเปิดเผยข้อมูลต่อสาธารณะไว้ที่ “การทำให้หยาบ”
    ยังห้าม การฉีด noise ซึ่งเป็น “วิธีแก้ไขชุดข้อมูลโดยเพิ่มค่าสุ่ม หรือ noise” ด้วย ทำให้เทคนิคป้องกันที่เป็นหัวใจของการเปิดเผยข้อมูลหลายสิบชุดตลอด 30 ปีที่ผ่านมาถูกปิดกั้นไป
    เจ้าหน้าที่รัฐอาจต้องพยายามทำตามทั้งกฎหมายที่สั่งให้รักษาความลับของข้อมูลผู้ตอบแบบสอบถามและคำสั่งนี้พร้อมกัน จนต้องเผยแพร่ข้อมูลให้น้อยลง หรือทำให้หยาบเกินไปจนใช้ประโยชน์ไม่ได้ นอกจากนี้อาจมีแรงกดดันทางการเมืองให้เปิดเผยข้อมูลที่สามารถระบุตัวบุคคลซ้ำได้ง่าย รัฐบาลชุดปัจจุบันจึงแย่ถึงขั้นต้องสาป

    • การประเมินรัฐบาลสหรัฐฯ ชุดปัจจุบันต่ำมากอยู่แล้ว ดังนั้นเวลาพวกเขาทำเรื่องที่เลวร้ายแต่ซับซ้อน อคติของผมอาจกลายเป็นจุดบอดได้
      ถึงอย่างนั้น แค่พวกเขาไปดู differential privacy ก็ยังน่าประหลาดใจแล้ว และที่น่าประหลาดใจกว่านั้นคือหลังจากดูแล้วกลับสรุปว่าควรกำจัดมันทิ้ง ตรรกะอะไรที่อาจอยู่เบื้องหลังเรื่องนี้ได้บ้าง
    • รัฐบาลสหรัฐฯ ชุดปัจจุบันถูก มหาเศรษฐีและผลประโยชน์ต่างชาติ ครอบงำอยู่ และทั้งสองฝ่ายต่างต้องการให้รัฐบาลสหรัฐฯ ล่มสลาย
      หากสหรัฐฯ จะกลับมาได้รับการยอมรับอย่างจริงจังอีกครั้ง คงต้องมีคนจำนวนมากถูกจำคุก ถูกแขวนคอ หรือถูกเนรเทศ
      พวกขี้ขลาดก้าวร้าวที่เคยพูดพล่ามเรื่องปืนกับรัฐธรรมนูญแก้ไขเพิ่มเติมฉบับที่ 2 ตอนนี้หายไปไหนกันหมด ต่อให้บ้านกำลังไหม้ก็คงยังตะโกนเรื่องเสรีภาพอยู่ดี
    • ไม่ใช่คำสาป แต่เป็นความพยายามเชิงรุกที่จะรวบ อำนาจของตัวเอง ให้แน่นขึ้นตามแบบฟาสซิสต์เผด็จการ
      แต่บางคนก็ยังหลงคิดว่าถ้าเชียร์ผู้นำที่รักให้หนักขึ้น กระแสจะย้อนกลับมาเข้าทางพวกเขาด้วย มองเหมือนเป็นการแข่งขันกีฬา ที่ต้องเชียร์ทีมของตัวเองแม้ทีมนั้นจะละเมิดกติกาแบบโจ่งแจ้งก็ตาม
    • การทำให้หยาบ ไม่ได้สง่างามเท่า differential privacy แต่การใช้มันไม่ได้ทำให้เกิด “ภาวะฉุกเฉินด้านความเป็นส่วนตัว” มันก็แค่สำมะโนประชากรที่แม่นยำน้อยลงเล็กน้อยเท่านั้น
      ไม่มีใครรู้ว่าความต่างด้านความแม่นยำระดับนี้มีผลต่อเศรษฐกิจจริงอย่างไร
      ถ้าใช้เทคนิคที่สง่างามกว่านี้ได้ก็คงดี และผมก็รู้สึกโดยสัญชาตญาณว่านโยบายนี้ไม่ดี แต่ยังไม่เห็นว่ามันถึงขั้น “ภาวะฉุกเฉิน” การเรียกแบบนั้นรู้สึกเหมือนพูดเกินจริง
  • คำร้องให้ลงมือทำในบทความนี้คือให้ติดต่อผู้ร่างกฎหมาย แต่กลับไม่มีลิงก์สำหรับค้นหาช่องทางติดต่อให้ น่าจะหาได้ที่นี่: https://www.congress.gov/members/find-your-member

  • เป้าหมายทางการเมือง เบื้องหลังคำสั่งนี้คืออะไร? มันต้องมีจุดประสงค์ที่ไม่แนบเนียนเลยแน่ ๆ แต่ไม่รู้ว่าคืออะไร

    • คนที่กุมอำนาจอยู่ตอนนี้ต้องการ ข้อมูลทุกไบต์ เกี่ยวกับผู้คนที่อาศัยอยู่ในประเทศนี้
      พวกเขาต้องการแบ่งคนตามเกณฑ์ตามอำเภอใจ แล้วจัดการกับกลุ่มเหล่านั้นตามใจตนเอง สำหรับบางคน อาจหมายถึงการกักขัง การเนรเทศ หรือเรื่องที่เลวร้ายกว่านั้น
  • ถ้าดูประโยคที่ว่า “หากปฏิบัติตามคำสั่งนี้ ข้อมูลสาธารณะของกระทรวงพาณิชย์ที่ใช้ประกอบการตัดสินใจสำคัญ เช่น จะสร้างบริการที่จำเป็นต่อสวัสดิภาพของชุมชนของเราที่ใด จะถูกทำลาย” นี่ไม่ใช่บทความเกี่ยวกับความเป็นส่วนตัว
    Scott ฟังดูเหมือนนักวิทยาการคอมพิวเตอร์ที่ต้องใช้สำนวนเกินจริงเพราะระบบนิเวศของสหรัฐฯ

    • หากไม่สามารถ ทำให้ไม่ระบุตัวตน ได้เพียงพอจนหลีกเลี่ยงกฎหมายคุ้มครองข้อมูลส่วนบุคคลหรือกฎหมายไม่เปิดเผยข้อมูลอื่น ๆ ก็ไม่สามารถเผยแพร่ชุดข้อมูลได้
      ถ้าคนดูแลข้อมูลถูกห้ามใช้เทคนิคที่ใช้ในการทำให้ข้อมูลไม่ระบุตัวตน ก็จะทำให้ไม่ระบุตัวตนได้ไม่เพียงพอ ตรรกะนี้ไม่ได้เข้าใจยาก
    • นี่เป็นบทความรับเชิญของ Cynthia Dwork ไม่ใช่สำนวนของ Aaronson แต่เป็น งานเขียนของ Dwork
  • ใครช่วยอธิบายได้ไหมว่าทำไม Heritage Foundation ถึงพุ่งเป้าไปที่ เทคนิคทางสถิติ เหล่านี้? แรงจูงใจทางการเมืองคืออะไร

    • มีตัวอย่างอยู่ที่นี่: https://x.com/WadeMiller/status/1985183761957372286
    • เพื่อเพิ่มอำนาจให้บริษัทยักษ์ใหญ่ และเปิดมาตรการป้องกันทางสถิติออก ทำให้ 1) การปลุกปั่น·โฆษณาชวนเชื่อดีขึ้น, 2) การติดตามชนกลุ่มน้อยที่ตนไม่ชอบง่ายขึ้น, 3) การกำหนดเป้าหมายเลือกตั้งง่ายขึ้น
    • สำมะโนประชากรปี 2020 มีปัญหาหลายอย่าง และจำนวนไม่น้อยส่งผลให้พรรคเดโมแครตได้ที่นั่งในสภาผู้แทนราษฎรมากกว่าที่ควรจะเป็น
      อีกทั้งผลสำมะโนควรไปถึงทำเนียบขาวในเดือนธันวาคม 2016 แต่ไม่知ด้วยเหตุใด จึงไปไม่ถึงทำเนียบขาวจนถึงวันที่ 21 มกราคม 2017
      ไม่รู้ว่า differential privacy เกี่ยวข้องโดยตรงหรือไม่ แต่ดูเหมือนถูกเหมารวมกับปัญหาอื่น ๆ แล้วถูกตำหนิไปด้วย
    • มีความเป็นไปได้สูงว่าจะเกี่ยวข้องกับประวัติศาสตร์ทำนองว่า “นาซีใช้สำมะโนประชากรปกติ การยื่นภาษี และข้อมูลทะเบียนตำรวจท้องถิ่น ในประเทศที่ถูกยึดครองอย่างเยอรมนีและเนเธอร์แลนด์ ข้อมูลเหล่านี้ถูกจัดระเบียบอย่างเป็นระบบ ในบางกรณี มีการใช้เทคโนโลยีของ IBM หรือเครื่องบัตรเจาะรู Dehomag เพื่อรวบรวมและจัดหมวดหมู่ข้อมูลสำมะโนประชากรเพื่อระบุตัวบุคคลเชื้อสายยิว”
  • บทความเสนอวิธีปกป้องความเป็นส่วนตัวในชุดข้อมูลไว้สองวิธี แล้วโจมตีจุดอ่อนเชิงทฤษฎีของวิธีแบบเก่าด้วยสถานการณ์ที่สร้างขึ้น เพื่อชักนำให้เลือกอีกวิธีที่ใหม่กว่า
    แต่โซลูชันใหม่นั้นไม่ได้อธิบายรายละเอียด นอกจากชื่อ สิ่งที่สงสัยคือ 1) เคยมีกรณีที่การทำให้ข้อมูล หยาบขึ้น ล้มเหลวจริงตามแบบที่บทความกล่าวจนข้อมูลรั่วไหลหรือไม่, 2) โซลูชัน “อีกแบบ” ที่เราควรคาดหวังนั้นทำงานอย่างไร, 3) เมื่อจำเป็นต้องทำให้ข้อมูลหยาบขึ้นจริง ๆ ระดับรายละเอียดที่วิธีเก่าทำไม่ได้แต่โซลูชันใหม่ทำได้คืออะไร

    • (1) “A Simulated Reconstruction and Reidentification Attack on the 2010 U.S. Census” https://arxiv.org/pdf/2312.11283
      (2) เป็นวิธีเพิ่ม Gaussian noise ที่ปรับแต่งอย่างรอบคอบ ช่วง 6 ปีที่ผ่านมา ยังพบวิธีเพิ่ม Gaussian noise ในปริมาณน้อยลงมากด้วย: “The 2020 Census Disclosure Avoidance System TopDown Algorithm” https://arxiv.org/abs/2204.08986
      (3) ข้อนี้ตอบยากกว่า เพราะสำนักงานสำมะโนประชากรมุ่งเผยแพร่สถิติในรูปแบบเดียวกับหลายทศวรรษก่อน เป้าหมายของปี 2020 คือเผยแพร่สถิติเดียวกันภายใต้ขอบเขตความคลาดเคลื่อนเดียวกัน และจากหลักฐานดูเหมือนว่าบรรลุเป้าหมายนั้นแล้ว “Evaluating Bias and Noise Induced by the U.S. Census Bureau's Privacy Protection Methods” http://arxiv.org/abs/2306.07521, “Evaluating the Impacts of Swapping on the US Decennial Census” http://arxiv.org/abs/2502.01320
  • การพูดคุยก่อนหน้า: https://news.ycombinator.com/item?id=48517377

  • บทความที่เกี่ยวข้อง: https://news.ycombinator.com/item?id=48517377
    เสียดายที่เรื่องนี้ถูกทำให้เป็นการเมือง ผมกำลังทำงานด้าน differential privacy เพื่อให้สอดคล้องกับ GDPR และมันเป็นเทคโนโลยีที่น่าสนใจ

    • ที่ว่าทำงานด้าน differential privacy หมายถึงงานด้านกฎหมายหรือเปล่า?
  • มีข้อเท็จจริงเกี่ยวกับสภาคองเกรสที่เพิ่งรู้ไม่นานนี้เรื่องหนึ่งที่ผมชอบ
    การลาคลอด/ลาเพื่อดูแลบุตรของพ่อแม่ในระดับรัฐบาลกลาง หรือก็คือการลาของพ่อและแม่ มีผู้ใหญ่ในสหรัฐฯ ประมาณ 80% เห็นด้วย ผู้มีสิทธิเลือกตั้งทั้งพรรคเดโมแครตและรีพับลิกันต่างสนับสนุน ไม่ว่าจะมีแนวคิดทางการเมืองแบบใด
    แต่คุณอาจแปลกใจว่าทำไมเรื่องที่ได้รับความนิยมมากขนาดนี้จึงยังไม่เป็นข้อบังคับของรัฐบาลกลาง กลุ่มที่ไม่ชอบเรื่องนี้คือภาคธุรกิจ และธุรกิจก็บริจาคเงินจำนวนมากให้แก่นักการเมือง เพราะการบริจาคให้นักการเมืองที่คัดค้านการลาของพ่อแม่ถูกกว่าการจ่ายค่าใช้จ่ายการลาของพ่อแม่เอง
    ผมเล่าเรื่องนี้บ่อย เพราะมันเตือนให้เห็นว่ามีกลุ่มต่าง ๆ ที่ใช้เวลาและเงินจำนวนมากเพื่อผลักดันสิ่งที่ตนต้องการ แม้อาจฟังดูน่าหนักใจ แต่ถ้าคุณโทรหา ส.ส. ในพื้นที่ การโทรนั้นจะถูกนับ พวกเขาอยากรู้ว่าผู้มีสิทธิเลือกตั้งสนใจอะไร ดังนั้นก็โทรไปบอกพวกเขาได้

    • สิ่งที่น่าตกใจเป็นพิเศษจากการเปิดโปงช่วงหลัง ๆ คือ สภาคองเกรสขายตัวถูกแค่ไหน
    • จากคำตอบที่ได้รับหลังเขียนจดหมายถึงผู้แทนในพื้นที่ของผม ดูเหมือนว่าพวกเขาใส่ใจ ผู้สนับสนุนจากภาคธุรกิจและแนวทางของพรรค มากกว่าผู้มีสิทธิเลือกตั้งมาก
    • ถ้าถามแค่เห็นด้วยหรือคัดค้านการบังคับให้มีการลาของพ่อแม่ในระดับรัฐบาลกลาง คนส่วนใหญ่น่าจะสนับสนุน แต่ถ้าถามว่าจะเปลี่ยนคะแนนเสียงเพราะเรื่องนี้ไหม มันฟังดูเหมือนประเด็นที่คนที่เห็นด้วยจะตอบว่าไม่ใช่เรื่องสำคัญอันดับต้น ๆ และไม่ได้สำคัญพอที่จะลงมือทำ
      ส่วน 20% ที่คัดค้านอาจเป็นเจ้าของธุรกิจขนาดเล็ก เป็นต้น ถ้าไม่ยกเว้นธุรกิจขนาดเล็ก พวกเขาจะต้องจ่ายเงินให้คนที่ลายาวและยังต้องจ่ายให้คนมาทดแทนด้วย ซึ่งรับไม่ไหว แต่ถ้ายกเว้นธุรกิจขนาดเล็ก เจ้าของธุรกิจขนาดใหญ่ก็เกลียดทุกสิ่งที่ทำให้บริษัทเล็กได้เปรียบเชิงเปรียบเทียบ
      ดังนั้นเมื่อฝ่ายหนึ่งคือ 80% ที่ต้องการแต่มีเพียง 1% ที่ใส่ใจจริง ๆ ปะทะกับอีกฝ่ายคือ 20% ที่ต้องการแต่มี 75% ที่ใส่ใจ ตัวเลขชุดหลังจึงใหญ่กว่า
    • ถ้าคุณคิดว่าการเงินการเมืองหรือการที่บริษัทซื้อเสียงนักการเมืองนั้นแย่อยู่แล้ว ในสหรัฐฯ มันจะยิ่งแย่ลงแบบทวีคูณในอนาคต
      เมื่อไม่นานมานี้ ศาลฎีกาได้มีคำตัดสินที่เปิดทางให้กลุ่มคณาธิปไตยผู้มั่งคั่งสามารถให้เงิน ไม่จำกัดจำนวน แก่หุ่นเชิดที่ตนชอบ เอ่อ นักการเมือง ได้[1]
      [1]: https://www.npr.org/2026/06/30/nx-s1-5827039/supreme-court-c...
    • ที่อยู่อาศัยฟรี อาหารฟรี การรักษาพยาบาลฟรี และรายได้ฟรี ก็ได้รับความนิยมอย่างมหาศาลในหมู่ผู้ใหญ่ในสหรัฐฯ เช่นกัน
      ปัญหาคือสิ่งเหล่านั้นไม่ได้ “ฟรี” จริง ๆ เพราะต้องมีใครสักคนจ่ายค่าใช้จ่าย
      https://en.wikipedia.org/wiki/Tyranny_of_the_majority
  • การโทรหาสมาชิกสภาจะไม่มีผลอะไรเลยจริง ๆ[1]
    แม้ศูนย์ข้อมูลจะถูกชุมชนท้องถิ่นคัดค้านแทบทุกที่ และผลกระทบภายนอกเชิงลบก็เป็นเรื่องจริงและเกิดขึ้นโดยตรงมากกว่า แต่ก็ยังได้รับอนุมัติอยู่เรื่อย ๆ
    วิกฤตที่แท้จริงอยู่ที่ ระบบการเมืองที่ถูกครอบงำ
    ในออสเตรเลียช่วงทศวรรษ 1990 พรรคเหยียดเชื้อชาติและยึดถืออำนาจเหนือกว่าของคนผิวขาวชื่อ One Nation ผุดขึ้นมาจากการบรรจบกันของเหตุการณ์แปลก ๆ และ Pauline Hanson เจ้าของร้านฟิชแอนด์ชิปส์ก็ได้เป็นสมาชิกสภา เกือบ 30 ปีก่อน เธอกล่าวสุนทรพจน์ครั้งแรกที่โด่งดังในรัฐสภา[2]
    หลังเกิดเรื่องอื้อฉาวหลายครั้ง One Nation ก็หายไปอยู่พักหนึ่ง ส่วนหนึ่งเพราะแนวร่วมอนุรักษนิยม Liberal/National ดูดซับแพลตฟอร์มเหยียดเชื้อชาติที่ใช้ผู้ลี้ภัยเป็นแพะรับบาปไปโดยพฤตินัยในช่วงต้นทศวรรษ 2000 แต่แปลกที่ตอนนี้กลับมาอีกแล้ว อย่างไรก็ดี นั่นไม่ใช่ประเด็นหลัก
    ออสเตรเลียใช้ ระบบลงคะแนนตามลำดับความพึงพอใจ ซึ่งในสหรัฐฯ มักเรียกว่า ranked-choice voting ผู้มีสิทธิเลือกตั้งจะใส่หมายเลขให้ผู้สมัครเองโดยตรง หรือเลือกทำตามลำดับความพึงพอใจที่พรรคลงทะเบียนไว้ก็ได้ เพราะหลายคนเลือกแบบหลัง การจัดสรรคะแนนตามความพึงพอใจจึงสำคัญ
    One Nation ใช้ยุทธศาสตร์จัดสรรความพึงพอใจไปยังฝ่ายที่ต่อต้านผู้ครองตำแหน่งอยู่ ถ้าเป็นที่นั่งของ Liberal ก็ส่งไปให้ Labor และถ้าตรงกันข้ามก็ทำกลับกัน วิธีนี้ทำให้กลุ่มการเมืองกระแสหลักตกใจ จนพรรคใหญ่ที่เป็นคู่แข่งกันกลับจัดลำดับความพึงพอใจให้กันและกันสูงกว่า One Nation และ One Nation ก็ไม่ได้ที่นั่ง แม้ได้คะแนนเสียงเกิน 10%
    ประเด็นสำคัญคือ นักการเมืองและพรรคการเมืองจำนวนมากเกินไปมองที่นั่งของตนราวกับเป็นทรัพย์สินส่วนตัว ในสหรัฐฯ การเลือกตั้งขั้นต้นก็มักถูกปฏิบัติเหมือนเป็นพิธีการเพื่อผู้สมัครที่พรรคหมายตาไว้ และอัตราการได้รับเลือกตั้งซ้ำของรัฐสภาก็อยู่เหนือ 95% มาหลายสิบปี
    ที่น่าสนใจคือ ตอนนี้พรรคเดโมแครตแทบอยู่ในภาวะกบฏอย่างเปิดเผย และในช่วงไม่กี่สัปดาห์ที่ผ่านมา ผู้ดำรงตำแหน่งมานาน 10–30 ปีหลายคนพ่ายต่อผู้ท้าชิงในการเลือกตั้งขั้นต้น
    ยังมีข้อเท็จจริงน่าสนุกที่เพิ่งรู้ในสัปดาห์นี้ด้วย ผ่านมาประมาณ 18 ปีแล้วนับตั้งแต่คำตัดสิน Citizens United ทำให้ข้อจำกัดการใช้จ่ายเลือกตั้งแทบหายไป และในบรรดาเงินทั้งหมดที่ใช้หลังจากนั้น หนึ่งในสามถูกใช้ในการเลือกตั้งขั้นต้นปีนี้ ในการเลือกตั้งขั้นต้นของ Thomas Massie มีเงินกว่า 35 ล้านดอลลาร์ถูกใช้โดยฝ่ายตรงข้าม ทำให้เป็นการเลือกตั้งขั้นต้นที่แพงที่สุดในประวัติศาสตร์สหรัฐฯ และที่อื่น ๆ ก็อยู่ในระดับหลายล้านดอลลาร์ คาดว่าการชิงเก้าอี้วุฒิสมาชิกหนึ่งที่นั่งใน Maine จะมีการใช้จ่ายรวมสูงถึง 400 ล้านดอลลาร์
    สุดท้าย วิธีเดียวที่ได้ผลคือทำให้นักการเมืองกลัวว่าจะเสียที่นั่งสบาย ๆ ของตัวเอง หากนั่งอยู่ตรงนั้นมา 30 ปีแล้วไม่มีอะไรให้เห็น ก็ถึงเวลาต้องลงจากตำแหน่งแล้ว
    [1]: https://act.represent.us/sign/problempoll-fba
    [2]: https://www.youtube.com/watch?v=p2ypTX9ntTQ

    • ในฐานะคนออสเตรเลียเหมือนกัน เคยติดต่อสมาชิกสภาในพื้นที่ของตัวเองไหม?
      ตอนแรกผมก็ประชด ๆ ว่าจะทำไปทำไม แต่พอลองทำจริงก็พบว่าตัวเองคิดผิด และเป็นประสบการณ์ที่ค่อนข้างดี
      ตอนนี้ผมมองว่าสมาชิกสภาไม่ได้อยู่ในตำแหน่งที่เข้าถึงข้อเท็จจริงได้เสมอไป ดังนั้นการติดต่อไปบอกความคิดของเราจึงเหมือนเป็นการมอบของขวัญชิ้นใหญ่ให้พวกเขา
      โดยเฉพาะประเด็นระดับรัฐหรือท้องถิ่น มันอาจมีผลได้จริงพอสมควร ส่วนเรื่องระดับรัฐบาลกลางอาจน้อยกว่า แต่ อย่างน้อยก็ยังได้ความพอใจจากการได้รับคำตอบยืนยันจากหัวหน้าคณะทำงานหรือผู้ช่วย
    • แค่นำ ระบบลงคะแนนแบบจัดอันดับ มาใช้ก็ถือเป็นความก้าวหน้าครั้งใหญ่แล้ว
      ระบบสองพรรคคือการบังคับให้เลือกสองทางเทียม ๆ อย่างจงใจ เหมือนพ่อแม่ให้ลูกเลือกระหว่างบรอกโคลีกับแครอต แล้วทำให้ลูกเชื่อว่านั่นคือการตัดสินใจของตัวเอง ทั้งสองพรรคต่างถูกควบคุมโดยชนชั้นนักลงทุน
    • เห็นด้วย โทรหาผู้แทนได้
      ถ้าเขาพูดคลุมเครือหรือเลี่ยงไม่ให้คำตอบชัดเจน ก็ควรทำทุกอย่างที่ทำได้เพื่อดันเขาออกในการเลือกตั้งขั้นต้น “สายกลาง” ทุกคนสุดท้ายจะขายคุณให้กับ แพนอปติคอน
    • ลองถาม Tom S. แห่ง California ดูก็จะรู้ว่าการใช้จ่ายแบบนั้นรับประกันอะไรได้บ้าง
      เรื่องเร่งด่วนกว่านั้นคือการแก้กระบวนการเลือกตั้งที่พังแล้ว อย่างใน California ที่ตอนนี้ใช้เวลามากกว่า 30 วันในการ “นับ” คะแนนเสียง