เรากระจายศูนย์กันมากแค่ไหนแล้ว?

(arewedecentralizedyet.online)

2 คะแนน โดย GN⁺ 2025-08-31 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

เว็บไซต์นี้ใช้วัดว่าข้อมูลผู้ใช้มีการกระจุกตัวมากน้อยเพียงใดใน Fediverse (Mastodon, Pixelfed เป็นต้น) และ Atmosphere (Bluesky, WhiteWind เป็นต้น)
ใช้ Herfindahl–Hirschman Index (HHI) และ Shannon Index เพื่อวิเคราะห์ระดับการกระจายตัวของผู้ใช้ระหว่างเซิร์ฟเวอร์
HHI เป็นดัชนีที่ใช้วัดระดับการแข่งขันในทางเศรษฐศาสตร์ โดยค่ายิ่งต่ำยิ่งแปลว่ามีการกระจายตัวสูง และค่ายิ่งสูงยิ่งหมายถึงการกระจุกตัวแบบผูกขาด
Shannon Index เป็นดัชนีความหลากหลายที่อิงกับเอนโทรปี โดยค่ายิ่งสูงยิ่งหมายความว่าประชากรถูกกระจายอย่างสม่ำเสมอระหว่างเซิร์ฟเวอร์
โปรเจ็กต์นี้นอกจากจะดูระดับการกระจุกตัวของข้อมูลแล้ว ยังพิจารณาปัจจัยการวัดความกระจายศูนย์ด้านอื่น ๆ เช่น โครงสร้างเครือข่าย เขตอำนาจศาลทางกฎหมาย และการกระจุกตัวของอำนาจทางสังคม พร้อมเปิดเผยข้อมูลและโค้ดบน GitHub

บทนำและแนวคิดหลัก

ใช้ Herfindahl–Hirschman Index (HHI) เพื่อวัดว่าข้อมูลผู้ใช้มีการกระจุกตัวมากเพียงใดบนแพลตฟอร์ม Fediverse และ Atmosphere
HHI เป็นดัชนีมาตรฐานที่ใช้ประเมินระดับการแข่งขันในเชิงเศรษฐศาสตร์ โดยคำนวณจากผลรวมของกำลังสองของสัดส่วนผู้ใช้ที่แต่ละเซิร์ฟเวอร์ (หรือ PDS) ครองอยู่
หากค่า HHI ใกล้ 0 หมายความว่าผู้ใช้กระจายตัวอย่างสม่ำเสมอไปยังหลายเซิร์ฟเวอร์ และหากค่าใกล้ 10,000 จะบ่งชี้ว่าผู้ใช้ส่วนใหญ่กระจุกอยู่ที่เซิร์ฟเวอร์เดียวในภาวะผูกขาด
โดยทั่วไป HHI ต่ำกว่า 100 ถือว่า "แข่งขันสูงมาก", ต่ำกว่า 1,500 ถือว่า "ไม่กระจุกตัว", และ 2,500 ขึ้นไปถือว่า "กระจุกตัวสูง"

วิธีการวัดและนิยามของข้อมูล

สิ่งที่ใช้วัดคือ เซิร์ฟเวอร์ (อินสแตนซ์) ของ Fediverse และ PDS (Personal Data Server) ของ Atmosphere
สำหรับแพลตฟอร์มอย่าง Mastodon ที่ผู้ใช้กระจายอยู่หลายอินสแตนซ์ จะรวม อินสแตนซ์ที่เป็นของผู้ให้บริการรายเดียวกัน เข้าด้วยกัน
- ตัวอย่าง: mastodon.social และ mastodon.online ดำเนินการโดยบริษัทเดียวกัน จึงถูกรวมในการประมวลผลสถิติเดียวกัน
- PDS ทั้งหมดที่บริหารโดย Bluesky Social PBC ก็ถูกนับรวมเป็นหนึ่งเดียวเช่นกัน
วิธีนี้ช่วยสะท้อนขนาดของผู้ใช้ที่อยู่ภายใต้การควบคุมของนิติบุคคลเดียวกันได้อย่างแม่นยำ

มุมมองที่หลากหลายต่อการวัดความรวมศูนย์

นอกจากการกระจายตัวทางกายภาพของข้อมูลผู้ใช้แล้ว ยังสามารถวิเคราะห์ความกระจายศูนย์ได้จากอีกหลายมิติ
- มิติด้านโครงสร้างเครือข่าย (เช่น P2P, relay เป็นต้น)
- วิธีการจัดการตัวตน
- ความเป็นเจ้าของและที่ตั้งของโครงสร้างพื้นฐานจริง (ภูมิภาค เขตอำนาจศาล เป็นต้น)
- การกระจุกตัวของอำนาจทางสังคมและองค์กร (เช่น ปรากฏการณ์การรวมศูนย์ของอิทธิพลภายในแพลตฟอร์ม)
สิ่งสำคัญไม่ใช่แค่การกระจายของข้อมูลภายในแพลตฟอร์มเท่านั้น แต่ยังรวมถึงการกระจายอำนาจและอิทธิพลด้วย

การมีส่วนร่วมในโปรเจ็กต์และโอเพนซอร์ส

โค้ดและชุดข้อมูลทั้งหมดที่ใช้ในการวัดเปิดเผยอยู่ใน GitHub repository
ยินดีต้อนรับ การมีส่วนร่วม คอมเมนต์ ข้อเสนอแนะตัวชี้วัดใหม่ รวมถึงการเพิ่มตัวชี้วัดด้าน resiliency

2 ความคิดเห็น

codject 2025-08-31

คำว่า 'พวกเรายังถูกกระจายศูนย์แล้วหรือยัง?' ก็ไม่ถึงกับผิดนัก แต่ฟังไม่เป็นธรรมชาติและค่อนข้างขัดหูนะครับ
เพราะคำว่า 'ยัง' มักใช้คู่กับ 'ประโยคปฏิเสธ' เป็นหลัก...

ผมเลยคิดว่าการแปลแบบ "การกระจายศูนย์ยังมาไม่ถึงหรือ?" น่าจะเป็นชื่อเรื่องที่ฟังเป็นธรรมชาติมากกว่านะครับ

GN⁺ 2025-08-31

ความเห็นจาก Hacker News

วันนี้เพิ่งได้รู้จัก Herfindahl–Hirschman Index เป็นครั้งแรก เลยอยากลองทดสอบกับกรณีแปลก ๆ ที่น่าจดจำ
ช่วงปลายทศวรรษ 1980 มีอยู่ช่วงหนึ่งที่ Microsoft มีส่วนแบ่งตลาดสเปรดชีตบน Macintosh เกิน 100%
ที่เป็นไปได้ก็เพราะวิธีคำนวณส่วนแบ่งตลาดคือเอายอดขายของผู้เล่นแต่ละรายในช่วงเวลาหนึ่งหารด้วยยอดขายรวมของทั้งตลาด และตอนนั้นสเปรดชีต Lotus Jazz ของ Lotus ล้มเหลวหนักจนจำนวนสินค้าที่ถูกส่งคืนมากกว่ายอดขาย
ผลลัพธ์คือ Lotus มีส่วนแบ่งตลาดติดลบ และยอดขายของ Microsoft Excel กลับมากกว่ายอดขายรวมของทั้งตลาด จึงออกมาเป็นส่วนแบ่งเกิน 100%
จำตัวเลขเป๊ะ ๆ ไม่ได้ แต่ประมาณว่า Microsoft 102%, Lotus -2%
ในกรณีนี้ Herfindahl–Hirschman Index จะเป็น 1022 + (-2)2 = 10404 + 4 = 10408
ในกรณีสุดโต่งแบบนี้ HHI อาจเกิน 10,000 ได้
(เพิ่มเงื่อนไข "ภายในช่วงเวลาหนึ่ง" เพื่อให้คำอธิบายชัดเจน)
- พยายามค้นหาบทความที่เกี่ยวข้องทางออนไลน์อย่างหนักแต่ก็หาไม่เจอ (อาจจะอยู่บนไมโครฟิล์มที่ไหนสักแห่ง...)
  แต่กลับเจอเกร็ดสนุก ๆ เรื่องหนึ่ง
  มีผู้บริหารของ Lotus พูดติดตลกว่า “เดือนแรกเราส่งออกไป 62,000 ชุด และเดือนถัดมามีของถูกส่งคืน 64,000 ชุด แม้แต่ของเถื่อนยังถูกเอามาคืนเลย”
  บทความที่เกี่ยวข้องใน Forbes
- HHI เป็นตัวชี้วัดที่มีประโยชน์มาก
  แนวคิดเรื่องผลรวมของกำลังสองของส่วนแบ่งที่ถูกทำให้เป็นมาตรฐานนั้นใช้ได้ดีไม่ใช่แค่กับส่วนแบ่งตลาด แต่กับสถานการณ์อีกหลายแบบด้วย
  มีตัวอย่างที่ใช้กับการลงคะแนนเสียงได้ดีมากเช่นกัน
ผลลัพธ์น่าสนใจ แต่ก็ไม่ถึงกับน่าแปลกใจ
BlueSky เป็นบริการที่แทบจะใช้แทน Twitter ได้สำหรับผู้ใช้ทั่วไป
จำนวนผู้ใช้รวมของ Mastadon อาจน้อยกว่า แต่ก็ดูน่ายินดีที่ระบบนิเวศของ Mastadon หลีกเลี่ยงการรวมศูนย์ได้มากกว่าระบบนิเวศ AT-Proto
ส่วนตัวคาดว่าต้นทุนการรันเซิร์ฟเวอร์/รีเลย์ของ AT proto น่าจะเป็นภาระพอสมควรสำหรับผู้ให้บริการรายเล็ก แต่ก็เป็นแค่การคาดเดาโดยที่ผมไม่ได้รู้โครงสร้างภายในของทั้งสองระบบลึกพอ
- การรันเซิร์ฟเวอร์ PDS สำหรับตัวเองกับเพื่อนอีกไม่กี่คนไม่ได้แพงมาก
  แต่การทำแบบนั้นก็ไม่ได้มีข้อดีมากนัก เพราะจุดประสงค์ของ PDS คือการแยกข้อมูลของตัวเองออกจากข้อมูลของทั้งเครือข่ายอย่างเป็นระเบียบ
  สิ่งที่แพงใน ATProto คือ Relay (รวบรวม/กระจายข้อมูลทั้งหมด) และ AppView (เก็บโพสต์ ไลก์ ฯลฯ ทั้งหมดลงฐานข้อมูลและตอบสนองคำขอของผู้ใช้)
  แน่นอนว่าเครือข่ายขนาดเล็ก เช่น ที่ใช้สำหรับโพสต์ยาวแบบ WhiteWind สามารถทำได้สบาย เพราะจำนวนอีเวนต์ที่เกิดขึ้นมีไม่มาก
  ระบบส่วนใหญ่ถูกออกแบบมาให้ไม่จำเป็นต้องโฮสต์เอง
  คุณสามารถทำฟีดอัลกอริทึมหรือฟรอนต์เอนด์ของตัวเองได้โดยดึงข้อมูลจาก Relay หรือ AppView ที่ Bluesky เป็นผู้รัน
- ผมคิดว่าหนึ่งในเหตุผลที่ BlueSky ประสบความสำเร็จคือมันไม่ได้ชูเรื่อง 'ความกระจายศูนย์' ให้ผู้ใช้เหมือน Mastodon
  ผู้ใช้ส่วนใหญ่ไม่รู้ด้วยซ้ำว่าการกระจายศูนย์คืออะไร และก็ไม่ได้อยากรู้
  ผมคิดว่าควรทุ่มแรงไปกับการดำเนินงานและเครื่องมือจัดการที่ดีกว่า มากกว่าจะเน้นเรื่องการกระจายศูนย์
- ATProto ได้รับการสนับสนุนจากบริษัทและนักลงทุนหลากหลายกลุ่ม
  สักวันหนึ่งพวกเขาก็ต้องการผลตอบแทน และยากจะคาดเดาว่ามันจะเกิดขึ้นในรูปแบบไหน
- เรื่องการถกเถียงเรื่องต้นทุนการดำเนินงานนั้น ATProto มีโครงสร้างที่ต่างออกไปมาก
  Mastodon เป็นลักษณะที่เซิร์ฟเวอร์เดี่ยว ๆ หลายตัวซึ่งคล้าย Twitter ต่างคนต่างทำงานและแลกเปลี่ยนข้อมูลกันเหมือนอีเมล ดังนั้นเซิร์ฟเวอร์เล็ก ๆ สำหรับกลุ่มคนรู้จักจึงมีต้นทุนต่ำ
  แต่โครงสร้างแบบนี้เชื่อมต่อกับเครือข่ายระดับโลกได้น้อยกว่า และเซิร์ฟเวอร์ของฉันก็คือตัวตนของฉัน
  ถ้าคุณติดตามผู้ใช้จากเซิร์ฟเวอร์อื่น เซิร์ฟเวอร์ของคุณก็จะไปขอข้อมูลจากเซิร์ฟเวอร์นั้น แต่โดยพื้นฐานแล้วมุมมองของทั้งเครือข่ายยังคงแตกเป็นเสี่ยง ๆ
  ATProto ถูกแบ่งองค์ประกอบต่างออกไปตั้งแต่แรกเพื่อให้แข่งขันกับบริการแบบรวมศูนย์ได้ โดยแยกแหล่งกำเนิดข้อมูลออกจากการรวมข้อมูลในระดับแอปพลิเคชัน
  มันคล้าย ๆ กับการที่ผู้ใช้ทุกคนโพสต์ JSON ไว้บนเว็บไซต์ของตัวเอง (url) แล้วแอปรวบรวมข้อมูลนั้น
  ผลคือทุกคนได้เห็นมุมมองเดียวกันทั้งหมด (มีคอมเมนต์ ไลก์ และการตอบกลับครบเหมือนกัน)
  Mastodon มี 'อินสแตนซ์' หนึ่งตัวเป็นเว็บแอปแบบ Twitter ที่ทำงานได้ด้วยตัวเอง ขณะที่ ATProto มี primitive แบบกระจายหลายชนิด
  - PDS เป็นที่เก็บข้อมูลที่ไม่ผูกกับแอป ต้นทุนรันเองต่ำมาก (ต่ำกว่า 1 ดอลลาร์ต่อผู้ใช้ต่อเดือน), มี implementation แบบโอเพนซอร์ส และคล้ายกับ Git hosting
  - AppView ทำหน้าที่เป็นแบ็กเอนด์ของแอปจริง ๆ หากจะรัน Bluesky AppView ที่ ingest ข้อมูลของทั้งเครือข่าย จะมีค่าใช้จ่ายราว $300 ต่อเดือน
    AppView ที่ดูเพียงบางส่วนของเครือข่ายแบบ Mastodon จะถูกกว่ามาก แต่ไม่น่าสนใจพอจึงแทบไม่มีใครใช้
  - Relay ใช้เชื่อม PDS หลายตัวกับ AppView และปรับให้เหมาะกับการกระจายข้อมูล หลัง Sync 1.1 ค่าใช้จ่ายลดลงมากจนอยู่ที่ราว $30 ต่อเดือน
    สรุปคือ การรัน PDS กับ Relay นั้นถูก แต่การรัน AppView เต็มรูปแบบมีต้นทุนสูง และ Mastodon ก็ไม่มีแนวคิดที่เทียบกันตรง ๆ อยู่แล้ว
    การเอาประสบการณ์ที่แตกเป็นเสี่ยงของ Mastodon มาเทียบราคาแบบตรง ๆ กับประสบการณ์ที่สม่ำเสมอของ ATProto จึงไม่ค่อยสมเหตุสมผล
    การรัน partial AppView แบบ Mastodon นั้นราคาถูก แต่แทบไม่มีเสน่ห์เชิงใช้งานจริง
    อีกอย่าง Mastodon กำลังพยายามบรรเทาปัญหานี้บางส่วนด้วย on-demand fetching แต่ระบบกระจายแบบ pull ก็มีข้อจำกัดในตัวเอง
    คำถามที่เกี่ยวข้อง
ท้ายที่สุด แม้แต่ระบบกระจายก็ยังมีแนวโน้มจะเกิดการรวมศูนย์ตามธรรมชาติ
Git ก็เป็นความพยายามแบบกระจาย แต่ในทางปฏิบัติก็ไปกระจุกอยู่ที่แพลตฟอร์มอย่าง GitHub หรือ GitLab
BitTorrent เองก็เป็นแบบกระจาย แต่เว็บ tracker กลับทำหน้าที่เป็นศูนย์กลางตามธรรมชาติ
Bitcoin ก็เช่นกัน สุดท้ายบริการบางรายอย่าง Coinbase กลายเป็นจุดศูนย์กลาง
แม้แต่อีเมล (SMTP) ก็มีลักษณะรวมศูนย์โดยพฤตินัยเพราะปัญหาสแปม
- สำหรับอีเมล (SMTP) นั้น การบอกว่า "มีแต่ผู้เล่นรายใหญ่เท่านั้นที่กรองสแปมได้" ไม่จริง
  มีรายชื่อกรองสแปมแบบกระจายที่ใช้กันมานานแล้ว และผู้ให้บริการรายใหญ่ก็ไม่ได้มีความได้เปรียบพิเศษด้านการกรองสแปมเสมอไป
  เพียงแต่ผู้เล่นรายใหญ่มักมีแนวโน้มจะมองว่าเมลเซิร์ฟเวอร์เล็ก ๆ เป็นสแปม และอาจมีเจตนาจะกดคู่แข่งจริงด้วย
  แต่ถึงอย่างนั้นก็ไม่ได้หมายความว่าแค่ตั้งค่า reverse DNS กับ DKIM ให้ถูก เมลจะไม่มีวันถูกจัดเป็นสแปม และแม้แต่บริการใหญ่ ๆ เองก็ยังอาจมองกันและกันเป็นสแปมได้ จึงไม่มีอะไรเด็ดขาด
- เว็บ tracker มีอยู่หลายแห่ง และถ้าหายไปก็จะมีตัวใหม่ขึ้นมาแทนอย่างรวดเร็ว
  ดังนั้นจึงยังถือว่าเป็นระบบกระจายได้ เพราะไม่มีผู้เล่นรายเดียวที่ควบคุมระบบนิเวศทั้งหมด
- บริการอย่าง Coinbase ใครก็สร้างได้
  ในความเป็นจริงก็มีเว็บไซต์คล้าย ๆ กันมากมาย และตอนนี้ก็ใช้ PayPal ได้แล้ว
  ไม่จำเป็นต้องพึ่งบริการเดียวด้วยซ้ำ เช่น คุณจะซื้อบิตคอยน์ผ่าน PayPal แล้วไปขายบน Coinbase ก็ยังได้
  ผมคิดว่าการนิยามสถานการณ์แบบนี้ว่าเป็นการรวมศูนย์ก็ดูแปลกอยู่เหมือนกัน
- จริง ๆ แล้ว Git เองก็ไม่ได้เป็นเครื่องมือที่มีเป้าหมายเพื่อการกระจายศูนย์ด้วย มีประเด็นนั้นอยู่เหมือนกัน
- ตัวอย่างทั้งหมดที่พูดถึงก็ล้วนมีองค์ประกอบของการรวมศูนย์อยู่ดี
ใน fedi มันกระจายศูนย์มากกว่าก็จริง แต่ยังขาดเรื่องความสม่ำเสมอ
นี่คือสิ่งที่ผู้ใช้ที่เพิ่งเข้ามาใน fedi บ่นมากที่สุด
ส่วนตัวผมมองว่านี่เป็นก้าวกระโดดใหญ่และก็โอเคกับมัน แต่การตั้งความคาดหวังให้สมจริงสำคัญกว่า
- อยากรู้ว่าคำว่า consistency ในที่นี้หมายถึงอะไรแน่ (ผมไม่เคยใช้ fediverse เลยไม่มีบริบท)
ผมสงสัยว่าระบบแบบ federated รุ่นเก่าอย่าง IRC หรือ NNTP จะวัดด้วยวิธีแบบ HHI ได้อย่างไร
ชวนให้อยากรู้ว่าระบบยุคก่อนจะออกมาเป็นอย่างไรเมื่อวัดด้วยตัวชี้วัดแบบนี้
- มีกรณีที่พอ freenode เปลี่ยนเจ้าของ ทุกคนก็ย้ายออกแทบหมดภายในเวลาเกือบหนึ่งสัปดาห์
  ความน่าสนใจคือมันแสดงให้เห็นว่าการย้ายถิ่นทำได้ง่ายและเกิดขึ้นได้จริง
- ในสภาพแวดล้อมขนาดเล็กและกึ่งส่วนตัว IRC ที่มี scroll-back ผ่านเว็บฟรอนต์เอนด์ยังคงยอดเยี่ยมมาก
  แต่พอขยายใหญ่เกินไป มันก็เริ่มพังเพราะการเมืองและความต่างทางวัฒนธรรม
  ถ้าคนที่แนวคิดคล้ายกันมาอยู่รวมกัน มันทำงานได้ดีมาก แต่ถ้าเปิดสาธารณะเต็มตัวก็จะเจอความเห็นต่าง, โทรล, ปัญหาบอต AI ฯลฯ
  คุณสามารถทำเว็บอินเทอร์เฟซแบบกึ่งส่วนตัว พร้อมการยืนยันตัวตนง่าย ๆ และบล็อก referrer เพื่อป้องกันภัยคุกคามด้านความปลอดภัย ความปั่นป่วน และบอตของบุคคลที่สามได้
  NNTP ก็ใช้ได้เหมือนกัน แต่การมิเรอร์กลุ่มไบนารีทั้งหมดแยกเป็นรายกลุ่มไม่ใช่เรื่องง่าย และเพราะ ISP ส่วนใหญ่ไม่รองรับแล้ว คนจำนวนมากจึงใช้ commercial news feed หรือผู้ให้บริการ Usenet ฟรีแทน
  การทำ peering กับผู้ให้บริการฟรีบางรายเพื่อลดความเสี่ยงด้านการเซ็นเซอร์ก็น่าจะดี
  ทั้ง IRC และ NNTP เปิดให้คนทั่วไปสร้าง linked server ของตัวเองแบบ private หรือ semi-private ได้
  ข้อมูลที่เกี่ยวข้อง
- ถ้าคิดในเชิงคณิตศาสตร์ก็คำนวณได้ไม่ยาก และดูสถิติเครือข่ายที่เกี่ยวข้องได้ที่ netsplit.de
ถ้าเพิ่ม Nostr เข้าไปใน distribution แบบ HHI นี้ก็น่าจะน่าสนใจ
ใน Nostr การกระจุกตัวของฐานผู้ใช้มักถูกมองว่าเป็นจุดอ่อนหลักของโมเดลแบบ fedi แต่กรณีของ Nostr อาจออกมาแปลกอยู่บ้าง เพราะตัวตนของผู้ใช้ไม่ได้อยู่บน relay เดียว
- เพราะไคลเอนต์ Nostr ส่วนใหญ่ส่งข้อมูลไปยังหลาย relay และตัวบัญชีเองก็คือคู่กุญแจสาธารณะของอุปกรณ์ผู้ใช้นั่นเอง
ผมคิดว่าปัญหาเรื่องรวมศูนย์/กระจายศูนย์พวกนี้สุดท้ายแล้วมักเป็นเรื่องของการตลาดกับ UX อยู่ดี
ถ้า Threads ถูกรวมเข้า Fediverse ก็คงน่าสนใจว่าจะเกิดการเปลี่ยนแปลงอะไรบ้าง
- Threads เองก็มีการควบคุมความเป็นส่วนตัวที่แข็งแรงกว่าในลักษณะ opt-in แต่สุดท้ายผมคิดว่าก็ยังมองได้ว่าเป็นหนึ่งใน "เซิร์ฟเวอร์ที่ครอบครองข้อมูลผู้ใช้" ใน Fediverse อยู่ดี
การรักษาสมดุลให้ดีเป็นเรื่องสำคัญ
ถ้ากระจายศูนย์เกินไปก็ไม่มีใครหาเจอ แต่ถ้ารวมศูนย์เกินไป เสรีภาพก็หายไปเพราะการเซ็นเซอร์
- ส่วนตัวผมสงสัยว่าการค้นพบเนื้อหาในสภาพแวดล้อมแบบกระจายศูนย์นั้นเป็นไปไม่ได้จริงหรือ
  ถ้าทุ่มทรัพยากรให้การทำดัชนีมากพอ (เงิน, คน ฯลฯ) จุดสมดุลนั้นอาจคงอยู่ได้อย่างไม่เสถียร เหมือนการตั้งลูกตุ้มกลับหัว
  ในยุคทองของบล็อกก็เคยมีความกลมกลืนระหว่าง search engine (ศูนย์กลาง) กับบล็อก/ฟอรัม (รายบุคคล) แต่เมื่อเวลาผ่านไป สิ่งนั้นก็อ่อนแรงลงเพราะสแปมและการรวมศูนย์เข้าสู่แพลตฟอร์มใหญ่
- อยากชี้ให้เห็นว่าแนวคิดนี้เริ่มจากการสมมติว่า ฟังก์ชัน 'การค้นพบ' จำเป็นต้องมีองค์ประกอบแบบรวมศูนย์เสมอ
- ในทางเศรษฐศาสตร์ ค่า HHI ต่ำกว่า 100 ถือว่า 'แข่งขันสูง', ต่ำกว่า 1500 คือ 'ไม่กระจุกตัว', และ 2500 ขึ้นไปคือ 'กระจุกตัวสูง'
  Fediverse อยู่เกือบสุดทางซ้ายแล้วแต่ก็ยังได้ 690
  ส่วนการรวมศูนย์เต็มรูปแบบ (ขึ้นไปด้านบนสุดเลย) คือ 5000
  ในความเป็นจริง กำลังแสดงสเกลแบบไม่เชิงเส้นให้ดูเป็นเชิงเส้นอยู่
- ผมอยากได้ทางเลือกที่ผู้ใช้เลือกได้จริง
  อยากให้เป็นแบบที่ผู้ใช้เลือกเองได้ว่าจะใช้แบบรวมศูนย์ แบบกระจายศูนย์ หรือแบบไฮบริด
- ถ้ามีคำวิจารณ์ว่า "มันกระจายเกินไป" องค์กรไม่แสวงหากำไรอาจสร้างดัชนีที่เปิดให้โฮสต์สาธารณะมาลงทะเบียนกันเอง เพื่อให้ค้นหาเนื้อหาแบบกระจายทั้งหมดได้
  แบบนี้ก็น่าจะแก้ปัญหาเรื่องการค้นหาได้
  สุดท้าย Facebook เองอาจพยายามดึงข้อมูลลักษณะนี้ผ่าน Threads ก็เป็นได้
ตัวชี้วัด HHI เองก็ดูใหม่และเข้าใจง่ายดี
ถ้าย่อสเกลให้เหลือ 0~100 (หารด้วย 100) ตัวเลขก็น่าจะดูเข้าใจง่ายขึ้น
และอาจพิจารณากลับด้านให้ 0 หมายถึงรวมศูนย์ และ 100 หมายถึงกระจายเต็มที่ด้วย
เพราะจากชื่อบนหน้าแรกมันให้ความรู้สึกเหมือนกำลังวัด 'ความคืบหน้า' ไปสู่การกระจายศูนย์ ถ้าทำแบบนั้นก็น่าจะเข้าใจง่ายกว่า
- แต่เหตุผลที่ไม่ normalize เป็น 0~100 ก็อาจเป็นเพราะไม่อยากให้คนรับรู้ตัวเลขนี้แบบเชิงเส้น
  ถ้าเห็นคะแนน 2500 คนจะสงสัยว่ามันหมายถึงอะไร แต่ถ้าออกมาเป็น 25/100 ความรู้สึกว่าเป็น 'การกระจุกตัวสูง' อาจลดลง