2 คะแนน โดย GN⁺ 2025-08-31 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • เว็บไซต์นี้ใช้วัดว่าข้อมูลผู้ใช้มีการกระจุกตัวมากน้อยเพียงใดใน Fediverse (Mastodon, Pixelfed เป็นต้น) และ Atmosphere (Bluesky, WhiteWind เป็นต้น)
  • ใช้ Herfindahl–Hirschman Index (HHI) และ Shannon Index เพื่อวิเคราะห์ระดับการกระจายตัวของผู้ใช้ระหว่างเซิร์ฟเวอร์
  • HHI เป็นดัชนีที่ใช้วัดระดับการแข่งขันในทางเศรษฐศาสตร์ โดยค่ายิ่งต่ำยิ่งแปลว่ามีการกระจายตัวสูง และค่ายิ่งสูงยิ่งหมายถึงการกระจุกตัวแบบผูกขาด
  • Shannon Index เป็นดัชนีความหลากหลายที่อิงกับเอนโทรปี โดยค่ายิ่งสูงยิ่งหมายความว่าประชากรถูกกระจายอย่างสม่ำเสมอระหว่างเซิร์ฟเวอร์
  • โปรเจ็กต์นี้นอกจากจะดูระดับการกระจุกตัวของข้อมูลแล้ว ยังพิจารณาปัจจัยการวัดความกระจายศูนย์ด้านอื่น ๆ เช่น โครงสร้างเครือข่าย เขตอำนาจศาลทางกฎหมาย และการกระจุกตัวของอำนาจทางสังคม พร้อมเปิดเผยข้อมูลและโค้ดบน GitHub

บทนำและแนวคิดหลัก

  • ใช้ Herfindahl–Hirschman Index (HHI) เพื่อวัดว่าข้อมูลผู้ใช้มีการกระจุกตัวมากเพียงใดบนแพลตฟอร์ม Fediverse และ Atmosphere
  • HHI เป็นดัชนีมาตรฐานที่ใช้ประเมินระดับการแข่งขันในเชิงเศรษฐศาสตร์ โดยคำนวณจากผลรวมของกำลังสองของสัดส่วนผู้ใช้ที่แต่ละเซิร์ฟเวอร์ (หรือ PDS) ครองอยู่
  • หากค่า HHI ใกล้ 0 หมายความว่าผู้ใช้กระจายตัวอย่างสม่ำเสมอไปยังหลายเซิร์ฟเวอร์ และหากค่าใกล้ 10,000 จะบ่งชี้ว่าผู้ใช้ส่วนใหญ่กระจุกอยู่ที่เซิร์ฟเวอร์เดียวในภาวะผูกขาด
  • โดยทั่วไป HHI ต่ำกว่า 100 ถือว่า "แข่งขันสูงมาก", ต่ำกว่า 1,500 ถือว่า "ไม่กระจุกตัว", และ 2,500 ขึ้นไปถือว่า "กระจุกตัวสูง"

วิธีการวัดและนิยามของข้อมูล

  • สิ่งที่ใช้วัดคือ เซิร์ฟเวอร์ (อินสแตนซ์) ของ Fediverse และ PDS (Personal Data Server) ของ Atmosphere
  • สำหรับแพลตฟอร์มอย่าง Mastodon ที่ผู้ใช้กระจายอยู่หลายอินสแตนซ์ จะรวม อินสแตนซ์ที่เป็นของผู้ให้บริการรายเดียวกัน เข้าด้วยกัน
    • ตัวอย่าง: mastodon.social และ mastodon.online ดำเนินการโดยบริษัทเดียวกัน จึงถูกรวมในการประมวลผลสถิติเดียวกัน
    • PDS ทั้งหมดที่บริหารโดย Bluesky Social PBC ก็ถูกนับรวมเป็นหนึ่งเดียวเช่นกัน
  • วิธีนี้ช่วยสะท้อนขนาดของผู้ใช้ที่อยู่ภายใต้การควบคุมของนิติบุคคลเดียวกันได้อย่างแม่นยำ

มุมมองที่หลากหลายต่อการวัดความรวมศูนย์

  • นอกจากการกระจายตัวทางกายภาพของข้อมูลผู้ใช้แล้ว ยังสามารถวิเคราะห์ความกระจายศูนย์ได้จากอีกหลายมิติ
    • มิติด้านโครงสร้างเครือข่าย (เช่น P2P, relay เป็นต้น)
    • วิธีการจัดการตัวตน
    • ความเป็นเจ้าของและที่ตั้งของโครงสร้างพื้นฐานจริง (ภูมิภาค เขตอำนาจศาล เป็นต้น)
    • การกระจุกตัวของอำนาจทางสังคมและองค์กร (เช่น ปรากฏการณ์การรวมศูนย์ของอิทธิพลภายในแพลตฟอร์ม)
  • สิ่งสำคัญไม่ใช่แค่การกระจายของข้อมูลภายในแพลตฟอร์มเท่านั้น แต่ยังรวมถึงการกระจายอำนาจและอิทธิพลด้วย

การมีส่วนร่วมในโปรเจ็กต์และโอเพนซอร์ส

  • โค้ดและชุดข้อมูลทั้งหมดที่ใช้ในการวัดเปิดเผยอยู่ใน GitHub repository
  • ยินดีต้อนรับ การมีส่วนร่วม คอมเมนต์ ข้อเสนอแนะตัวชี้วัดใหม่ รวมถึงการเพิ่มตัวชี้วัดด้าน resiliency

2 ความคิดเห็น

 
codject 2025-08-31

คำว่า 'พวกเรายังถูกกระจายศูนย์แล้วหรือยัง?' ก็ไม่ถึงกับผิดนัก แต่ฟังไม่เป็นธรรมชาติและค่อนข้างขัดหูนะครับ
เพราะคำว่า 'ยัง' มักใช้คู่กับ 'ประโยคปฏิเสธ' เป็นหลัก...

ผมเลยคิดว่าการแปลแบบ "การกระจายศูนย์ยังมาไม่ถึงหรือ?" น่าจะเป็นชื่อเรื่องที่ฟังเป็นธรรมชาติมากกว่านะครับ

 
GN⁺ 2025-08-31
ความเห็นจาก Hacker News
  • วันนี้เพิ่งได้รู้จัก Herfindahl–Hirschman Index เป็นครั้งแรก เลยอยากลองทดสอบกับกรณีแปลก ๆ ที่น่าจดจำ
    ช่วงปลายทศวรรษ 1980 มีอยู่ช่วงหนึ่งที่ Microsoft มีส่วนแบ่งตลาดสเปรดชีตบน Macintosh เกิน 100%
    ที่เป็นไปได้ก็เพราะวิธีคำนวณส่วนแบ่งตลาดคือเอายอดขายของผู้เล่นแต่ละรายในช่วงเวลาหนึ่งหารด้วยยอดขายรวมของทั้งตลาด และตอนนั้นสเปรดชีต Lotus Jazz ของ Lotus ล้มเหลวหนักจนจำนวนสินค้าที่ถูกส่งคืนมากกว่ายอดขาย
    ผลลัพธ์คือ Lotus มีส่วนแบ่งตลาดติดลบ และยอดขายของ Microsoft Excel กลับมากกว่ายอดขายรวมของทั้งตลาด จึงออกมาเป็นส่วนแบ่งเกิน 100%
    จำตัวเลขเป๊ะ ๆ ไม่ได้ แต่ประมาณว่า Microsoft 102%, Lotus -2%
    ในกรณีนี้ Herfindahl–Hirschman Index จะเป็น 1022 + (-2)2 = 10404 + 4 = 10408
    ในกรณีสุดโต่งแบบนี้ HHI อาจเกิน 10,000 ได้
    (เพิ่มเงื่อนไข "ภายในช่วงเวลาหนึ่ง" เพื่อให้คำอธิบายชัดเจน)

    • พยายามค้นหาบทความที่เกี่ยวข้องทางออนไลน์อย่างหนักแต่ก็หาไม่เจอ (อาจจะอยู่บนไมโครฟิล์มที่ไหนสักแห่ง...)
      แต่กลับเจอเกร็ดสนุก ๆ เรื่องหนึ่ง
      มีผู้บริหารของ Lotus พูดติดตลกว่า “เดือนแรกเราส่งออกไป 62,000 ชุด และเดือนถัดมามีของถูกส่งคืน 64,000 ชุด แม้แต่ของเถื่อนยังถูกเอามาคืนเลย”
      บทความที่เกี่ยวข้องใน Forbes

    • HHI เป็นตัวชี้วัดที่มีประโยชน์มาก
      แนวคิดเรื่องผลรวมของกำลังสองของส่วนแบ่งที่ถูกทำให้เป็นมาตรฐานนั้นใช้ได้ดีไม่ใช่แค่กับส่วนแบ่งตลาด แต่กับสถานการณ์อีกหลายแบบด้วย
      มีตัวอย่างที่ใช้กับการลงคะแนนเสียงได้ดีมากเช่นกัน

  • ผลลัพธ์น่าสนใจ แต่ก็ไม่ถึงกับน่าแปลกใจ
    BlueSky เป็นบริการที่แทบจะใช้แทน Twitter ได้สำหรับผู้ใช้ทั่วไป
    จำนวนผู้ใช้รวมของ Mastadon อาจน้อยกว่า แต่ก็ดูน่ายินดีที่ระบบนิเวศของ Mastadon หลีกเลี่ยงการรวมศูนย์ได้มากกว่าระบบนิเวศ AT-Proto
    ส่วนตัวคาดว่าต้นทุนการรันเซิร์ฟเวอร์/รีเลย์ของ AT proto น่าจะเป็นภาระพอสมควรสำหรับผู้ให้บริการรายเล็ก แต่ก็เป็นแค่การคาดเดาโดยที่ผมไม่ได้รู้โครงสร้างภายในของทั้งสองระบบลึกพอ

    • การรันเซิร์ฟเวอร์ PDS สำหรับตัวเองกับเพื่อนอีกไม่กี่คนไม่ได้แพงมาก
      แต่การทำแบบนั้นก็ไม่ได้มีข้อดีมากนัก เพราะจุดประสงค์ของ PDS คือการแยกข้อมูลของตัวเองออกจากข้อมูลของทั้งเครือข่ายอย่างเป็นระเบียบ
      สิ่งที่แพงใน ATProto คือ Relay (รวบรวม/กระจายข้อมูลทั้งหมด) และ AppView (เก็บโพสต์ ไลก์ ฯลฯ ทั้งหมดลงฐานข้อมูลและตอบสนองคำขอของผู้ใช้)
      แน่นอนว่าเครือข่ายขนาดเล็ก เช่น ที่ใช้สำหรับโพสต์ยาวแบบ WhiteWind สามารถทำได้สบาย เพราะจำนวนอีเวนต์ที่เกิดขึ้นมีไม่มาก
      ระบบส่วนใหญ่ถูกออกแบบมาให้ไม่จำเป็นต้องโฮสต์เอง
      คุณสามารถทำฟีดอัลกอริทึมหรือฟรอนต์เอนด์ของตัวเองได้โดยดึงข้อมูลจาก Relay หรือ AppView ที่ Bluesky เป็นผู้รัน

    • ผมคิดว่าหนึ่งในเหตุผลที่ BlueSky ประสบความสำเร็จคือมันไม่ได้ชูเรื่อง 'ความกระจายศูนย์' ให้ผู้ใช้เหมือน Mastodon
      ผู้ใช้ส่วนใหญ่ไม่รู้ด้วยซ้ำว่าการกระจายศูนย์คืออะไร และก็ไม่ได้อยากรู้
      ผมคิดว่าควรทุ่มแรงไปกับการดำเนินงานและเครื่องมือจัดการที่ดีกว่า มากกว่าจะเน้นเรื่องการกระจายศูนย์

    • ATProto ได้รับการสนับสนุนจากบริษัทและนักลงทุนหลากหลายกลุ่ม
      สักวันหนึ่งพวกเขาก็ต้องการผลตอบแทน และยากจะคาดเดาว่ามันจะเกิดขึ้นในรูปแบบไหน

    • เรื่องการถกเถียงเรื่องต้นทุนการดำเนินงานนั้น ATProto มีโครงสร้างที่ต่างออกไปมาก
      Mastodon เป็นลักษณะที่เซิร์ฟเวอร์เดี่ยว ๆ หลายตัวซึ่งคล้าย Twitter ต่างคนต่างทำงานและแลกเปลี่ยนข้อมูลกันเหมือนอีเมล ดังนั้นเซิร์ฟเวอร์เล็ก ๆ สำหรับกลุ่มคนรู้จักจึงมีต้นทุนต่ำ
      แต่โครงสร้างแบบนี้เชื่อมต่อกับเครือข่ายระดับโลกได้น้อยกว่า และเซิร์ฟเวอร์ของฉันก็คือตัวตนของฉัน
      ถ้าคุณติดตามผู้ใช้จากเซิร์ฟเวอร์อื่น เซิร์ฟเวอร์ของคุณก็จะไปขอข้อมูลจากเซิร์ฟเวอร์นั้น แต่โดยพื้นฐานแล้วมุมมองของทั้งเครือข่ายยังคงแตกเป็นเสี่ยง ๆ
      ATProto ถูกแบ่งองค์ประกอบต่างออกไปตั้งแต่แรกเพื่อให้แข่งขันกับบริการแบบรวมศูนย์ได้ โดยแยกแหล่งกำเนิดข้อมูลออกจากการรวมข้อมูลในระดับแอปพลิเคชัน
      มันคล้าย ๆ กับการที่ผู้ใช้ทุกคนโพสต์ JSON ไว้บนเว็บไซต์ของตัวเอง (url) แล้วแอปรวบรวมข้อมูลนั้น
      ผลคือทุกคนได้เห็นมุมมองเดียวกันทั้งหมด (มีคอมเมนต์ ไลก์ และการตอบกลับครบเหมือนกัน)
      Mastodon มี 'อินสแตนซ์' หนึ่งตัวเป็นเว็บแอปแบบ Twitter ที่ทำงานได้ด้วยตัวเอง ขณะที่ ATProto มี primitive แบบกระจายหลายชนิด

      • PDS เป็นที่เก็บข้อมูลที่ไม่ผูกกับแอป ต้นทุนรันเองต่ำมาก (ต่ำกว่า 1 ดอลลาร์ต่อผู้ใช้ต่อเดือน), มี implementation แบบโอเพนซอร์ส และคล้ายกับ Git hosting
      • AppView ทำหน้าที่เป็นแบ็กเอนด์ของแอปจริง ๆ หากจะรัน Bluesky AppView ที่ ingest ข้อมูลของทั้งเครือข่าย จะมีค่าใช้จ่ายราว $300 ต่อเดือน
        AppView ที่ดูเพียงบางส่วนของเครือข่ายแบบ Mastodon จะถูกกว่ามาก แต่ไม่น่าสนใจพอจึงแทบไม่มีใครใช้
      • Relay ใช้เชื่อม PDS หลายตัวกับ AppView และปรับให้เหมาะกับการกระจายข้อมูล หลัง Sync 1.1 ค่าใช้จ่ายลดลงมากจนอยู่ที่ราว $30 ต่อเดือน
        สรุปคือ การรัน PDS กับ Relay นั้นถูก แต่การรัน AppView เต็มรูปแบบมีต้นทุนสูง และ Mastodon ก็ไม่มีแนวคิดที่เทียบกันตรง ๆ อยู่แล้ว
        การเอาประสบการณ์ที่แตกเป็นเสี่ยงของ Mastodon มาเทียบราคาแบบตรง ๆ กับประสบการณ์ที่สม่ำเสมอของ ATProto จึงไม่ค่อยสมเหตุสมผล
        การรัน partial AppView แบบ Mastodon นั้นราคาถูก แต่แทบไม่มีเสน่ห์เชิงใช้งานจริง
        อีกอย่าง Mastodon กำลังพยายามบรรเทาปัญหานี้บางส่วนด้วย on-demand fetching แต่ระบบกระจายแบบ pull ก็มีข้อจำกัดในตัวเอง
        คำถามที่เกี่ยวข้อง
  • ท้ายที่สุด แม้แต่ระบบกระจายก็ยังมีแนวโน้มจะเกิดการรวมศูนย์ตามธรรมชาติ
    Git ก็เป็นความพยายามแบบกระจาย แต่ในทางปฏิบัติก็ไปกระจุกอยู่ที่แพลตฟอร์มอย่าง GitHub หรือ GitLab
    BitTorrent เองก็เป็นแบบกระจาย แต่เว็บ tracker กลับทำหน้าที่เป็นศูนย์กลางตามธรรมชาติ
    Bitcoin ก็เช่นกัน สุดท้ายบริการบางรายอย่าง Coinbase กลายเป็นจุดศูนย์กลาง
    แม้แต่อีเมล (SMTP) ก็มีลักษณะรวมศูนย์โดยพฤตินัยเพราะปัญหาสแปม

    • สำหรับอีเมล (SMTP) นั้น การบอกว่า "มีแต่ผู้เล่นรายใหญ่เท่านั้นที่กรองสแปมได้" ไม่จริง
      มีรายชื่อกรองสแปมแบบกระจายที่ใช้กันมานานแล้ว และผู้ให้บริการรายใหญ่ก็ไม่ได้มีความได้เปรียบพิเศษด้านการกรองสแปมเสมอไป
      เพียงแต่ผู้เล่นรายใหญ่มักมีแนวโน้มจะมองว่าเมลเซิร์ฟเวอร์เล็ก ๆ เป็นสแปม และอาจมีเจตนาจะกดคู่แข่งจริงด้วย
      แต่ถึงอย่างนั้นก็ไม่ได้หมายความว่าแค่ตั้งค่า reverse DNS กับ DKIM ให้ถูก เมลจะไม่มีวันถูกจัดเป็นสแปม และแม้แต่บริการใหญ่ ๆ เองก็ยังอาจมองกันและกันเป็นสแปมได้ จึงไม่มีอะไรเด็ดขาด

    • เว็บ tracker มีอยู่หลายแห่ง และถ้าหายไปก็จะมีตัวใหม่ขึ้นมาแทนอย่างรวดเร็ว
      ดังนั้นจึงยังถือว่าเป็นระบบกระจายได้ เพราะไม่มีผู้เล่นรายเดียวที่ควบคุมระบบนิเวศทั้งหมด

    • บริการอย่าง Coinbase ใครก็สร้างได้
      ในความเป็นจริงก็มีเว็บไซต์คล้าย ๆ กันมากมาย และตอนนี้ก็ใช้ PayPal ได้แล้ว
      ไม่จำเป็นต้องพึ่งบริการเดียวด้วยซ้ำ เช่น คุณจะซื้อบิตคอยน์ผ่าน PayPal แล้วไปขายบน Coinbase ก็ยังได้
      ผมคิดว่าการนิยามสถานการณ์แบบนี้ว่าเป็นการรวมศูนย์ก็ดูแปลกอยู่เหมือนกัน

    • จริง ๆ แล้ว Git เองก็ไม่ได้เป็นเครื่องมือที่มีเป้าหมายเพื่อการกระจายศูนย์ด้วย มีประเด็นนั้นอยู่เหมือนกัน

    • ตัวอย่างทั้งหมดที่พูดถึงก็ล้วนมีองค์ประกอบของการรวมศูนย์อยู่ดี

  • ใน fedi มันกระจายศูนย์มากกว่าก็จริง แต่ยังขาดเรื่องความสม่ำเสมอ
    นี่คือสิ่งที่ผู้ใช้ที่เพิ่งเข้ามาใน fedi บ่นมากที่สุด
    ส่วนตัวผมมองว่านี่เป็นก้าวกระโดดใหญ่และก็โอเคกับมัน แต่การตั้งความคาดหวังให้สมจริงสำคัญกว่า

    • อยากรู้ว่าคำว่า consistency ในที่นี้หมายถึงอะไรแน่ (ผมไม่เคยใช้ fediverse เลยไม่มีบริบท)
  • ผมสงสัยว่าระบบแบบ federated รุ่นเก่าอย่าง IRC หรือ NNTP จะวัดด้วยวิธีแบบ HHI ได้อย่างไร
    ชวนให้อยากรู้ว่าระบบยุคก่อนจะออกมาเป็นอย่างไรเมื่อวัดด้วยตัวชี้วัดแบบนี้

    • มีกรณีที่พอ freenode เปลี่ยนเจ้าของ ทุกคนก็ย้ายออกแทบหมดภายในเวลาเกือบหนึ่งสัปดาห์
      ความน่าสนใจคือมันแสดงให้เห็นว่าการย้ายถิ่นทำได้ง่ายและเกิดขึ้นได้จริง

    • ในสภาพแวดล้อมขนาดเล็กและกึ่งส่วนตัว IRC ที่มี scroll-back ผ่านเว็บฟรอนต์เอนด์ยังคงยอดเยี่ยมมาก
      แต่พอขยายใหญ่เกินไป มันก็เริ่มพังเพราะการเมืองและความต่างทางวัฒนธรรม
      ถ้าคนที่แนวคิดคล้ายกันมาอยู่รวมกัน มันทำงานได้ดีมาก แต่ถ้าเปิดสาธารณะเต็มตัวก็จะเจอความเห็นต่าง, โทรล, ปัญหาบอต AI ฯลฯ
      คุณสามารถทำเว็บอินเทอร์เฟซแบบกึ่งส่วนตัว พร้อมการยืนยันตัวตนง่าย ๆ และบล็อก referrer เพื่อป้องกันภัยคุกคามด้านความปลอดภัย ความปั่นป่วน และบอตของบุคคลที่สามได้
      NNTP ก็ใช้ได้เหมือนกัน แต่การมิเรอร์กลุ่มไบนารีทั้งหมดแยกเป็นรายกลุ่มไม่ใช่เรื่องง่าย และเพราะ ISP ส่วนใหญ่ไม่รองรับแล้ว คนจำนวนมากจึงใช้ commercial news feed หรือผู้ให้บริการ Usenet ฟรีแทน
      การทำ peering กับผู้ให้บริการฟรีบางรายเพื่อลดความเสี่ยงด้านการเซ็นเซอร์ก็น่าจะดี
      ทั้ง IRC และ NNTP เปิดให้คนทั่วไปสร้าง linked server ของตัวเองแบบ private หรือ semi-private ได้
      ข้อมูลที่เกี่ยวข้อง

    • ถ้าคิดในเชิงคณิตศาสตร์ก็คำนวณได้ไม่ยาก และดูสถิติเครือข่ายที่เกี่ยวข้องได้ที่ netsplit.de

  • ถ้าเพิ่ม Nostr เข้าไปใน distribution แบบ HHI นี้ก็น่าจะน่าสนใจ
    ใน Nostr การกระจุกตัวของฐานผู้ใช้มักถูกมองว่าเป็นจุดอ่อนหลักของโมเดลแบบ fedi แต่กรณีของ Nostr อาจออกมาแปลกอยู่บ้าง เพราะตัวตนของผู้ใช้ไม่ได้อยู่บน relay เดียว

    • เพราะไคลเอนต์ Nostr ส่วนใหญ่ส่งข้อมูลไปยังหลาย relay และตัวบัญชีเองก็คือคู่กุญแจสาธารณะของอุปกรณ์ผู้ใช้นั่นเอง
  • ผมคิดว่าปัญหาเรื่องรวมศูนย์/กระจายศูนย์พวกนี้สุดท้ายแล้วมักเป็นเรื่องของการตลาดกับ UX อยู่ดี

  • ถ้า Threads ถูกรวมเข้า Fediverse ก็คงน่าสนใจว่าจะเกิดการเปลี่ยนแปลงอะไรบ้าง

    • Threads เองก็มีการควบคุมความเป็นส่วนตัวที่แข็งแรงกว่าในลักษณะ opt-in แต่สุดท้ายผมคิดว่าก็ยังมองได้ว่าเป็นหนึ่งใน "เซิร์ฟเวอร์ที่ครอบครองข้อมูลผู้ใช้" ใน Fediverse อยู่ดี
  • การรักษาสมดุลให้ดีเป็นเรื่องสำคัญ
    ถ้ากระจายศูนย์เกินไปก็ไม่มีใครหาเจอ แต่ถ้ารวมศูนย์เกินไป เสรีภาพก็หายไปเพราะการเซ็นเซอร์

    • ส่วนตัวผมสงสัยว่าการค้นพบเนื้อหาในสภาพแวดล้อมแบบกระจายศูนย์นั้นเป็นไปไม่ได้จริงหรือ
      ถ้าทุ่มทรัพยากรให้การทำดัชนีมากพอ (เงิน, คน ฯลฯ) จุดสมดุลนั้นอาจคงอยู่ได้อย่างไม่เสถียร เหมือนการตั้งลูกตุ้มกลับหัว
      ในยุคทองของบล็อกก็เคยมีความกลมกลืนระหว่าง search engine (ศูนย์กลาง) กับบล็อก/ฟอรัม (รายบุคคล) แต่เมื่อเวลาผ่านไป สิ่งนั้นก็อ่อนแรงลงเพราะสแปมและการรวมศูนย์เข้าสู่แพลตฟอร์มใหญ่

    • อยากชี้ให้เห็นว่าแนวคิดนี้เริ่มจากการสมมติว่า ฟังก์ชัน 'การค้นพบ' จำเป็นต้องมีองค์ประกอบแบบรวมศูนย์เสมอ

    • ในทางเศรษฐศาสตร์ ค่า HHI ต่ำกว่า 100 ถือว่า 'แข่งขันสูง', ต่ำกว่า 1500 คือ 'ไม่กระจุกตัว', และ 2500 ขึ้นไปคือ 'กระจุกตัวสูง'
      Fediverse อยู่เกือบสุดทางซ้ายแล้วแต่ก็ยังได้ 690
      ส่วนการรวมศูนย์เต็มรูปแบบ (ขึ้นไปด้านบนสุดเลย) คือ 5000
      ในความเป็นจริง กำลังแสดงสเกลแบบไม่เชิงเส้นให้ดูเป็นเชิงเส้นอยู่

    • ผมอยากได้ทางเลือกที่ผู้ใช้เลือกได้จริง
      อยากให้เป็นแบบที่ผู้ใช้เลือกเองได้ว่าจะใช้แบบรวมศูนย์ แบบกระจายศูนย์ หรือแบบไฮบริด

    • ถ้ามีคำวิจารณ์ว่า "มันกระจายเกินไป" องค์กรไม่แสวงหากำไรอาจสร้างดัชนีที่เปิดให้โฮสต์สาธารณะมาลงทะเบียนกันเอง เพื่อให้ค้นหาเนื้อหาแบบกระจายทั้งหมดได้
      แบบนี้ก็น่าจะแก้ปัญหาเรื่องการค้นหาได้
      สุดท้าย Facebook เองอาจพยายามดึงข้อมูลลักษณะนี้ผ่าน Threads ก็เป็นได้

  • ตัวชี้วัด HHI เองก็ดูใหม่และเข้าใจง่ายดี
    ถ้าย่อสเกลให้เหลือ 0~100 (หารด้วย 100) ตัวเลขก็น่าจะดูเข้าใจง่ายขึ้น
    และอาจพิจารณากลับด้านให้ 0 หมายถึงรวมศูนย์ และ 100 หมายถึงกระจายเต็มที่ด้วย
    เพราะจากชื่อบนหน้าแรกมันให้ความรู้สึกเหมือนกำลังวัด 'ความคืบหน้า' ไปสู่การกระจายศูนย์ ถ้าทำแบบนั้นก็น่าจะเข้าใจง่ายกว่า

    • แต่เหตุผลที่ไม่ normalize เป็น 0~100 ก็อาจเป็นเพราะไม่อยากให้คนรับรู้ตัวเลขนี้แบบเชิงเส้น
      ถ้าเห็นคะแนน 2500 คนจะสงสัยว่ามันหมายถึงอะไร แต่ถ้าออกมาเป็น 25/100 ความรู้สึกว่าเป็น 'การกระจุกตัวสูง' อาจลดลง