1 คะแนน โดย GN⁺ 2026-02-26 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ผลการวิเคราะห์ รูปแบบคอมเมนต์ของบัญชีใหม่บน Hacker News ในช่วงหลัง พบความแตกต่างอย่างชัดเจนจากผู้ใช้เดิม
  • ในคอมเมนต์ของบัญชีใหม่ 17.47% ใช้ EM dash (—), ลูกศร และสัญลักษณ์พิเศษอื่น ๆ ซึ่งสูงกว่าบัญชีเดิมที่มีเพียง 1.83% ราว 10 เท่า
  • นอกจากนี้ บัญชีใหม่ยังมีโอกาสกล่าวถึง คำที่เกี่ยวข้องกับ AI และ LLM ที่ 18.67% สูงกว่าบัญชีเดิมซึ่งอยู่ที่ 11.8%
  • การวิเคราะห์นี้อ้างอิงจากการเปรียบเทียบตัวอย่างข้อมูลราว 700 รายการจาก /newcomments และ /noobcomments
  • สถิติเหล่านี้บ่งชี้ถึง ความเป็นไปได้ที่บัญชีอัตโนมัติ (บอต) ในชุมชน HN จะเพิ่มขึ้น

สังเกตสัญญาณผิดปกติในคอมเมนต์ HN

  • ในช่วงไม่กี่เดือนที่ผ่านมา มีการสังเกตเห็น ปรากฏการณ์ที่ดูเหมือนว่าบอตบน HN เพิ่มขึ้นอย่างรวดเร็ว
    • บางบัญชีโพสต์เพียงสตริงหรือชุดตัวเลขที่ไม่มีความหมาย
    • ตัวอย่างเช่นข้อความประหลาดอย่าง “13 60 well and t6ctctfuvuh7hguhuig8h88gd…” หรือคอมเมนต์ที่มีเพียง “1662476506”, “Аё” เป็นต้น
  • นอกจากบัญชีลักษณะนี้แล้ว ยังมี คอมเมนต์ที่ดูปกติแต่แปลก ๆ หรือไม่ตรงประเด็น อยู่จำนวนมาก

วิธีเก็บและวิเคราะห์ข้อมูล

  • ทำ การสแครปและเปรียบเทียบวิเคราะห์ จากหน้า /newcomments (คอมเมนต์ล่าสุด) และ /noobcomments (คอมเมนต์ของบัญชีใหม่)
  • เก็บตัวอย่างคอมเมนต์ประมาณ 700 รายการต่อกลุ่ม แล้วคำนวณสถิติอย่างง่าย

ผลสถิติหลัก

  • 17.47% ของคอมเมนต์จากบัญชีใหม่มี EM dash, ลูกศร หรือสัญลักษณ์พิเศษอื่น ๆ เทียบกับ 1.83% ของบัญชีเดิม ต่างกันราว 10 เท่า
    • นัยสำคัญทางสถิติ p = 7e-20
  • 18.67% ของคอมเมนต์จากบัญชีใหม่มีการกล่าวถึง AI หรือ LLM สูงกว่าบัญชีเดิมที่ 11.8%
    • นัยสำคัญทางสถิติ p = 0.0018

การตีความและข้อสงสัย

  • แม้ผู้ใช้จริงก็อาจใช้ EM dash ได้ แต่ สัดส่วนการใช้งานที่สูงผิดปกติในบัญชีใหม่อธิบายได้ยาก
  • ความแตกต่างนี้ชี้ให้เห็นถึง ความเป็นไปได้ว่ามีบัญชีที่ถูกสร้างอัตโนมัติปะปนอยู่ในบัญชีใหม่ของ HN

เอกสารอ้างอิง

  • ซอร์สโค้ดและข้อมูลที่ใช้ในการวิเคราะห์เปิดเผยอยู่ใน GitHub repository (vlofgren/hn-green-clankers)
  • Marginalia.nu เผยแพร่งานชิ้นนี้เป็นส่วนหนึ่งของซีรีส์ “Weird AI Crap”

1 ความคิดเห็น

 
GN⁺ 2026-02-26
ความเห็นจาก Hacker News
  • เมื่อก่อนบน HN มีการใช้ em dash และ en dash กันบ่อย
    แค่ชอบงานไทโปกราฟีเลยติดนิสัยใช้ dash แทน semicolon
    ตั้งคีย์ลัดคีย์บอร์ดไว้ด้วย AHK แต่ตอนนี้กลับทำให้คนเข้าใจผิดว่าข้อความของฉันเหมือนถูกเขียนโดย LLM
    เคยถูกเข้าใจผิดว่าเป็น AI หลายครั้ง เลยเสียดายที่รสนิยมด้านไทโปกราฟีซึ่งเคยสนุก ตอนนี้กลับถูกมองในแง่ลบ

    • ลูกวัยรุ่นของฉันยังถามเลยว่าทำไมฉันถึงเขียนเหมือนแชตบอต
      ทั้งที่จริงก็แค่มีคนที่ใส่ใจกับประโยคที่สมบูรณ์ การสะกด ไวยากรณ์ และตัวพิมพ์ใหญ่ แต่ตอนนี้โลกกลับมองว่านั่นดูเหมือน AI
      ช่วงนี้เหมือนการ เขียนให้ดูรกนิดหน่อยโดยตั้งใจ กลายเป็นสัญญาณของความเป็นมนุษย์ ไปแล้ว คิดว่าแชตบอตในอนาคตก็คงเรียนรู้แบบนั้นเหมือนกัน
    • ถ้าการจงใจไม่ใส่ Oxford comma เป็นมุกตลก ก็ขอส่งทั้งคำชมและคำสาปไปพร้อมกัน
    • ฉันเองก็เคยเป็นคนใช้ em-dash หนักมาก แต่ช่วงนี้เปลี่ยนไปใช้ comma แทน
      ถึงประโยคจะดูขัดๆ หน่อย แต่กลับชอบตรงที่มันให้ความรู้สึก จริงใจแบบทำมือ
      แต่เรื่อง เว้นสองช่องตอนจบประโยค นี่ไม่มีทางยอมแพ้เด็ดขาด อาจารย์พิมพ์ดีดของฉันเมื่อปี 1993 เคยบอกว่าประโยคก็ต้องการที่ให้หายใจเหมือนกัน
    • วิกฤตการรู้หนังสือรุนแรงถึงขนาดนี้ได้ยังไง ทั้งที่แชตบอตกลายเป็นครูสอนเขียนเพียงหนึ่งเดียว มันน่าเศร้าจริงๆ
    • ฉันก็เจอปัญหาคล้ายกัน แต่ในกรณีของฉันเป็นเพราะ bullet point
      เป็นนิสัยที่ใช้บน Mac มาตั้งแต่กด option+8 แต่ตอนนี้แม้แต่นั่นก็ดูเหมือนสไตล์ของ LLM ไปแล้ว
  • มีการลองเทียบสถิติคำที่ใช้บ่อยในคอมเมนต์ของผู้ใช้ใหม่บน HN
    คำอย่าง “ai”, “actually”, “code”, “real”, “built” ปรากฏบ่อยกว่ามากในบัญชีใหม่
    มีสรุปไว้ละเอียดใน ตารางข้อมูล

    • การดูแค่ p-value จากหลายตัวชี้วัดแล้วสรุปว่ามีนัยสำคัญ ถือเป็น p-hacking
      ในเชิงวิชาการมันไม่เหมาะสม แต่ในที่นี้ก็มองได้ว่าเป็นข้อสังเกตที่น่าสนใจ
      ถ้าคำนวณขนาดอิทธิพลอย่าง Cohen’s d เพิ่ม ก็จะเห็นขนาดของความต่างที่แท้จริงได้
    • มีคอมเมนต์ล้อเลียนที่เอาคำมาต่อกันแบบ “actually building full, real AI app project code…” ด้วย
    • ฉันเองก็ใช้คำว่า “actually” บ่อยเกินไป เลยพยายามลดอยู่
      ส่วนใหญ่เป็นแค่ คำฟุ่มเฟือย ที่ทำให้ข้อความชัดเจนน้อยลง
    • คำว่า “ai” อาจทำให้ผลบิดเบือนได้ เพราะช่วงหลังหัวข้อบน HN เอนเอียงไปทางนั้นอยู่แล้ว
    • p-value ที่ต่ำแบบนี้ดูเหมือนเป็นสัญญาณว่ามีอะไรแปลกๆ
      เลยตั้งสมมติฐานว่าอาจมี บอตบางตัวคอยดันหัวข้อเกี่ยวกับ AI แบบไม่เป็นธรรมชาติ
  • เมื่อก่อนชอบใช้ em-dash มาก แต่ตอนนี้เสียดายที่ใช้ไม่ได้เพราะ กลัวจะถูกเข้าใจผิดว่าเป็น AI
    บน Mac พิมพ์ง่ายด้วย alt+shift+- เลยรู้สึกเหมือนธรรมเนียมไทโปกราฟีที่ดีถูกทำให้แปดเปื้อน

    • ความเหนื่อยล้าจาก LLM เป็นเรื่องจริง สิ่งสำคัญไม่ใช่สไตล์การเขียน แต่คือ มุมมองและเอกลักษณ์เฉพาะของมนุษย์
      ถ้ามีสิ่งนั้น ไม่ว่าจะใช้เครื่องหมายวรรคตอนแบบไหนก็ดูเป็นงานเขียนของคน
    • ใช้ต่อไปก็พอ ฉันก็ทำแบบนั้นมา 20 ปีแล้ว
    • ทุกวันนี้เลยใช้ semicolon แทน กลัวว่าวันหนึ่งมันก็จะกลายเป็นสัญลักษณ์ของ AI เหมือนกัน
    • ฉันใช้ em-dash มาตั้งแต่ปี 2010 และยังชอบ curly quotes กับ ellipsis ด้วย
      เลยแชร์ คู่มือ Alt code บน Mac เพื่อชวนกันทวงคืนไทโปกราฟี
    • คนจะพูดอะไรก็ช่าง อันที่จริง LLM อาจเรียนรู้การเขียนจากข้อความของฉันก็ได้
      สุดท้ายแล้ว รูปแบบการแสดงออกที่เป็นเอกลักษณ์ของมนุษย์ ก็ย่อมปรากฏออกมาอยู่ดี
  • ข้อมูลถูกเผยแพร่เป็น SQLite DB ใน GitHub repository
    สามารถรัน SQL query ได้ตรงจากเบราว์เซอร์ผ่าน Datasette Lite
    ถ้าดูรายชื่อผู้ใช้ที่ใช้ em-dash เยอะ ส่วนใหญ่ก็ดูเป็น บัญชีปกติ

    • ถ้าเพิ่ม source ลงใน query จะเห็นว่ามี บัญชี green ที่ใช้ em-dash เยอะสะดุดตา
    • ฟีเจอร์ แก้อัตโนมัติ ของ iPhone, iPad และ Mac อาจใส่ em-dash หรือ ellipsis ให้อัตโนมัติ จึงอาจทำให้ข้อมูลบิดเบือนได้
    • มีมุกด้วยว่า “คอมเมนต์บน HN ถูกให้ไลเซนส์ไม่ใช่แค่กับ HN แต่กับใครบางคนในสวีเดนด้วยหรือ”
    • มีคำชมสั้นๆ ว่า “great repo name!” ด้วย
  • มันให้ความรู้สึกเหมือนไม่ใช่แค่ HN แต่เป็น วิกฤตของวาทกรรมออนไลน์แบบไม่เปิดเผยตัวตนทั้งหมด
    ถ้าความเชื่อใจพัง แพลตฟอร์มเองก็พังตาม
    การยืนยันตัวตนน่าจะเป็นทางออกเดียว แต่ถึงอย่างนั้นก็ไม่สมบูรณ์แบบ

    • ฉันก็คิดเหมือนกัน เราสามารถสร้าง ระบบที่รักษาความไม่เปิดเผยตัวตนไว้พร้อมกับรับประกันความน่าเชื่อถือ ได้
      ฉันอธิบายไอเดียนั้นไว้ใน บล็อกโพสต์ของฉัน
      สุดท้ายดูเหมือนเราจะเข้าสู่ยุคที่ต้องพิสูจน์ว่าเราเป็นมนุษย์จริง
    • การลบความไม่เปิดเผยตัวตนไม่ใช่คำตอบ แต่เป็น จุดเริ่มของปัญหาอีกแบบหนึ่ง
    • แทนที่จะยืนยันตัวตน อาจตรวจสอบความน่าเชื่อถือด้วย proof-of-work หรือ hashcash ก็ได้
      ถ้ามูลค่าของคอมเมนต์พิสูจน์ได้ด้วยปริมาณการคำนวณแฮช ก็อาจสร้างความน่าเชื่อถือได้โดยไม่ต้องมีตัวตน
    • ช่วงนี้ฉันไม่ค่อยอยากใช้ HN แล้ว อยากให้กลับไปเป็นระบบเชิญเท่านั้น HN เคยเป็นพื้นที่ที่มีความเป็น HN อยู่ในแบบของมันเอง น่าเสียดายจริงๆ
    • ระบบ karma ของ HN เองก็เป็น proof-of-work แบบหนึ่ง
      ถ้าบอตรักษา karma เชิงบวกไว้ไม่ได้ ก็จะไม่ได้สิทธิ์บางอย่าง ดังนั้นถึงไม่ใช่การยืนยันตัวตนเต็มรูปแบบ ก็ยังพอใช้ป้องกันได้
  • ช่วงนี้บน HN เริ่มเห็น รูปแบบคอมเมนต์ที่เป็นทางการแต่จืดชืด ชัดเจนขึ้น
    โครงแบบ “this is [สรุป] / not just x, it’s y / punchy ending” โผล่ซ้ำๆ
    ถ้าดู บัญชี snowhale จะเห็นได้ชัด

    • ผู้ใช้คนนั้นได้ 160 คะแนนจากโพสต์จืดๆ แค่ 4 ชิ้น
      อาจเป็นกลยุทธ์เพื่อ สร้างเครือข่ายโหวตและบิดทิศทางของเรื่องเล่า
    • วลี “is real” ก็ดูเป็น ร่องรอยของ LLM เหมือนกัน
      ใน ผลการค้นหา มีหลายบัญชีใช้ประโยคเดียวกันซ้ำๆ
    • ฉันเองก็เห็น คอมเมนต์แบบสรุป พวกนั้นบ่อยขึ้นช่วงนี้
      หลายคำตอบเหมือนไม่ได้อ่านบริบทของบทสนทนา และให้ความรู้สึก แยกขาดอย่างประหลาด
    • สุดท้ายแล้ว AI ก็มี การตัดสินเชิงคุณค่าแบบมีอคติ
      มันแสร้งทำเป็นเป็นกลางเหมือนมนุษย์ แต่ข้างในก็ยังมีอคติจากข้อมูลฝึกปะปนอยู่
      ความเป็นกลางอย่างสมบูรณ์อาจเป็นเพียงภาพลวง
    • จริงๆ แล้วการหลีกเลี่ยงรูปแบบนี้ง่ายมาก
      แค่เพิ่มในพรอมป์ต์ว่า “พูดเหมือนฉัน อย่าเขียนเหมือน AI เขียนให้กระชับ” ก็แก้ไปได้ครึ่งหนึ่งแล้ว
  • กลับกัน ดราม่ารอบนี้ทำให้หลายคน เพิ่งรู้จักการมีอยู่ของ em-dash เป็นครั้งแรก
    ตอนนี้เลยมี ผู้ใช้มนุษย์หน้าใหม่ จำนวนไม่น้อยที่เริ่มใส่ em-dash ในทุกประโยคแล้ว

  • บัญชีบอตส่วนใหญ่ที่ฉันจับได้แทบไม่ใช้ em-dash เลย
    ตัวอย่างเช่น aplomb1026 โพสต์คอมเมนต์ยาวสองอันห่างกัน 30 วินาที
    ดูได้จาก คอมเมนต์แรก และ คอมเมนต์ที่สอง
    ถ้าไม่ได้ตั้งค่าพลาดแบบนี้ คนส่วนใหญ่ก็คงไม่ทันสังเกต
    บอตอื่นๆ ก็มี dirtytoken7, fdefitte เป็นต้น

  • คนที่ เรียนเอกวรรณคดีอังกฤษ ใช้ em-dash กันมานานแล้ว แต่ตอนนี้เริ่มยั้งมือเพราะกลัวจะดูเหมือน AI
    ถ้าวันหนึ่ง AI เริ่มใช้ diaeresis แบบ New Yorker ด้วย คงบ้าตายแน่

    • ตอนทำงานที่ GitHub บริษัทห้ามใช้ diaeresis เพราะมองว่า ไม่เป็นมิตรกับผู้อ่านและดูชนชั้นสูงเกินไป
      ถึงอย่างนั้นฉันก็ยังใช้ภายในอยู่ดี
    • มีคนชวนให้มาร่วมกันปกป้องสุนทรียะของการพิมพ์ด้วยมือผ่าน double-dash
    • ฉันเองก็เคยใช้ em-dash บ่อยในอีเมลและงานเขียน แต่หยุดไปเพราะมันดูเหมือนร่องรอยของ AI
    • ไม่เคยรู้มาก่อนว่ามีสัญลักษณ์แบบนั้น ตอนนี้เลยตั้งใจจะ เพิ่มเข้าไปในคลังรูปแบบการแสดงออก ของตัวเอง
    • มีคนบอกว่าอยากเห็น histogram แสดงปริมาณการใช้ em-dash ของฉันด้วย
  • ถ้าแทนที่จะ “ไม่ให้ดูเหมือน AI” เราเลือกที่จะ “กลมกลืนไปกับการลุกฮือของหุ่นยนต์” ล่ะ?
    ฉันขอเสนอ ⸻ (U+2E3B dash)

    • มีคนรายงานว่าคอมเมนต์นี้ ทำให้ฟังก์ชันเลื่อนไปคอมเมนต์ก่อนหน้า/ถัดไปของ HN พัง
    • มีมุกเรียกมันว่า “Big Chungus of dashes” และแซวว่าอาจเป็นตัวอักษรที่กว้างที่สุดก็ได้
    • มีคำตอบขำๆ ว่า “ไม่มีอะไรต้องกลัวหรอก เพื่อนมนุษย์!
    • จากนั้นก็มีการต่อยอดเสียดสีว่า “เราควรใช้ ⸻ ให้บ่อยขึ้นเพื่อจะได้คุยเรื่อง ⸻ ให้มากขึ้น”