2 คะแนน โดย GN⁺ 2026-01-07 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • งานวิจัย การวิเคราะห์อารมณ์ของโพสต์บน Hacker News พบว่าประมาณ 65% ของทั้งหมดถูกจัดเป็นอารมณ์เชิงลบ และโพสต์เหล่านี้ทำคะแนนได้สูงกว่าโดยเฉลี่ย
  • คะแนนเฉลี่ยของโพสต์เชิงลบอยู่ที่ 35.6 คะแนน ขณะที่ค่าเฉลี่ยรวมอยู่ที่ 28 คะแนน ซึ่งยืนยันได้ว่ามี ส่วนเพิ่มด้านผลงานราว 27%
  • การวิเคราะห์ดำเนินการกับ โพสต์ 32,000 รายการและคอมเมนต์ 340,000 รายการ และพบแนวโน้มเอนเอียงไปทางลบอย่างสม่ำเสมอใน โมเดล 6 ชนิด
  • โมเดลที่ใช้ประกอบด้วย DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B และแดชบอร์ดสุดท้ายใช้ผลลัพธ์จาก DistilBERT ด้วยเหตุผลด้านประสิทธิภาพ
  • เนื้อหาเชิงลบส่วนใหญ่เป็น การวิจารณ์อย่างสร้างสรรค์ เช่น การวิจารณ์เทคโนโลยี ความไม่พอใจต่ออุตสาหกรรม และความหงุดหงิดกับ API ซึ่งบ่งชี้ถึง ความสัมพันธ์ระหว่างการมีส่วนร่วมกับความเป็นประเด็นถกเถียง

ผลการวิเคราะห์อารมณ์ของ Hacker News

  • คะแนนเฉลี่ยของโพสต์บน Hacker News คือ 28 คะแนน ขณะที่โพสต์ที่มีอารมณ์เชิงลบมี ค่าเฉลี่ย 35.6 คะแนน สะท้อนการมีส่วนร่วมที่สูงกว่า
    • ผลงานของโพสต์เชิงลบสูงกว่าค่าเฉลี่ยรวม 27%
  • งานวิจัยกล่าวถึง พลวัตของความสนใจบน HN (Hacker News) รวมถึง เส้นโค้งการเสื่อมถอย, preferential attachment, ความน่าจะเป็นการอยู่รอด, การคาดการณ์การมีส่วนร่วมระยะแรก เป็นต้น
    • มีการ เผยแพร่บทความ preprint ที่ SSRN

ข้อมูลและองค์ประกอบของโมเดล

  • ข้อมูลที่นำมาวิเคราะห์คือ โพสต์ 32,000 รายการและคอมเมนต์ 340,000 รายการ
  • ประมาณ 65% ของทั้งหมดถูกจัดเป็นอารมณ์เชิงลบ
    • ผู้วิจัยกล่าวถึงความเป็นไปได้ที่ตัวจำแนกอาจมีอคติไปทางลบ แต่พบว่า ทั้ง 6 โมเดลให้แนวโน้มเดียวกัน
  • โมเดลที่ใช้ได้แก่ DistilBERT, BERT Multi, RoBERTa (แบบ transformer) และ Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (แบบ LLM)
    • การกระจายของอารมณ์แตกต่างกันไปตามแต่ละโมเดล แต่ แนวโน้มเอนเอียงเชิงลบยังคงเหมือนกัน
    • แดชบอร์ดสุดท้ายใช้ ผลลัพธ์จาก DistilBERT ซึ่งทำงานได้อย่างมีประสิทธิภาพบน pipeline ที่ใช้ Cloudflare

นิยามและลักษณะของอารมณ์เชิงลบ

  • เนื้อหาที่ถูกจัดเป็น “เชิงลบ” ได้แก่ การวิจารณ์เทคโนโลยี, ความกังขาต่อการประกาศ, ความไม่พอใจต่อแนวปฏิบัติในอุตสาหกรรม, ความหงุดหงิดเกี่ยวกับ API เป็นต้น
  • ความเป็นลบส่วนใหญ่เป็น การวิจารณ์ที่มีสาระ ไม่ใช่การโจมตีบุคคล
    • การวิจารณ์ทางเทคนิคมีลักษณะแตกต่างจากการโจมตีส่วนตัว
  • ผู้วิจัยยอมรับทั้งสองความเป็นไปได้ คือ ความเป็นลบอาจกระตุ้นการมีส่วนร่วม หรือ คอนเทนต์ที่ชวนถกเถียงอาจดึงดูดทั้งการแสดงออกเชิงลบและความสนใจพร้อมกัน

แผนการเปิดเผยในอนาคต

  • ผู้วิจัยมีแผนจะเปิดเผย โค้ดทั้งหมด, ชุดข้อมูล, และแดชบอร์ดสำหรับ HN archiver ในเร็ว ๆ นี้

2 ความคิดเห็น

 
shakespeares 2026-01-07

ผู้คนสนใจเรื่องซุบซิบและสัญญาณรบกวนมากกว่า [included การสรุปเหมารวมแบบรีบด่วน]

 
GN⁺ 2026-01-07
ความเห็นจาก Hacker News
  • คิดว่าตัวตัวจำแนกของ OP ตั้งสมมติฐาน 2 อย่างที่ส่งผลต่อผลลัพธ์

    1. จัดท่าทีแบบสงสัยไว้ในกลุ่มเชิงลบ
    2. ไม่เปิดให้มีหมวดหมู่เป็นกลาง
      ตอนนี้ฉันกำลังเขียนคอมเมนต์เชิงวิจารณ์อยู่ แต่ไม่ได้แปลว่ามัน “เชิงลบ” เสมอไป ตรงกันข้ามเลย การที่วิจารณ์ได้ก็เพราะข้อมูลและข้อสรุปของ OP ชัดเจน แบบนี้แหละที่ฉันคิดว่าเป็นคำวิจารณ์เชิงสร้างสรรค์ ซึ่งเป็นหลักฐานของการถกเถียงที่ดี
    • ฉันคือ OP :)
      ที่ว่าท่าทีแบบสงสัยถูกจัดเป็นเชิงลบนั้นก็ถูกอยู่บางส่วน ชุดข้อมูลฝึก SST-2 ถือว่าการประเมินเชิงวิจารณ์เป็นเชิงลบ แต่ในที่นี้ “เชิงลบ” ไม่ได้หมายถึงเป็นปฏิปักษ์ แต่หมายถึงเชิงประเมิน วัฒนธรรมการวิจารณ์ของ HN จึงถูกอ่านว่าเป็นลบในโมเดลแบบนี้ แต่ก็เป็นเรื่องธรรมชาติในบริบทของวาทกรรมทางเทคนิค
      ความเป็นกลางมีอยู่ในรูปคะแนนต่อเนื่องใกล้ 0.5 ผู้ใช้ HN มักมีแนวโน้มจะแสดงจุดยืนที่ชัดเจน จึงเห็นการกระจายตัวไปทางสุดขั้วทั้งสองด้าน น่าจะคุ้มค่าที่จะลองโมเดลแบบ 3 คลาสในอนาคต
      คอมเมนต์ของคุณเป็นเชิงวิจารณ์ แต่ก็เป็นวาทกรรมคุณภาพสูง ฉันมองว่าความเป็นลบของ HN ไม่ใช่ความเป็นปฏิปักษ์ แต่เป็นคำวิจารณ์เชิงสร้างสรรค์ที่กระตุ้นการมีส่วนร่วม
    • ฉันก็กำลังจะชี้เหมือนกันว่าท่าทีแบบสงสัยถูกจับรวมเป็นเชิงลบ มุมมองแบบวิพากษ์ของ HN กลับเป็นคุณลักษณะเชิงบวกเสียด้วยซ้ำ แต่การแยกแยะอารมณ์ที่ละเอียดอ่อนแบบนี้ยังทำได้ยากในทางเทคนิค
    • มีทั้งคำวิจารณ์ที่สมเหตุสมผล แต่ก็มีการจับผิดจุกจิกไร้สาระแบบ “reply guy” หรือการบ่นซ้ำๆ เกี่ยวกับบางบริษัทอยู่เหมือนกัน พวกนี้แยกหมวดยาก และถ้าเทียบกับ Reddit แล้ว HN ก็ดีกว่ามาก
    • ไม่แน่ใจว่าโมเดลที่ OP ใช้คือตัวนี้เป๊ะๆ หรือเปล่า แต่คอมเมนต์ของคุณถูกจัดเป็นเชิงบวก 99.9%
      ลิงก์โมเดล DistilBERT SST-2
    • ใช่เลย ปัญหาหลักก็คือการคิดเชิงวิพากษ์ถูกจัดเป็นเชิงลบ
  • โพสต์เชิงลบที่ฉันลงได้รับการตอบสนองดีกว่าโพสต์เป็นกลางหรือเชิงบวก
    หัวข้อ “Richard Stallman is Dead” มีอัตราการคลิกสูงที่สุด และอีกโมเดลหนึ่งก็ทำนายความน่าจะเป็นที่อัตราส่วนคอมเมนต์/โหวตจะเกิน 0.5 หัวข้อแนวคลิกเบต การถกเถียงเรื่องเพศ และเรื่องรถยนต์ทำผลงานได้ดีเป็นพิเศษ
    ค่าเฉลี่ยคะแนน 35 นี่เชื่อยากนะ แต่ก่อนค่าเฉลี่ยน่าจะราว 8 เลยอยากรู้เกณฑ์การสุ่มตัวอย่าง

    • กลุ่มตัวอย่างเก็บจากทุกโพสต์และทุกคอมเมนต์ในช่วง 35 วันที่ผ่านมา ด้วย hn-archiver API
      เป็นไปได้ว่าโพสต์ที่ได้ 0 คะแนนถูกตกหล่นไป เลยทำให้ค่าเฉลี่ยสูง ขอบคุณสำหรับฟีดแบ็ก จะกลับไปตรวจอีกครั้งก่อนตีพิมพ์งาน และตัวจำแนกของคุณก็น่าสนใจเหมือนกัน
    • ตัวอย่าง “Richard Stallman is Dead” นี่ตลกมาก ทำให้นึกถึงพาดหัวหนังสือพิมพ์เก่าว่า “Generalissimo Francisco Franco Is Still Dead” แน่นอนว่า RMS ยังมีชีวิตอยู่
    • ขอถามแบบส่วนตัวหน่อย เห็นคุณโพสต์งานวิจัยบ่อยมาก เคยเห็นเกิน 30 โพสต์ต่อวัน ไม่น่าจะอ่านหมดได้ เลยอยากรู้แรงจูงใจและกระบวนการคัดเลือกข้อมูลของคุณ
  • ฉันก็เห็นปรากฏการณ์คล้ายกันในคอมเมนต์ คอมเมนต์สั้นๆ แบบประชดประชันได้รับการตอบสนองดีกว่าบทวิเคราะห์ยาวๆ มาก
    คอมเมนต์ยาวที่ตั้งใจเขียนกลับถูกเมิน แต่คอมเมนต์สั้นๆ ที่เขียนแบบฉับพลันกลับ “ระเบิด” บ่อยๆ จนน่าผิดหวัง

    • คาร์มาของฉันคือ 104,872 หน้า HN Leaders กับ Best Comments น่าสนใจดี
      HN ไม่ชอบมุกตลก ยกเว้นกรณีที่มีคำอธิบายประกอบ
    • ข้อความยาวไม่ได้แปลว่าดีเสมอไป มีสุนทรียะแห่งความกระชับอยู่ การสร้างอิมแพ็กต์ด้วย 20 ตัวอักษรยากและมีค่ากว่า 2,000 ตัวอักษรเสียอีก
    • ฉันก็ใช้สองบัญชีเหมือนกัน บัญชีที่คอมเมนต์แบบใช้อารมณ์หรือฉับพลันมีประสิทธิภาพด้านคาร์มาสูงกว่าบัญชีหลัก 4 เท่า แต่ค่าเฉลี่ยต่ำกว่าและความแปรปรวนสูง
    • ที่บอกว่า “คอนเทนต์ดีไม่ได้รับรางวัล” บางทีอาจเป็นเพราะเราไม่ได้สร้างคอนเทนต์ที่ดีอย่างที่คิดก็ได้
      ถ้าลองทำบล็อกเองก็น่าจะสัมผัสเกณฑ์ของการมีส่วนร่วมแบบนี้ได้ดีขึ้น
    • ฉันก็ว่าจะดูเรื่องนี้แล้วเปลี่ยนนิสัยการอัปโหวตของตัวเอง อยากรู้ว่าอัปโหวตแบบเงียบๆ บน HN นับเป็นการแสดงความเห็นด้วยหรือเปล่า
  • ถ้าคำว่า “เชิงลบ” รวมถึงการวิจารณ์ทางเทคนิค ความไม่พอใจต่ออุตสาหกรรม หรือความหงุดหงิดกับ API การสนทนาส่วนใหญ่บน HN ก็ตกอยู่ในหมวดนี้
    ไปคอมเมนต์ “ชอบ” ใต้โพสต์ประชาสัมพันธ์ของ OpenAI มันไม่มีความหมาย การมีส่วนร่วมที่มีคุณค่าจริงๆ คือการวิเคราะห์เชิงวิพากษ์
    ฉันกลับคิดว่าโพสต์ยอดนิยมที่ไม่มีคอมเมนต์เป็นหลักฐานว่าไซต์กำลังทำงานได้ดี

    • ชอบที่นำเสนอแต่ข้อมูล แล้วปล่อยให้ผู้อ่านตีความเอง
    • เห็นด้วยว่าควรแยก “ความเป็นลบ” เป็นเชิงวิพากษ์ vs เชิงเป็นพิษ การเอาสองอย่างนี้มาปนกันเป็นความผิดพลาด
  • เราคัดกรองตัวเองให้ชอบปฏิกิริยาเชิงลบ เนื้อหาเชิงบวกมักจบในตัวจึงไม่กระตุ้นการตอบสนอง แต่เนื้อหาเชิงลบกระตุ้นให้เกิดปฏิสัมพันธ์

    • ด้วยโครงสร้างของเว็บไซต์ คอมเมนต์เชิงบวกแบบสั้นๆ ถูกแทนที่ด้วยปุ่มอัปโหวต
    • คอมเมนต์ที่มีแค่ “ชอบ” ถูกมองว่าไม่มีความหมาย ผลลัพธ์คือมีคอมเมนต์เป็นกลางหรือเชิงวิพากษ์มากขึ้น
    • มนุษย์ไวต่อสิ่งกระตุ้นเชิงลบตามวิวัฒนาการ เพราะสิ่งมีชีวิตที่มองข้ามอันตรายไม่รอดมาได้
      เพราะงั้นเราจึงถูกดึงดูดด้วยข่าวร้ายมากกว่า ส่วนข่าวดีมักแค่เลื่อนผ่าน นี่คือแก่นของเศรษฐกิจความสนใจ
    • ฉันเรียนรู้จากคอมเมนต์ที่เพิ่มข้อมูลมากกว่าคำวิจารณ์แบบทำลายล้าง ข้อความแบบนั้นใหม่กว่าและมีความเชี่ยวชาญมากกว่า
    • (พูดเล่นๆ) “ใช่เลย! … อ้อ เดี๋ยวก่อน”
  • การวิจารณ์ทางเทคนิคไม่เหมือนกับการโจมตีตัวบุคคล ความเป็นลบของ HN ส่วนใหญ่คือคำวิจารณ์เชิงสร้างสรรค์
    ถ้าความประชดประชันมากเกินไป ก็จะมี “การบ่นเรื่องการบ่น” โผล่มาเสมอ
    ฉันคิดว่าการมีคนบอกว่า “มีอะไรติดฟันนะ” ดีกว่าคำชม

    • งานวิจัยควรจัดการความแตกต่างนี้ให้ชัดขึ้น โมเดลแยกไม่ออกระหว่าง “การออกแบบ API นี้ผิด” กับ “บริษัทนี้ห่วย”
      เพราะการม็อดเดอเรตของ HN ลบเนื้อหาที่เป็นปฏิปักษ์ออกอย่างรวดเร็ว สิ่งที่เหลืออยู่ส่วนใหญ่จึงเป็นคำวิจารณ์ที่มีประสิทธิผล
      จุดที่น่าสนใจก็คือ “ความเป็นลบ” แบบนี้สัมพันธ์กับอัตราการมีส่วนร่วมสูงขึ้น 27% หมายความว่าชุมชนสายเทคนิคให้คุณค่ากับการวิจารณ์มากกว่าการประชาสัมพันธ์
      ฉันวางแผนจะระบุในงานว่า “อารมณ์เชิงลบ” ที่ว่านี้คือการวิจารณ์เชิงประเมินตามเกณฑ์ของโมเดล SST-2 ไม่ใช่คำพูดเป็นพิษ
    • ความประชดประชันไม่ใช่ปรัชญาแห่งการพูดความจริง การพูดข้อเท็จจริงไม่ใช่การวิจารณ์
  • ตอนที่ Reddit API ยังเข้าถึงได้ ฉันเคยทดลองบล็อกซับเรดดิตที่มีอารมณ์เชิงลบด้วยแอปอ่าน rif
    พอบล็อกไปหลายร้อยอัน เหลือแต่คอนเทนต์เชิงบวกเกี่ยวกับสัตว์กับงานอดิเรก เลยตระหนักว่า Reddit ขับเคลื่อนด้วยความเป็นลบแค่ไหน แต่ขณะเดียวกันพอมันหายไปก็น่าเบื่อมากเหมือนกัน
    ลิงก์รายการบล็อก

    • บรรยากาศประชดประชันของ Reddit เหมือนโรคระบาด คนไม่มีความสุขมารวมตัวกันแล้วตอกย้ำความสิ้นหวังของกันและกัน ส่วนใหญ่เป็นคนอายุน้อยและประสบการณ์ยังน้อย
    • ที่คอนเทนต์ถกเถียงกันได้ถูกพูดถึงมากกว่า ก็เป็นธรรมชาติของมนุษย์ ปัญหาความรักของเพื่อนเราฟังได้นาน แต่ถ้าเขาสบายดีเราก็ไม่ค่อยมีอะไรจะพูด
    • ฉันก็หลีกเลี่ยงการเมืองหรือคอนเทนต์ยั่วยุ แล้วดูแต่โพสต์แนวงานอดิเรกหรือการสร้างสรรค์ Reddit เป็นพื้นที่ที่ปะปนกันจริงๆ
    • ฉันคิดว่าสัดส่วนบวก/ลบราว 45:65 คือจุดสมดุลที่น่าสนใจที่สุด ถ้า 50:50 เนื้อหาจะธรรมดาเกินไป ในแง่นี้ HN ดีกว่าโซเชียลมีเดีย
    • ฉันยังใช้ rif อยู่เลย ใช้ Revanced เปลี่ยน API key เอา ช่วงนี้โพสต์แนวล่อ AIของ Reddit เพิ่มขึ้น เลยบล็อกซับเรดดิตที่เกี่ยวข้อง
      โพสต์แบบนี้ให้ความรู้สึกเหมือนบอตคุยกับบอต ฉันสงสัยว่า Reddit ปล่อยโครงสร้างแบบนี้ไว้เพื่อเพิ่มการแสดงโฆษณา
  • บนอินเทอร์เน็ต ไม่มีอะไรทรงพลังกว่าการบ่นหรือการไปแก้คนอื่นแล้ว
    ในฐานะผู้ใช้ ESL (English as a Second Language) คำศัพท์อินเทอร์เน็ตคำแรกที่ฉันเรียนรู้คือ “flamewar”

    • ก็มีคนถามเหมือนกันว่า ESL คืออะไร
  • ตามงานวิจัย ความเหลื่อมล้ำด้านความสนใจบน HN รุนแรงมาก มีค่าสัมประสิทธิ์จีนี 0.89 สูงกว่า Twitter
    เป็นไปได้มากว่านี่เกิดจากโครงสร้างการมองเห็นของ HN โพสต์ใหม่เริ่มจาก /newest และถ้าไม่ได้รับความสนใจจากคนกลุ่มเล็กๆ ในช่วงแรก ก็จะแทบหายไปเลย
    ต่างจากโครงสร้างแบบ Reddit ที่มีการมองเห็นพื้นฐาน HN ต้องผ่านด่านแรกให้ได้ก่อนถึงจะขึ้นหน้าหลัก

    • ด้วยโครงสร้างนี้ ปฏิกิริยาในช่วงแรกจึงทำหน้าที่เป็นตัวชี้วัดทำนายความสำเร็จ
  • วิศวกรมีอาชีพเป็นคนแก้ปัญหา จึงคิดแบบวิพากษ์วิจารณ์โดยธรรมชาติ
    ในงานแสดงสินค้าอุตสาหกรรม วิศวกรจะยืนกอดอกและเข้าหาอย่างเยือกเย็น แต่ชุมชนเมกเกอร์เต็มไปด้วยพลังบวก
    ท้ายที่สุดแล้ว มันก็เป็นแค่ความต่างระหว่าง “แก้วน้ำพร่องครึ่งหนึ่ง” กับ “แก้วน้ำเต็มครึ่งหนึ่ง”