65% ของโพสต์บน Hacker News มีอารมณ์เชิงลบ และโพสต์เหล่านี้ทำผลงานได้ดีกว่า

(philippdubach.com)

2 คะแนน โดย GN⁺ 2026-01-07 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

งานวิจัย การวิเคราะห์อารมณ์ของโพสต์บน Hacker News พบว่าประมาณ 65% ของทั้งหมดถูกจัดเป็นอารมณ์เชิงลบ และโพสต์เหล่านี้ทำคะแนนได้สูงกว่าโดยเฉลี่ย
คะแนนเฉลี่ยของโพสต์เชิงลบอยู่ที่ 35.6 คะแนน ขณะที่ค่าเฉลี่ยรวมอยู่ที่ 28 คะแนน ซึ่งยืนยันได้ว่ามี ส่วนเพิ่มด้านผลงานราว 27%
การวิเคราะห์ดำเนินการกับ โพสต์ 32,000 รายการและคอมเมนต์ 340,000 รายการ และพบแนวโน้มเอนเอียงไปทางลบอย่างสม่ำเสมอใน โมเดล 6 ชนิด
โมเดลที่ใช้ประกอบด้วย DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B และแดชบอร์ดสุดท้ายใช้ผลลัพธ์จาก DistilBERT ด้วยเหตุผลด้านประสิทธิภาพ
เนื้อหาเชิงลบส่วนใหญ่เป็น การวิจารณ์อย่างสร้างสรรค์ เช่น การวิจารณ์เทคโนโลยี ความไม่พอใจต่ออุตสาหกรรม และความหงุดหงิดกับ API ซึ่งบ่งชี้ถึง ความสัมพันธ์ระหว่างการมีส่วนร่วมกับความเป็นประเด็นถกเถียง

ผลการวิเคราะห์อารมณ์ของ Hacker News

คะแนนเฉลี่ยของโพสต์บน Hacker News คือ 28 คะแนน ขณะที่โพสต์ที่มีอารมณ์เชิงลบมี ค่าเฉลี่ย 35.6 คะแนน สะท้อนการมีส่วนร่วมที่สูงกว่า
- ผลงานของโพสต์เชิงลบสูงกว่าค่าเฉลี่ยรวม 27%
งานวิจัยกล่าวถึง พลวัตของความสนใจบน HN (Hacker News) รวมถึง เส้นโค้งการเสื่อมถอย, preferential attachment, ความน่าจะเป็นการอยู่รอด, การคาดการณ์การมีส่วนร่วมระยะแรก เป็นต้น
- มีการ เผยแพร่บทความ preprint ที่ SSRN

ข้อมูลและองค์ประกอบของโมเดล

ข้อมูลที่นำมาวิเคราะห์คือ โพสต์ 32,000 รายการและคอมเมนต์ 340,000 รายการ
ประมาณ 65% ของทั้งหมดถูกจัดเป็นอารมณ์เชิงลบ
- ผู้วิจัยกล่าวถึงความเป็นไปได้ที่ตัวจำแนกอาจมีอคติไปทางลบ แต่พบว่า ทั้ง 6 โมเดลให้แนวโน้มเดียวกัน
โมเดลที่ใช้ได้แก่ DistilBERT, BERT Multi, RoBERTa (แบบ transformer) และ Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (แบบ LLM)
- การกระจายของอารมณ์แตกต่างกันไปตามแต่ละโมเดล แต่ แนวโน้มเอนเอียงเชิงลบยังคงเหมือนกัน
- แดชบอร์ดสุดท้ายใช้ ผลลัพธ์จาก DistilBERT ซึ่งทำงานได้อย่างมีประสิทธิภาพบน pipeline ที่ใช้ Cloudflare

นิยามและลักษณะของอารมณ์เชิงลบ

เนื้อหาที่ถูกจัดเป็น “เชิงลบ” ได้แก่ การวิจารณ์เทคโนโลยี, ความกังขาต่อการประกาศ, ความไม่พอใจต่อแนวปฏิบัติในอุตสาหกรรม, ความหงุดหงิดเกี่ยวกับ API เป็นต้น
ความเป็นลบส่วนใหญ่เป็น การวิจารณ์ที่มีสาระ ไม่ใช่การโจมตีบุคคล
- การวิจารณ์ทางเทคนิคมีลักษณะแตกต่างจากการโจมตีส่วนตัว
ผู้วิจัยยอมรับทั้งสองความเป็นไปได้ คือ ความเป็นลบอาจกระตุ้นการมีส่วนร่วม หรือ คอนเทนต์ที่ชวนถกเถียงอาจดึงดูดทั้งการแสดงออกเชิงลบและความสนใจพร้อมกัน

แผนการเปิดเผยในอนาคต

ผู้วิจัยมีแผนจะเปิดเผย โค้ดทั้งหมด, ชุดข้อมูล, และแดชบอร์ดสำหรับ HN archiver ในเร็ว ๆ นี้

2 ความคิดเห็น

shakespeares 2026-01-07

ผู้คนสนใจเรื่องซุบซิบและสัญญาณรบกวนมากกว่า [included การสรุปเหมารวมแบบรีบด่วน]

GN⁺ 2026-01-07

ความเห็นจาก Hacker News

คิดว่าตัวตัวจำแนกของ OP ตั้งสมมติฐาน 2 อย่างที่ส่งผลต่อผลลัพธ์
1. จัดท่าทีแบบสงสัยไว้ในกลุ่มเชิงลบ
2. ไม่เปิดให้มีหมวดหมู่เป็นกลาง
  ตอนนี้ฉันกำลังเขียนคอมเมนต์เชิงวิจารณ์อยู่ แต่ไม่ได้แปลว่ามัน “เชิงลบ” เสมอไป ตรงกันข้ามเลย การที่วิจารณ์ได้ก็เพราะข้อมูลและข้อสรุปของ OP ชัดเจน แบบนี้แหละที่ฉันคิดว่าเป็นคำวิจารณ์เชิงสร้างสรรค์ ซึ่งเป็นหลักฐานของการถกเถียงที่ดี
- ฉันคือ OP :)
  ที่ว่าท่าทีแบบสงสัยถูกจัดเป็นเชิงลบนั้นก็ถูกอยู่บางส่วน ชุดข้อมูลฝึก SST-2 ถือว่าการประเมินเชิงวิจารณ์เป็นเชิงลบ แต่ในที่นี้ “เชิงลบ” ไม่ได้หมายถึงเป็นปฏิปักษ์ แต่หมายถึงเชิงประเมิน วัฒนธรรมการวิจารณ์ของ HN จึงถูกอ่านว่าเป็นลบในโมเดลแบบนี้ แต่ก็เป็นเรื่องธรรมชาติในบริบทของวาทกรรมทางเทคนิค
  ความเป็นกลางมีอยู่ในรูปคะแนนต่อเนื่องใกล้ 0.5 ผู้ใช้ HN มักมีแนวโน้มจะแสดงจุดยืนที่ชัดเจน จึงเห็นการกระจายตัวไปทางสุดขั้วทั้งสองด้าน น่าจะคุ้มค่าที่จะลองโมเดลแบบ 3 คลาสในอนาคต
  คอมเมนต์ของคุณเป็นเชิงวิจารณ์ แต่ก็เป็นวาทกรรมคุณภาพสูง ฉันมองว่าความเป็นลบของ HN ไม่ใช่ความเป็นปฏิปักษ์ แต่เป็นคำวิจารณ์เชิงสร้างสรรค์ที่กระตุ้นการมีส่วนร่วม
- ฉันก็กำลังจะชี้เหมือนกันว่าท่าทีแบบสงสัยถูกจับรวมเป็นเชิงลบ มุมมองแบบวิพากษ์ของ HN กลับเป็นคุณลักษณะเชิงบวกเสียด้วยซ้ำ แต่การแยกแยะอารมณ์ที่ละเอียดอ่อนแบบนี้ยังทำได้ยากในทางเทคนิค
- มีทั้งคำวิจารณ์ที่สมเหตุสมผล แต่ก็มีการจับผิดจุกจิกไร้สาระแบบ “reply guy” หรือการบ่นซ้ำๆ เกี่ยวกับบางบริษัทอยู่เหมือนกัน พวกนี้แยกหมวดยาก และถ้าเทียบกับ Reddit แล้ว HN ก็ดีกว่ามาก
- ไม่แน่ใจว่าโมเดลที่ OP ใช้คือตัวนี้เป๊ะๆ หรือเปล่า แต่คอมเมนต์ของคุณถูกจัดเป็นเชิงบวก 99.9%
  ลิงก์โมเดล DistilBERT SST-2
- ใช่เลย ปัญหาหลักก็คือการคิดเชิงวิพากษ์ถูกจัดเป็นเชิงลบ
โพสต์เชิงลบที่ฉันลงได้รับการตอบสนองดีกว่าโพสต์เป็นกลางหรือเชิงบวก
หัวข้อ “Richard Stallman is Dead” มีอัตราการคลิกสูงที่สุด และอีกโมเดลหนึ่งก็ทำนายความน่าจะเป็นที่อัตราส่วนคอมเมนต์/โหวตจะเกิน 0.5 หัวข้อแนวคลิกเบต การถกเถียงเรื่องเพศ และเรื่องรถยนต์ทำผลงานได้ดีเป็นพิเศษ
ค่าเฉลี่ยคะแนน 35 นี่เชื่อยากนะ แต่ก่อนค่าเฉลี่ยน่าจะราว 8 เลยอยากรู้เกณฑ์การสุ่มตัวอย่าง
- กลุ่มตัวอย่างเก็บจากทุกโพสต์และทุกคอมเมนต์ในช่วง 35 วันที่ผ่านมา ด้วย hn-archiver API
  เป็นไปได้ว่าโพสต์ที่ได้ 0 คะแนนถูกตกหล่นไป เลยทำให้ค่าเฉลี่ยสูง ขอบคุณสำหรับฟีดแบ็ก จะกลับไปตรวจอีกครั้งก่อนตีพิมพ์งาน และตัวจำแนกของคุณก็น่าสนใจเหมือนกัน
- ตัวอย่าง “Richard Stallman is Dead” นี่ตลกมาก ทำให้นึกถึงพาดหัวหนังสือพิมพ์เก่าว่า “Generalissimo Francisco Franco Is Still Dead” แน่นอนว่า RMS ยังมีชีวิตอยู่
- ขอถามแบบส่วนตัวหน่อย เห็นคุณโพสต์งานวิจัยบ่อยมาก เคยเห็นเกิน 30 โพสต์ต่อวัน ไม่น่าจะอ่านหมดได้ เลยอยากรู้แรงจูงใจและกระบวนการคัดเลือกข้อมูลของคุณ
ฉันก็เห็นปรากฏการณ์คล้ายกันในคอมเมนต์ คอมเมนต์สั้นๆ แบบประชดประชันได้รับการตอบสนองดีกว่าบทวิเคราะห์ยาวๆ มาก
คอมเมนต์ยาวที่ตั้งใจเขียนกลับถูกเมิน แต่คอมเมนต์สั้นๆ ที่เขียนแบบฉับพลันกลับ “ระเบิด” บ่อยๆ จนน่าผิดหวัง
- คาร์มาของฉันคือ 104,872 หน้า HN Leaders กับ Best Comments น่าสนใจดี
  HN ไม่ชอบมุกตลก ยกเว้นกรณีที่มีคำอธิบายประกอบ
- ข้อความยาวไม่ได้แปลว่าดีเสมอไป มีสุนทรียะแห่งความกระชับอยู่ การสร้างอิมแพ็กต์ด้วย 20 ตัวอักษรยากและมีค่ากว่า 2,000 ตัวอักษรเสียอีก
- ฉันก็ใช้สองบัญชีเหมือนกัน บัญชีที่คอมเมนต์แบบใช้อารมณ์หรือฉับพลันมีประสิทธิภาพด้านคาร์มาสูงกว่าบัญชีหลัก 4 เท่า แต่ค่าเฉลี่ยต่ำกว่าและความแปรปรวนสูง
- ที่บอกว่า “คอนเทนต์ดีไม่ได้รับรางวัล” บางทีอาจเป็นเพราะเราไม่ได้สร้างคอนเทนต์ที่ดีอย่างที่คิดก็ได้
  ถ้าลองทำบล็อกเองก็น่าจะสัมผัสเกณฑ์ของการมีส่วนร่วมแบบนี้ได้ดีขึ้น
- ฉันก็ว่าจะดูเรื่องนี้แล้วเปลี่ยนนิสัยการอัปโหวตของตัวเอง อยากรู้ว่าอัปโหวตแบบเงียบๆ บน HN นับเป็นการแสดงความเห็นด้วยหรือเปล่า
ถ้าคำว่า “เชิงลบ” รวมถึงการวิจารณ์ทางเทคนิค ความไม่พอใจต่ออุตสาหกรรม หรือความหงุดหงิดกับ API การสนทนาส่วนใหญ่บน HN ก็ตกอยู่ในหมวดนี้
ไปคอมเมนต์ “ชอบ” ใต้โพสต์ประชาสัมพันธ์ของ OpenAI มันไม่มีความหมาย การมีส่วนร่วมที่มีคุณค่าจริงๆ คือการวิเคราะห์เชิงวิพากษ์
ฉันกลับคิดว่าโพสต์ยอดนิยมที่ไม่มีคอมเมนต์เป็นหลักฐานว่าไซต์กำลังทำงานได้ดี
- ชอบที่นำเสนอแต่ข้อมูล แล้วปล่อยให้ผู้อ่านตีความเอง
- เห็นด้วยว่าควรแยก “ความเป็นลบ” เป็นเชิงวิพากษ์ vs เชิงเป็นพิษ การเอาสองอย่างนี้มาปนกันเป็นความผิดพลาด
เราคัดกรองตัวเองให้ชอบปฏิกิริยาเชิงลบ เนื้อหาเชิงบวกมักจบในตัวจึงไม่กระตุ้นการตอบสนอง แต่เนื้อหาเชิงลบกระตุ้นให้เกิดปฏิสัมพันธ์
- ด้วยโครงสร้างของเว็บไซต์ คอมเมนต์เชิงบวกแบบสั้นๆ ถูกแทนที่ด้วยปุ่มอัปโหวต
- คอมเมนต์ที่มีแค่ “ชอบ” ถูกมองว่าไม่มีความหมาย ผลลัพธ์คือมีคอมเมนต์เป็นกลางหรือเชิงวิพากษ์มากขึ้น
- มนุษย์ไวต่อสิ่งกระตุ้นเชิงลบตามวิวัฒนาการ เพราะสิ่งมีชีวิตที่มองข้ามอันตรายไม่รอดมาได้
  เพราะงั้นเราจึงถูกดึงดูดด้วยข่าวร้ายมากกว่า ส่วนข่าวดีมักแค่เลื่อนผ่าน นี่คือแก่นของเศรษฐกิจความสนใจ
- ฉันเรียนรู้จากคอมเมนต์ที่เพิ่มข้อมูลมากกว่าคำวิจารณ์แบบทำลายล้าง ข้อความแบบนั้นใหม่กว่าและมีความเชี่ยวชาญมากกว่า
- (พูดเล่นๆ) “ใช่เลย! … อ้อ เดี๋ยวก่อน”
การวิจารณ์ทางเทคนิคไม่เหมือนกับการโจมตีตัวบุคคล ความเป็นลบของ HN ส่วนใหญ่คือคำวิจารณ์เชิงสร้างสรรค์
ถ้าความประชดประชันมากเกินไป ก็จะมี “การบ่นเรื่องการบ่น” โผล่มาเสมอ
ฉันคิดว่าการมีคนบอกว่า “มีอะไรติดฟันนะ” ดีกว่าคำชม
- งานวิจัยควรจัดการความแตกต่างนี้ให้ชัดขึ้น โมเดลแยกไม่ออกระหว่าง “การออกแบบ API นี้ผิด” กับ “บริษัทนี้ห่วย”
  เพราะการม็อดเดอเรตของ HN ลบเนื้อหาที่เป็นปฏิปักษ์ออกอย่างรวดเร็ว สิ่งที่เหลืออยู่ส่วนใหญ่จึงเป็นคำวิจารณ์ที่มีประสิทธิผล
  จุดที่น่าสนใจก็คือ “ความเป็นลบ” แบบนี้สัมพันธ์กับอัตราการมีส่วนร่วมสูงขึ้น 27% หมายความว่าชุมชนสายเทคนิคให้คุณค่ากับการวิจารณ์มากกว่าการประชาสัมพันธ์
  ฉันวางแผนจะระบุในงานว่า “อารมณ์เชิงลบ” ที่ว่านี้คือการวิจารณ์เชิงประเมินตามเกณฑ์ของโมเดล SST-2 ไม่ใช่คำพูดเป็นพิษ
- ความประชดประชันไม่ใช่ปรัชญาแห่งการพูดความจริง การพูดข้อเท็จจริงไม่ใช่การวิจารณ์
ตอนที่ Reddit API ยังเข้าถึงได้ ฉันเคยทดลองบล็อกซับเรดดิตที่มีอารมณ์เชิงลบด้วยแอปอ่าน rif
พอบล็อกไปหลายร้อยอัน เหลือแต่คอนเทนต์เชิงบวกเกี่ยวกับสัตว์กับงานอดิเรก เลยตระหนักว่า Reddit ขับเคลื่อนด้วยความเป็นลบแค่ไหน แต่ขณะเดียวกันพอมันหายไปก็น่าเบื่อมากเหมือนกัน
ลิงก์รายการบล็อก
- บรรยากาศประชดประชันของ Reddit เหมือนโรคระบาด คนไม่มีความสุขมารวมตัวกันแล้วตอกย้ำความสิ้นหวังของกันและกัน ส่วนใหญ่เป็นคนอายุน้อยและประสบการณ์ยังน้อย
- ที่คอนเทนต์ถกเถียงกันได้ถูกพูดถึงมากกว่า ก็เป็นธรรมชาติของมนุษย์ ปัญหาความรักของเพื่อนเราฟังได้นาน แต่ถ้าเขาสบายดีเราก็ไม่ค่อยมีอะไรจะพูด
- ฉันก็หลีกเลี่ยงการเมืองหรือคอนเทนต์ยั่วยุ แล้วดูแต่โพสต์แนวงานอดิเรกหรือการสร้างสรรค์ Reddit เป็นพื้นที่ที่ปะปนกันจริงๆ
- ฉันคิดว่าสัดส่วนบวก/ลบราว 45:65 คือจุดสมดุลที่น่าสนใจที่สุด ถ้า 50:50 เนื้อหาจะธรรมดาเกินไป ในแง่นี้ HN ดีกว่าโซเชียลมีเดีย
- ฉันยังใช้ rif อยู่เลย ใช้ Revanced เปลี่ยน API key เอา ช่วงนี้โพสต์แนวล่อ AIของ Reddit เพิ่มขึ้น เลยบล็อกซับเรดดิตที่เกี่ยวข้อง
  โพสต์แบบนี้ให้ความรู้สึกเหมือนบอตคุยกับบอต ฉันสงสัยว่า Reddit ปล่อยโครงสร้างแบบนี้ไว้เพื่อเพิ่มการแสดงโฆษณา
บนอินเทอร์เน็ต ไม่มีอะไรทรงพลังกว่าการบ่นหรือการไปแก้คนอื่นแล้ว
ในฐานะผู้ใช้ ESL (English as a Second Language) คำศัพท์อินเทอร์เน็ตคำแรกที่ฉันเรียนรู้คือ “flamewar”
- ก็มีคนถามเหมือนกันว่า ESL คืออะไร
ตามงานวิจัย ความเหลื่อมล้ำด้านความสนใจบน HN รุนแรงมาก มีค่าสัมประสิทธิ์จีนี 0.89 สูงกว่า Twitter
เป็นไปได้มากว่านี่เกิดจากโครงสร้างการมองเห็นของ HN โพสต์ใหม่เริ่มจาก /newest และถ้าไม่ได้รับความสนใจจากคนกลุ่มเล็กๆ ในช่วงแรก ก็จะแทบหายไปเลย
ต่างจากโครงสร้างแบบ Reddit ที่มีการมองเห็นพื้นฐาน HN ต้องผ่านด่านแรกให้ได้ก่อนถึงจะขึ้นหน้าหลัก
- ด้วยโครงสร้างนี้ ปฏิกิริยาในช่วงแรกจึงทำหน้าที่เป็นตัวชี้วัดทำนายความสำเร็จ
วิศวกรมีอาชีพเป็นคนแก้ปัญหา จึงคิดแบบวิพากษ์วิจารณ์โดยธรรมชาติ
ในงานแสดงสินค้าอุตสาหกรรม วิศวกรจะยืนกอดอกและเข้าหาอย่างเยือกเย็น แต่ชุมชนเมกเกอร์เต็มไปด้วยพลังบวก
ท้ายที่สุดแล้ว มันก็เป็นแค่ความต่างระหว่าง “แก้วน้ำพร่องครึ่งหนึ่ง” กับ “แก้วน้ำเต็มครึ่งหนึ่ง”

65% ของโพสต์บน Hacker News มีอารมณ์เชิงลบ และโพสต์เหล่านี้ทำผลงานได้ดีกว่า

ผลการวิเคราะห์อารมณ์ของ Hacker News

ข้อมูลและองค์ประกอบของโมเดล

นิยามและลักษณะของอารมณ์เชิงลบ

แผนการเปิดเผยในอนาคต

บทความที่เกี่ยวข้อง

2 ความคิดเห็น

ความเห็นจาก Hacker News