- งานวิจัย การวิเคราะห์อารมณ์ของโพสต์บน Hacker News พบว่าประมาณ 65% ของทั้งหมดถูกจัดเป็นอารมณ์เชิงลบ และโพสต์เหล่านี้ทำคะแนนได้สูงกว่าโดยเฉลี่ย
- คะแนนเฉลี่ยของโพสต์เชิงลบอยู่ที่ 35.6 คะแนน ขณะที่ค่าเฉลี่ยรวมอยู่ที่ 28 คะแนน ซึ่งยืนยันได้ว่ามี ส่วนเพิ่มด้านผลงานราว 27%
- การวิเคราะห์ดำเนินการกับ โพสต์ 32,000 รายการและคอมเมนต์ 340,000 รายการ และพบแนวโน้มเอนเอียงไปทางลบอย่างสม่ำเสมอใน โมเดล 6 ชนิด
- โมเดลที่ใช้ประกอบด้วย DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B และแดชบอร์ดสุดท้ายใช้ผลลัพธ์จาก DistilBERT ด้วยเหตุผลด้านประสิทธิภาพ
- เนื้อหาเชิงลบส่วนใหญ่เป็น การวิจารณ์อย่างสร้างสรรค์ เช่น การวิจารณ์เทคโนโลยี ความไม่พอใจต่ออุตสาหกรรม และความหงุดหงิดกับ API ซึ่งบ่งชี้ถึง ความสัมพันธ์ระหว่างการมีส่วนร่วมกับความเป็นประเด็นถกเถียง
ผลการวิเคราะห์อารมณ์ของ Hacker News
- คะแนนเฉลี่ยของโพสต์บน Hacker News คือ 28 คะแนน ขณะที่โพสต์ที่มีอารมณ์เชิงลบมี ค่าเฉลี่ย 35.6 คะแนน สะท้อนการมีส่วนร่วมที่สูงกว่า
- ผลงานของโพสต์เชิงลบสูงกว่าค่าเฉลี่ยรวม 27%
- งานวิจัยกล่าวถึง พลวัตของความสนใจบน HN (Hacker News) รวมถึง เส้นโค้งการเสื่อมถอย, preferential attachment, ความน่าจะเป็นการอยู่รอด, การคาดการณ์การมีส่วนร่วมระยะแรก เป็นต้น
- มีการ เผยแพร่บทความ preprint ที่ SSRN
ข้อมูลและองค์ประกอบของโมเดล
- ข้อมูลที่นำมาวิเคราะห์คือ โพสต์ 32,000 รายการและคอมเมนต์ 340,000 รายการ
- ประมาณ 65% ของทั้งหมดถูกจัดเป็นอารมณ์เชิงลบ
- ผู้วิจัยกล่าวถึงความเป็นไปได้ที่ตัวจำแนกอาจมีอคติไปทางลบ แต่พบว่า ทั้ง 6 โมเดลให้แนวโน้มเดียวกัน
- โมเดลที่ใช้ได้แก่ DistilBERT, BERT Multi, RoBERTa (แบบ transformer) และ Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (แบบ LLM)
- การกระจายของอารมณ์แตกต่างกันไปตามแต่ละโมเดล แต่ แนวโน้มเอนเอียงเชิงลบยังคงเหมือนกัน
- แดชบอร์ดสุดท้ายใช้ ผลลัพธ์จาก DistilBERT ซึ่งทำงานได้อย่างมีประสิทธิภาพบน pipeline ที่ใช้ Cloudflare
นิยามและลักษณะของอารมณ์เชิงลบ
- เนื้อหาที่ถูกจัดเป็น “เชิงลบ” ได้แก่ การวิจารณ์เทคโนโลยี, ความกังขาต่อการประกาศ, ความไม่พอใจต่อแนวปฏิบัติในอุตสาหกรรม, ความหงุดหงิดเกี่ยวกับ API เป็นต้น
- ความเป็นลบส่วนใหญ่เป็น การวิจารณ์ที่มีสาระ ไม่ใช่การโจมตีบุคคล
- การวิจารณ์ทางเทคนิคมีลักษณะแตกต่างจากการโจมตีส่วนตัว
- ผู้วิจัยยอมรับทั้งสองความเป็นไปได้ คือ ความเป็นลบอาจกระตุ้นการมีส่วนร่วม หรือ คอนเทนต์ที่ชวนถกเถียงอาจดึงดูดทั้งการแสดงออกเชิงลบและความสนใจพร้อมกัน
แผนการเปิดเผยในอนาคต
- ผู้วิจัยมีแผนจะเปิดเผย โค้ดทั้งหมด, ชุดข้อมูล, และแดชบอร์ดสำหรับ HN archiver ในเร็ว ๆ นี้
2 ความคิดเห็น
ผู้คนสนใจเรื่องซุบซิบและสัญญาณรบกวนมากกว่า [included การสรุปเหมารวมแบบรีบด่วน]
ความเห็นจาก Hacker News
คิดว่าตัวตัวจำแนกของ OP ตั้งสมมติฐาน 2 อย่างที่ส่งผลต่อผลลัพธ์
ตอนนี้ฉันกำลังเขียนคอมเมนต์เชิงวิจารณ์อยู่ แต่ไม่ได้แปลว่ามัน “เชิงลบ” เสมอไป ตรงกันข้ามเลย การที่วิจารณ์ได้ก็เพราะข้อมูลและข้อสรุปของ OP ชัดเจน แบบนี้แหละที่ฉันคิดว่าเป็นคำวิจารณ์เชิงสร้างสรรค์ ซึ่งเป็นหลักฐานของการถกเถียงที่ดี
ที่ว่าท่าทีแบบสงสัยถูกจัดเป็นเชิงลบนั้นก็ถูกอยู่บางส่วน ชุดข้อมูลฝึก SST-2 ถือว่าการประเมินเชิงวิจารณ์เป็นเชิงลบ แต่ในที่นี้ “เชิงลบ” ไม่ได้หมายถึงเป็นปฏิปักษ์ แต่หมายถึงเชิงประเมิน วัฒนธรรมการวิจารณ์ของ HN จึงถูกอ่านว่าเป็นลบในโมเดลแบบนี้ แต่ก็เป็นเรื่องธรรมชาติในบริบทของวาทกรรมทางเทคนิค
ความเป็นกลางมีอยู่ในรูปคะแนนต่อเนื่องใกล้ 0.5 ผู้ใช้ HN มักมีแนวโน้มจะแสดงจุดยืนที่ชัดเจน จึงเห็นการกระจายตัวไปทางสุดขั้วทั้งสองด้าน น่าจะคุ้มค่าที่จะลองโมเดลแบบ 3 คลาสในอนาคต
คอมเมนต์ของคุณเป็นเชิงวิจารณ์ แต่ก็เป็นวาทกรรมคุณภาพสูง ฉันมองว่าความเป็นลบของ HN ไม่ใช่ความเป็นปฏิปักษ์ แต่เป็นคำวิจารณ์เชิงสร้างสรรค์ที่กระตุ้นการมีส่วนร่วม
ลิงก์โมเดล DistilBERT SST-2
โพสต์เชิงลบที่ฉันลงได้รับการตอบสนองดีกว่าโพสต์เป็นกลางหรือเชิงบวก
หัวข้อ “Richard Stallman is Dead” มีอัตราการคลิกสูงที่สุด และอีกโมเดลหนึ่งก็ทำนายความน่าจะเป็นที่อัตราส่วนคอมเมนต์/โหวตจะเกิน 0.5 หัวข้อแนวคลิกเบต การถกเถียงเรื่องเพศ และเรื่องรถยนต์ทำผลงานได้ดีเป็นพิเศษ
ค่าเฉลี่ยคะแนน 35 นี่เชื่อยากนะ แต่ก่อนค่าเฉลี่ยน่าจะราว 8 เลยอยากรู้เกณฑ์การสุ่มตัวอย่าง
เป็นไปได้ว่าโพสต์ที่ได้ 0 คะแนนถูกตกหล่นไป เลยทำให้ค่าเฉลี่ยสูง ขอบคุณสำหรับฟีดแบ็ก จะกลับไปตรวจอีกครั้งก่อนตีพิมพ์งาน และตัวจำแนกของคุณก็น่าสนใจเหมือนกัน
ฉันก็เห็นปรากฏการณ์คล้ายกันในคอมเมนต์ คอมเมนต์สั้นๆ แบบประชดประชันได้รับการตอบสนองดีกว่าบทวิเคราะห์ยาวๆ มาก
คอมเมนต์ยาวที่ตั้งใจเขียนกลับถูกเมิน แต่คอมเมนต์สั้นๆ ที่เขียนแบบฉับพลันกลับ “ระเบิด” บ่อยๆ จนน่าผิดหวัง
HN ไม่ชอบมุกตลก ยกเว้นกรณีที่มีคำอธิบายประกอบ
ถ้าลองทำบล็อกเองก็น่าจะสัมผัสเกณฑ์ของการมีส่วนร่วมแบบนี้ได้ดีขึ้น
ถ้าคำว่า “เชิงลบ” รวมถึงการวิจารณ์ทางเทคนิค ความไม่พอใจต่ออุตสาหกรรม หรือความหงุดหงิดกับ API การสนทนาส่วนใหญ่บน HN ก็ตกอยู่ในหมวดนี้
ไปคอมเมนต์ “ชอบ” ใต้โพสต์ประชาสัมพันธ์ของ OpenAI มันไม่มีความหมาย การมีส่วนร่วมที่มีคุณค่าจริงๆ คือการวิเคราะห์เชิงวิพากษ์
ฉันกลับคิดว่าโพสต์ยอดนิยมที่ไม่มีคอมเมนต์เป็นหลักฐานว่าไซต์กำลังทำงานได้ดี
เราคัดกรองตัวเองให้ชอบปฏิกิริยาเชิงลบ เนื้อหาเชิงบวกมักจบในตัวจึงไม่กระตุ้นการตอบสนอง แต่เนื้อหาเชิงลบกระตุ้นให้เกิดปฏิสัมพันธ์
เพราะงั้นเราจึงถูกดึงดูดด้วยข่าวร้ายมากกว่า ส่วนข่าวดีมักแค่เลื่อนผ่าน นี่คือแก่นของเศรษฐกิจความสนใจ
การวิจารณ์ทางเทคนิคไม่เหมือนกับการโจมตีตัวบุคคล ความเป็นลบของ HN ส่วนใหญ่คือคำวิจารณ์เชิงสร้างสรรค์
ถ้าความประชดประชันมากเกินไป ก็จะมี “การบ่นเรื่องการบ่น” โผล่มาเสมอ
ฉันคิดว่าการมีคนบอกว่า “มีอะไรติดฟันนะ” ดีกว่าคำชม
เพราะการม็อดเดอเรตของ HN ลบเนื้อหาที่เป็นปฏิปักษ์ออกอย่างรวดเร็ว สิ่งที่เหลืออยู่ส่วนใหญ่จึงเป็นคำวิจารณ์ที่มีประสิทธิผล
จุดที่น่าสนใจก็คือ “ความเป็นลบ” แบบนี้สัมพันธ์กับอัตราการมีส่วนร่วมสูงขึ้น 27% หมายความว่าชุมชนสายเทคนิคให้คุณค่ากับการวิจารณ์มากกว่าการประชาสัมพันธ์
ฉันวางแผนจะระบุในงานว่า “อารมณ์เชิงลบ” ที่ว่านี้คือการวิจารณ์เชิงประเมินตามเกณฑ์ของโมเดล SST-2 ไม่ใช่คำพูดเป็นพิษ
ตอนที่ Reddit API ยังเข้าถึงได้ ฉันเคยทดลองบล็อกซับเรดดิตที่มีอารมณ์เชิงลบด้วยแอปอ่าน rif
พอบล็อกไปหลายร้อยอัน เหลือแต่คอนเทนต์เชิงบวกเกี่ยวกับสัตว์กับงานอดิเรก เลยตระหนักว่า Reddit ขับเคลื่อนด้วยความเป็นลบแค่ไหน แต่ขณะเดียวกันพอมันหายไปก็น่าเบื่อมากเหมือนกัน
ลิงก์รายการบล็อก
โพสต์แบบนี้ให้ความรู้สึกเหมือนบอตคุยกับบอต ฉันสงสัยว่า Reddit ปล่อยโครงสร้างแบบนี้ไว้เพื่อเพิ่มการแสดงโฆษณา
บนอินเทอร์เน็ต ไม่มีอะไรทรงพลังกว่าการบ่นหรือการไปแก้คนอื่นแล้ว
ในฐานะผู้ใช้ ESL (English as a Second Language) คำศัพท์อินเทอร์เน็ตคำแรกที่ฉันเรียนรู้คือ “flamewar”
ตามงานวิจัย ความเหลื่อมล้ำด้านความสนใจบน HN รุนแรงมาก มีค่าสัมประสิทธิ์จีนี 0.89 สูงกว่า Twitter
เป็นไปได้มากว่านี่เกิดจากโครงสร้างการมองเห็นของ HN โพสต์ใหม่เริ่มจาก /newest และถ้าไม่ได้รับความสนใจจากคนกลุ่มเล็กๆ ในช่วงแรก ก็จะแทบหายไปเลย
ต่างจากโครงสร้างแบบ Reddit ที่มีการมองเห็นพื้นฐาน HN ต้องผ่านด่านแรกให้ได้ก่อนถึงจะขึ้นหน้าหลัก
วิศวกรมีอาชีพเป็นคนแก้ปัญหา จึงคิดแบบวิพากษ์วิจารณ์โดยธรรมชาติ
ในงานแสดงสินค้าอุตสาหกรรม วิศวกรจะยืนกอดอกและเข้าหาอย่างเยือกเย็น แต่ชุมชนเมกเกอร์เต็มไปด้วยพลังบวก
ท้ายที่สุดแล้ว มันก็เป็นแค่ความต่างระหว่าง “แก้วน้ำพร่องครึ่งหนึ่ง” กับ “แก้วน้ำเต็มครึ่งหนึ่ง”