บอต บอตเยอะเกินไป

(wakatime.com)

1 คะแนน โดย GN⁺ 2024-10-02 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ProductHunt เป็นแพลตฟอร์มเปิดตัวผลิตภัณฑ์ที่มีผู้สมัครสมาชิกมากกว่า 1 ล้านราย แต่จากการวิเคราะห์ข้อมูลสาธารณะพบว่า มากกว่า 60% ของสมาชิกถูกจัดว่าเป็นบัญชีบอตอัตโนมัติ
เมื่อลองเปิดตัวเองโดยใส่ LLM prompt injection ไว้ในคำอธิบายผลิตภัณฑ์ พบว่าคอมเมนต์แทบทั้งหมดเป็นระบบอัตโนมัติ และคอมเมนต์จำนวนมากในช่วงหลังก็ดูเหมือนสร้างโดย ChatGPT
เนื่องจากยืนยันได้ยากว่าเป็นบอตหรือไม่จากข้อมูลสาธารณะเพียงอย่างเดียว จึงใช้ คะแนนความเสี่ยง ที่รวมช่วงเวลาการใช้งาน รูปแบบการโหวต การซ้อนทับกับบอตอื่น และเนื้อหาคอมเมนต์เข้าด้วยกัน
หลังปี 2018 จำนวนการสมัครของบอตแซงหน้าผู้ใช้จริง และในปี 2022 อัปโหวตจากบอต ก็แซงอัปโหวตจากผู้ใช้จริง ทำให้มีความเป็นไปได้มากขึ้นว่าวงแหวนโหวตจะส่งผลต่ออันดับ
การเปิดตัวบน ProductHunt อาจยังเป็นโอกาสในการสร้างการมองเห็นได้อยู่ แต่ในทางปฏิบัติควรเตรียมตัวแบบสั้น ๆ และไม่ใช้เวลามากเกินไป แทนที่จะคาดหวังผลจากการตอบคอมเมนต์หรือ SEO

กิจกรรมของบอตที่ปรากฏบน ProductHunt

ProductHunt เคยมีประโยชน์มาตั้งแต่ต้นปี 2014 สำหรับการติดตามการเปิดตัวผลิตภัณฑ์เทคโนโลยีใหม่ ๆ การค้นหาเครื่องมือคล้ายกันผ่านคอมเมนต์ หรือการรวบรวมฟีดแบ็กต่อผลิตภัณฑ์ของตนเอง
ช่วงหลังคอมเมนต์ของผลิตภัณฑ์ส่วนใหญ่ดูเหมือนเป็น คอมเมนต์ที่สร้างโดย ChatGPT จึงลองเปิดตัวเองโดยใส่ LLM prompt injection แบบง่าย ๆ ลงในคำอธิบายผลิตภัณฑ์
หลังเปิดตัวพบว่าคอมเมนต์แทบทั้งหมดเป็นระบบอัตโนมัติ ทำให้ยิ่งเกิดคำถามว่าการที่ผู้เปิดตัวบน ProductHunt ต้องมาตอบคอมเมนต์นั้นอาจเป็นการเสียเวลา
มีอีเมลส่งมาเรื่อย ๆ ว่าให้บริการอัปโหวตแบบเสียเงิน และใน Reddit ก็มีกรณีที่บอกว่าเคยซื้ออัปโหวต ProductHunt สองครั้ง

ข้อมูลสาธารณะที่ใช้ในการวิเคราะห์

มีการวิเคราะห์รายการผู้ใช้ การเปิดตัว อัปโหวต และคอมเมนต์ของ ProductHunt ที่เข้าถึงได้แบบสาธารณะ
ขนาดข้อมูลมีดังนี้
- การสมัครผู้ใช้: มากกว่า 1 ล้านรายการ
- การเปิดตัว: มากกว่า 300,000 รายการ
- คอมเมนต์: 2.5 ล้านรายการ
- อัปโหวต: 20 ล้านรายการ
แต่ละผลิตภัณฑ์มี อันดับรายวัน ซึ่งเป็นคะแนนหลังจาก 24 ชั่วโมงนับจากเที่ยงคืนตามเวลา PDT ของวันเปิดตัว
- อันดับ 1 คือ daily rank 1
- ผลิตภัณฑ์บางรายการมี rank เป็น null ซึ่งอาจเกิดจากการลบ การถูกรายงาน หรือไม่ได้เปิดตัว

วิธีแยกแยะบัญชีบอต

การตรวจจับบอตทำได้ยากจากข้อมูลสาธารณะเพียงอย่างเดียว ดังนั้นเกณฑ์เดียวจึงไม่เพียงพอ
ในตอนแรกพยายามวิเคราะห์ช่วงเวลาที่ผู้ใช้คอมเมนต์เพื่อหาลักษณะร่วม
- ผู้ใช้รายหนึ่งสมัครมา 677 วัน มีคอมเมนต์ 2,009 รายการ และอัปโหวต 4,649 ครั้ง ดูเหมือน power user ที่ใช้งานอัตโนมัติ แต่ไม่ได้ถูกจัดเป็นบอต
- ผู้ใช้อีกรายสมัครมา 140 วัน มีคอมเมนต์ 173 รายการ และอัปโหวต 246 ครั้ง โดยช่วงห่างของคอมเมนต์มีความสม่ำเสมอ และกราฟดูไม่ลื่นไหลแต่เป็นทรงกล่อง
สุดท้ายจึงนำหลายสัญญาณมารวมกันเพื่อให้ คะแนนความเสี่ยง แก่ผู้ใช้แต่ละราย
- ระยะเวลาที่บัญชีมีการใช้งาน
- รูปแบบอัปโหวตตามเวลา
- จำนวนอัปโหวตที่แชร์ร่วมกับบอตอื่น
- เนื้อหาคอมเมนต์
ในคอมเมนต์ที่สร้างโดย ChatGPT มักพบคำอย่าง game-changer บ่อยกว่า
คอมเมนต์จากบอตมักมีอักขระที่พิมพ์เองได้ยากอย่าง em-dash หรือใส่ชื่อผลิตภัณฑ์ที่ยาวมากหรือมี ™ แบบตรงตัว
บัญชีบอตบางส่วนใช้ชื่อและคำแนะนำตัวจาก LinkedIn ของคนจริงแบบคัดลอกตรง ๆ แต่เมื่อสอบถาม บุคคลเหล่านั้นตอบว่าไม่เคยสร้างบัญชี ProductHunt
การทำคลัสเตอร์ช่วยได้บางส่วน แต่บอตหลายบัญชีถูกใช้แล้วทิ้ง จึงมักซ้อนทับกับบอตอื่นเพียงรายการเดียวในชุดการโหวตแบบสุ่มหลายรายการ
- cupy และ cudf ยังไม่มีเมธอดที่จำเป็นบน GPU จึงรันการทำคลัสเตอร์ได้เฉพาะกับชุดข้อมูลขนาดเล็ก
- หากมีผู้มีประสบการณ์มากกว่านี้เข้ามาทำ ก็อาจปรับปรุงการตรวจจับบอตได้
จากผลวิเคราะห์พบว่า มากกว่า 60% ของการสมัครผู้ใช้ถูกตรวจจับว่าเป็นบัญชีบอตอัตโนมัติ
- ไม่ได้จับบอตได้ทั้งหมด จึงถือเป็นตัวเลขแบบอนุรักษนิยม
- หากมีข้อมูลภายในของ ProductHunt ก็จะตรวจหากิจกรรมบอตได้แม่นยำกว่านี้

การเปลี่ยนแปลงของกิจกรรมบอตตามเวลา

การสมัครผู้ใช้
- หลังปี 2018 มีการสร้างผู้ใช้บอตมากกว่าผู้ใช้จริง
คอมเมนต์
- ตั้งแต่ปลายปี 2022 คอมเมนต์จากบอตเพิ่มขึ้นอย่างมาก
- ช่วงเวลานี้ใกล้เคียงกับตอนที่ ChatGPT เปิดให้ใช้งานอย่างแพร่หลาย
- การพุ่งขึ้นในปี 2024 อาจเป็นเพราะเมื่อเวลาผ่านไปบัญชีบอตถูกลบ
- บัญชีใหม่ล่าสุดอาจยังไม่ถูกลบ จึงเข้าถึงคอมเมนต์ได้ง่ายกว่า
อัปโหวต
- ในปี 2022 อัปโหวตจากบอตแซงอัปโหวตจากผู้ใช้จริง
- บอตสร้าง วงแหวนโหวต เพื่อเพิ่มโอกาสในการได้เข้าไปอยู่ในจดหมายข่าวของ ProductHunt
อันดับ
- การเปิดตัวส่วนใหญ่ได้รับอัปโหวตจากผู้ใช้จริงเพียงไม่กี่ครั้ง
- บอตพยายามโหวตแบบสุ่มเพื่อให้ดูกลมกลืน ดังนั้นเส้นแนวโน้มของอัปโหวตจากบอตจึงเรียบกว่าอัปโหวตจากผู้ใช้จริง

ความสัมพันธ์ระหว่างอันดับรายวันกับอัปโหวตจากบอต

ผลิตภัณฑ์ที่ได้อันดับ 1 บน ProductHunt จะถูกแนะนำในจดหมายข่าวรายวันและรายสัปดาห์
การจะได้อันดับ 1 ดูเหมือนว่าระดับ 15% ของคะแนนโหวตจากบอต ยังถือว่าปลอดภัย
การเปิดตัวที่มีคะแนนโหวตจากบอตเกิน 60% ดูเหมือนจะไม่ขึ้นอันดับ 1 ไม่ว่าด้วยเหตุผลใดก็ตาม
หากดูเฉพาะการเปิดตัวตั้งแต่ปี 2020 เป็นต้นมา บอตมีสัดส่วนของอัปโหวตมากขึ้นในโพสต์อันดับต้น ๆ ช่วงหลัง
มีมุมมองว่าการเปิดตัวที่ซื้ออัปโหวตอาจไม่ใช่ผลิตภัณฑ์คุณภาพสูง จึงมักอยู่ใน 5 อันดับแรกมากกว่าจะได้อันดับ 1

ประสิทธิผลของการเปิดตัวบน ProductHunt

ถึงแม้คอมเมนต์และอัปโหวตส่วนใหญ่จะเป็นบอต แต่บน ProductHunt อาจยังมีผู้ใช้จริงอยู่บ้าง
หากจ่ายเงินให้บอตจนได้ไปอยู่ในจดหมายข่าว ก็อาจมีโอกาสที่คนจริงจะเห็นผลิตภัณฑ์มากขึ้น
การเปิดตัวบน ProductHunt ไม่มีผลด้าน backlink SEO
- หาก Google จะนับเป็น backlink ลิงก์ a ที่ชี้ไปยังผลิตภัณฑ์ต้องไม่มี nofollow
- ลิงก์ผลิตภัณฑ์ของ ProductHunt มี nofollow จึงไม่ถูกนับเป็น backlink โดยเสิร์ชเอนจิน
- หากใส่ลิงก์ให้ผลิตภัณฑ์เพียงลิงก์เดียว องค์ประกอบที่ได้จะเป็น button ที่เปิดหน้าผลิตภัณฑ์ผ่าน JavaScript ไม่ใช่ลิงก์จริง
- เว็บไซต์รวมข้อมูลอื่นอาจดึงการเปิดตัวไปแสดงและลิงก์กลับได้ แต่ตัว ProductHunt เองไม่ถูกนับเป็น backlink
ในหมู่นักลงทุนบางส่วน มีคนที่ให้ความสำคัญกับ ป้าย #1 ของ ProductHunt จึงอาจช่วยได้เมื่อต้องคุยกับนักลงทุน
โดยรวมแล้วการเปิดตัวบน ProductHunt ยังพอคุ้มที่จะลอง แต่ไม่ควรใช้เวลาเกินไม่กี่นาทีไปกับการเตรียมตัว และไม่ควรเสียเวลาไปกับการตอบคอมเมนต์

การวิเคราะห์ที่ยังเหลือและโปรเจกต์ที่เกี่ยวข้อง

เดิมทีอยากทำรายการการเปิดตัวแบบตัดคะแนนโหวตจากบอตออก เพื่อดูว่าหากไม่มีบอตแล้ว ผลิตภัณฑ์อันดับ 1 ของวันนั้นจะเปลี่ยนหรือไม่
แต่ไม่อยากชี้เป้าการเปิดตัวที่มีบอตอัปโหวตมากทั้งที่จริง ๆ ไม่ได้จ่ายเงิน และก็ไม่อยากช่วยโปรโมตเพิ่มให้การเปิดตัวที่จ่ายเงินแล้ว จึงเลื่อนการวิเคราะห์นี้ไปไว้ในบทความถัดไป
มีการพูดคุยที่เกี่ยวข้องบน HN
นอกจากนี้ยังมีการแนะนำ wonderful.dev และ wonderful.dev/alan ในฐานะความพยายามที่จะแก้ปัญหาของ ProductHunt ด้วย

1 ความคิดเห็น

GN⁺ 2024-10-02

ความคิดเห็นจาก Hacker News

สงสัยว่า ProductHunt ใช้ โซลูชัน CAPTCHA อะไรอยู่หรือเปล่า
CAPTCHA มักถูกด่าก็จริง แต่ผมยังมองว่ามันมีคุณค่ามากในการกันการโจมตีสแปมส่วนใหญ่แบบนี้ ปัญหาเรื่องการใช้งาน การเข้าถึง และความเป็นส่วนตัว ในช่วงไม่กี่ปีมานี้ก็ปรับปรุงไปในทิศทางที่ทำงานได้โดยไม่ต้องให้ผู้ใช้ป้อนข้อมูลและยังรักษาความเป็นส่วนตัว ส่วนคำวิจารณ์ว่าบอทขั้นสูงสามารถเลี่ยงได้ แม้เป็นจริง แต่เทคนิคดั้งเดิมก็ยังมีประโยชน์พอที่จะกันบอทความพยายามต่ำได้ สำหรับการโจมตีที่ใช้มนุษย์จริง CAPTCHA ไม่ได้เหมาะตั้งแต่แรกอยู่แล้ว ดังนั้นไซต์ควรมีวิธีป้องกันแยกต่างหาก แต่ผมไม่คิดว่านั่นเป็นสาเหตุหลักของสแปมที่เห็นกันในปัจจุบัน
- ช่วงนี้กำลังคิดอยู่ว่าจะสร้างระบบแบบมีเงินวางเดิมพันบางอย่าง เพื่อพิสูจน์ว่า มีความเป็นไปได้สูงว่าเป็นมนุษย์ ได้ไหม
  เช่น ถ้าบริจาค 5 ดอลลาร์ครั้งเดียวให้การกุศลที่เลือกผ่านไซต์ “ผู้พิสูจน์” ก็จะได้โทเค็นยืนยันว่าใช้เงินจริงไปแล้ว จากนั้นไซต์พันธมิตรอย่าง HN สามารถเผาโทเค็นนั้นเพื่อทำเครื่องหมายบัญชีว่าเป็นมนุษย์ที่มีความเป็นไปได้สูง หรืออย่างน้อยก็เป็นบอทที่เจ้าของจะเสียหายถ้าถูกบล็อก วิธีนี้เป็นมิตรต่อความเป็นส่วนตัวกว่าระบบตรวจสอบบัตรประชาชนของหลายประเทศมาก และแม้จะดูเหมือน “ซื้อสิทธิ์พูดด้วยเงิน” แต่ในความเป็นจริงอาจถูกกว่าเวลา ค่าเดินทาง และงานเอกสารที่ต้องเสียในระบบฟรีด้วยซ้ำ ปัญหาใหญ่คงเป็นการจ่ายเงินทุจริตด้วยบัตรที่ขโมยมาเพื่อซื้อโทเค็น ไซต์ผู้พิสูจน์ที่รับเงินแล้วหายไป ไซต์ปลายทางที่แอบเก็บโทเค็นยืนยัน และ การจัดการแบบกระจายศูนย์ ที่ไซต์บริจาคกับไซต์บัญชีหลายแห่งต่างเชื่อถือโทเค็นคนละชุด
- อุตสาหกรรมบริการแก้ CAPTCHA มีอยู่แล้ว และส่วนใหญ่ใช้มนุษย์ในพื้นที่ที่ค่าแรงถูก
  ในบริการยอดนิยมรายหนึ่ง ราคาประมาณ $0.001~$0.002 ต่อ reCAPTCHA 1 ครั้ง จึงไม่ต้องใช้ทักษะทางเทคนิคสูงนัก ต่อให้ต้องใช้ CAPTCHA ทุกคอมเมนต์ แค่ราว 50 ดอลลาร์ต่อปีก็สแปมไซต์หนึ่งได้วันละ 100 คอมเมนต์แล้ว และแม้จะกรอง script kiddie ทั่วไปได้ แต่ถ้าหาเงินจากสแปมได้ ก็ทำกำไรได้ง่าย ยากที่จะมองว่าบริการพวกนี้เป็น “edge case”
- ผู้ดูแลเว็บไซต์อยากเปิดเผยข้อมูล แต่ก็ไม่อยากให้คัดลอกได้
  นี่เป็นความขัดแย้งในตัวเองแบบเดียวกับ DRM ที่ใช้ไม่ได้จริง นักพัฒนาเว็บเองก็ทำให้ไซต์บวมเต็มไปด้วย JavaScript ระดับ MB และดีไซน์ซับซ้อนเกินจำเป็น ทั้งที่การใช้ไซต์แบบ static กับ CDN อาจถูกกว่ามาก
- วิธีแก้ที่เกือบสมบูรณ์แบบคือ ตรวจสอบทุก submission ด้วยมือ
  ใช้ระบบอัตโนมัติเป็นด่านแรกป้องกันสแปม แล้วจ้างคนมาตรวจ submission ที่ผ่านเข้ามาทีละรายการได้ ต่อให้เป็นสิ่งที่มนุษย์ส่งมา กระบวนการนี้ก็ช่วยรับประกันมาตรฐานคุณภาพระดับหนึ่งได้ ส่วน submission ปกติที่โดนตัวกรองสแปมขั้นต้น ก็ให้ยื่นอุทธรณ์ผ่านอีเมลหรือช่องทางอื่นเพื่อเข้าคิวตรวจด้วยมือได้ วิธีนี้ไม่ง่ายและอาจทำให้ใช้เวลานานกว่าจะเผยแพร่ แต่สแปมและคอนเทนต์คุณภาพต่ำแทบจะลดลงใกล้ 0 ได้
- ในฐานะคนที่โดน CAPTCHA บ่อยอยู่แล้วเพราะใช้ VPN ก็ไม่อยากให้มันเพิ่มขึ้นอีก
  ควรลองคิดดูว่า เวลาของมนุษย์ ที่เสียไปกับสิ่งพวกนี้มีมากแค่ไหน
ตอนที่ผมนำผลิตภัณฑ์ขึ้น ProductHunt เมื่อราว 5 ปีก่อน ก็ได้รับ ข้อเสนอโปรโมตแบบรับประกันอันดับ 1 เป็นสิบ ๆ รายการ
ข้อความถาโถมเข้ามา literally ภายในหนึ่งชั่วโมงหลังโพสต์ และตอนนี้คงหนักกว่านั้นอีก
การเริ่มวิเคราะห์จาก การจัดหมวดหมู่ตามอำเภอใจ ที่ไม่มีวิธีตรวจสอบว่าผู้ใช้เป็นบอทหรือไม่ เป็นปัญหา
ถ้าการจัดหมวดหมู่นั้นผิด การวิเคราะห์ทั้งหมดก็ผิดไปด้วย โดยเฉพาะส่วนที่ว่า “คอมเมนต์บอทพุ่งขึ้นช่วงปลายปี 2022 ที่ ChatGPT เริ่มถูกใช้อย่างแพร่หลาย” นั้นสะดุดตา เพราะหนึ่งในเกณฑ์จัดหมวดคือ “คอมเมนต์ที่สร้างโดย ChatGPT มีความถี่ของคำอย่าง game-changer สูง มีอักขระที่พิมพ์ยากอย่าง em dash หรือ ™ และใส่ชื่อผลิตภัณฑ์ยาว ๆ ตามเดิม” กล่าวคือจัดคนที่ทำตัวเหมือน ChatGPT เป็นบอท แล้วพอหลัง ChatGPT เปิดตัวมีผู้ใช้แบบนั้นเพิ่มขึ้น ก็ถือว่าเป็นการค้นพบที่น่าสนใจ ทั้งที่ก่อนหน้านั้นอาจมีบอทจำนวนมากอยู่แล้ว เพียงแต่ใช้ซอฟต์แวร์อื่น จึงมีพฤติกรรมต่างไปและตรวจไม่เจอก็ได้
- พูดถูก แต่ถ้าการจัดหมวด บอทที่ใช้ ChatGPT แม่นยำ การที่คอมเมนต์ที่สร้างโดย ChatGPT เพิ่มขึ้นจริงอย่างรวดเร็วนั้นก็น่าสนใจในตัวเอง
  และถ้าการจัดหมวดนั้นถูกต้อง ต่อให้กำลังนับจำนวนบอททั้งหมดต่ำกว่าจริงเพราะไม่รวมบอทที่ไม่ใช้ ChatGPT ประเด็นที่ว่าคอมเมนต์ที่สร้างโดยบอทแซงจำนวนคอมเมนต์ของคนจริงไปมากแล้วก็ยังสำคัญ แน่นอนว่าตามที่พูดมา ตรงนี้มีคำว่า “ถ้า” อยู่ค่อนข้างมาก และถ้าสมมติฐานพัง ข้อสรุปก็พังตาม
- บทความเริ่มด้วย การทดสอบ prompt injection และสมมติฐานก็มีหลักฐานประกอบ
  ถ้าไม่ใช่แบบนั้นก็ควรเสนอวิธีจัดหมวดทางเลือก ไม่อย่างนั้นจะดูเป็นเจตนาร้ายและไม่ช่วยอะไร
- วิธีเชิงสถิติแบบนี้อาจแม่นยำในการตัดสินว่าช่องคอมเมนต์เต็มไปด้วยบอทหรือไม่ แต่แม่นยำน้อยกว่ามากในการตัดสินว่า คอมเมนต์หนึ่งรายการ เป็นบอทหรือเปล่า
คำถามสำคัญคือมีใครอยู่บน ProductHunt บ้าง
เป็นลูกค้าหรือไม่? น่าสงสัย เป็นอินดี้แฮกเกอร์หรือเปล่า? ก็อาจเป็นไปได้ ต้องพิจารณาว่าเรากำลังขายให้ใคร และตั้งแต่แรก การเปิดตัวบน PH มีความหมาย หรือไม่
- เป็นประเด็นที่ดีมาก
  เราเปิดตัวบน PH ได้อันดับ 1 ของวันนั้นและอันดับ 1 ของสัปดาห์นั้น แต่ลูกค้าใหม่แทบไม่เพิ่มเลย กลับกันได้รับ inbound จากนักลงทุนจำนวนมาก ถ้ากำลังระดมทุนอยู่ก็มีคุณค่า แต่ถ้าไม่ใช่ ก็ควรไปอยู่ในที่ที่มีลูกค้าของเรา ลูกค้าของเราไม่ได้เป็นผู้ใช้ PH
การวิเคราะห์ยอดเยี่ยม แต่สิ่งที่น่าประหลาดใจกว่าคือ ProductHunt เป็นเว็บไซต์ “จริง”
ผมบล็อก PH ด้วย ublacklist ไปนานแล้ว เพราะมันดูเหมือน SEO โปรโมชัน/ขยะ และคล้ายกับไซต์ประเภท “VS/เปรียบเทียบ/5 แอปที่ดีที่สุด” ที่แทบไม่มีเนื้อหามากเกินไป ไซต์แบบนี้โผล่ขึ้นมาเร็วกว่าที่จะกรองด้วยมือได้ทันเสียอีก แม้กลับไปดูอีกครั้งแล้วพบว่าไม่ใช่คอนเทนต์ที่สร้างล้วน ๆ แต่ถ้าเจอมันโดยบังเอิญในผลการค้นหา ผมก็ยังไม่เข้าใจ value proposition อยู่ดี
- ผมรู้จักหลายบริษัทที่ให้ความสำคัญพอสมควรกับการได้อันดับดี ๆ บน PH แต่ปฏิกิริยาก็เหมือนกัน
  ผู้ใช้ปลายทางหรือบริษัทจริง ๆ สนใจที่นั่นจริงหรือ?
แนวโน้มของบอทกับมนุษย์ดูน่ากังวลอยู่บ้าง
มนุษย์ที่ตรวจพบดูเหมือนจะโหวตและคอมเมนต์น้อยลงเมื่อเวลาผ่านไป แต่บอทกลับเพิ่มขึ้น นี่เป็นสัญญาณอีกอย่างไหมว่า ทฤษฎีอินเทอร์เน็ตที่ตายแล้ว เป็นจริง?
- DIT ตั้งชื่อผิด
  น่าจะเรียกว่า คำทำนายอินเทอร์เน็ตที่ตายแล้ว มากกว่า ในความหมายว่ายังไม่เกิดขึ้น แต่จะเป็นจริงในอนาคต
- เกี่ยวกับเรื่องนี้ มนุษย์จริงบน HN ถูกจำกัดให้คอมเมนต์ได้ 5 ครั้งต่อ 6 ชั่วโมง แต่ผู้ไม่หวังดีแค่สร้างบัญชีหลายร้อยบัญชีก็หลบข้อจำกัดนี้ได้
เมื่อก่อนเคยมี Web of Trust (WOT) สำหรับโหวตให้เว็บไซต์
Web of Trust สำหรับมนุษย์จะช่วยป้องกันบอตได้ไหม? ถ้าผมมีบัญชีสักสิบกว่าบัญชีที่รับรองได้ว่าผมเป็นมนุษย์จริง และคนอื่นก็สามารถโหวตให้ผมได้ ก็จะสร้างเครือข่ายความไว้วางใจได้ แน่นอนว่าต้องมี seed แต่สามารถตั้งขึ้นได้ค่อนข้างง่ายด้วยบัญชีที่ยืนยันตัวตนแล้ว หรือการเชื่อมโยงและปฏิสัมพันธ์บนโซเชียลมีเดีย X และ Meta น่าจะรู้ค่อนข้างแน่ชัดว่าบัญชีไหนเป็นบอต แต่ดูเหมือนไม่สนใจจะนำความรู้นี้มาให้บริการ
- AI จะดีขึ้นเรื่อย ๆ
  คงอีกไม่นานจะมี AI ที่มีเป้าหมายเพื่อสร้างตัวตนออนไลน์ให้คนเชื่อว่ามีคนจริงอยู่เบื้องหลังได้ อาจถึงขั้นอัปโหลดวิดีโอที่สร้างขึ้นของบุคคลปลอมซึ่งทำกิจกรรมธรรมดา ๆ ได้ สุดท้ายก็คงต้องมี Web of Trust, proof และคะแนนชื่อเสียงของเอเจนต์ ซึ่งน่าจะต้องรวมองค์ประกอบอย่างการปฏิสัมพันธ์แบบพบหน้ากันในโลกจริง การสนับสนุนบางส่วนจากรัฐบาล และกล้องที่สามารถยืนยันฟุตเทจกับเมตาดาต้าได้ คนที่เสพคอนเทนต์และอยากตรวจสอบความจริงแท้ก็จะต้องเข้าร่วมระบบนี้ หรือไม่ก็อยู่กับสื่อดั้งเดิมต่อไป และบางประเทศอาจออกกฎหมายเพื่อช่วยให้พลเมืองบริโภคข่าวที่เป็นความจริงได้ อย่างไรก็ดี ผมไม่คิดว่าจะมีวิธีสร้างเครือข่ายความไว้วางใจที่แข็งแรงพอสมควรโดยที่ไม่รู้ตัวตนจริงของอีกฝ่ายเลย ดังนั้นเครือข่ายความไว้วางใจนี้ก็จะถูกอาชญากรและรัฐบาลใช้ในการหาเป้าหมายด้วย ต้นทุนทางสังคมของการปล่อยให้ AI แสร้งทำเป็นมนุษย์ นั้นสูงเกินไป จึงอาจคุ้มค่าที่จะมีกฎหมายห้ามเรื่องนี้
- สุดท้ายต้องจำไว้ว่าคุณไม่ใช่ลูกค้า แต่ ผู้ลงโฆษณา บางรายต่างหากที่เป็นลูกค้า
  หน้าที่หลักของบริการเหล่านี้คือการปั่นจำนวนผู้ใช้ให้สูงเกินจริงเพื่อขายโฆษณาให้ได้มากขึ้น
- ระบบแบบนั้นจะถูกกวาดไปใช้และบิดเบือนตามเป้าหมายเพื่อความสะดวกของรัฐ
บน Reddit มีโพสต์อยู่สองสามอันที่คอมเมนต์ไม่เยอะ แต่ประมาณทุกสัปดาห์จะมี บอตที่ใช้ GPT เข้ามาทิ้งคำถามที่ชัดเจนมาก ๆ ทำนองว่า “ว้าว! น่าคิดจริง ๆ นะครับ/ค่ะ อยากรู้จังว่าทำไมถึงสำคัญ”
สำหรับผมดูเหมือนเป็นความพยายามให้ผมป้อนข้อมูลเข้าไปในระบบมากขึ้น ต่อให้ Reddit เป็นคนรันบอตพวกนี้เองเพื่อกระตุ้น engagement ผมก็ไม่แปลกใจ
- ดูประวัติของ Reddit ก็พอ
  ก่อนที่บอตจะทำได้ ก็ใช้ บัญชีปลอม ที่คนจัดการเองมาคิวเรต และตอนนี้เมื่อบอตทำได้แล้ว ผมเชื่ออย่างแรงกล้าว่าคอมเมนต์และโพสต์ส่วนใหญ่ในซับเรดดิตยอดนิยมเป็นบอต ในจำนวนนั้นไม่น้อยน่าจะเป็น Reddit ที่ดำเนินการเอง

บอต บอตเยอะเกินไป

กิจกรรมของบอตที่ปรากฏบน ProductHunt

ข้อมูลสาธารณะที่ใช้ในการวิเคราะห์

วิธีแยกแยะบัญชีบอต

การเปลี่ยนแปลงของกิจกรรมบอตตามเวลา

การสมัครผู้ใช้

คอมเมนต์

อัปโหวต

อันดับ

ความสัมพันธ์ระหว่างอันดับรายวันกับอัปโหวตจากบอต

ประสิทธิผลของการเปิดตัวบน ProductHunt

การวิเคราะห์ที่ยังเหลือและโปรเจกต์ที่เกี่ยวข้อง

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News