บอตกำลังเลียนแบบพฤติกรรมของผู้ใช้จริงได้มากขึ้นเรื่อย ๆ

(joindatacops.com)

14 คะแนน โดย GN⁺ 2025-10-16 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

มีความเป็นไปได้สูงมากว่า 73% ของผู้เยี่ยมชมเว็บไซต์อีคอมเมิร์ซ ไม่ใช่มนุษย์จริง แต่เป็น บอตที่ซับซ้อน
เครื่องมือวิเคราะห์ มาตรฐานแยกทราฟฟิกบอตลักษณะนี้ได้ยาก ส่งผลให้การวิเคราะห์ประสิทธิภาพโฆษณาและการคำนวณ ROI ทางการตลาด บิดเบือน
บอตเหล่านี้ เลียนแบบกิจกรรมบนเว็บไซต์อย่างแนบเนียน ในหลายรูปแบบ เช่น Engagement Bot , Cart Abandonment Bot และ บอตทราฟฟิกจากโซเชียลมีเดีย
ทราฟฟิกบอตบางส่วนเกิดจาก การเก็บข้อมูลหรือระบบอัตโนมัติที่ชอบด้วยเหตุผล แต่จำนวนมากมีเป้าหมายเพื่อ โกงโฆษณา หรือปั่นตัวชี้วัดภายใน
ปัญหานี้ไม่ได้จำกัดอยู่แค่บางเว็บไซต์อีกต่อไป แต่กำลังขยายเป็น โจทย์ของทั้งอุตสาหกรรมอย่างกว้างขวางและเป็นระบบ

จุดเริ่มต้นของปัญหา: ปริศนาอัตราคอนเวอร์ชัน 0.1%

เว็บไซต์ของลูกค้าอีคอมเมิร์ซรายหนึ่งมีผู้เข้าชม 50,000 คนต่อเดือน แต่เกิดยอดขายจริงเพียง 47 รายการเท่านั้น
ในแพลตฟอร์มวิเคราะห์อย่าง Google Analytics ข้อมูลดูเป็นบวกมาก แต่พบว่า เชื่อมโยงกับรายได้จริงได้ต่ำมาก
แม้จะใช้จ่ายค่าโฆษณาเดือนละ 4,000 ดอลลาร์ แต่ การเติบโตกับรายได้กลับไม่สัดส่วนกันเลย
ต่างจากข้อสันนิษฐานแรกที่คิดว่าเป็นปัญหาของตัวสินค้าเอง ผู้เขียนเริ่มเห็นสัญญาณผิดปกติเมื่อ วิเคราะห์ข้อมูลทราฟฟิกเว็บไซต์โดยตรง
เพื่อหาสาเหตุ จึงพัฒนา สคริปต์ติดตาม สำหรับเฝ้าดู รูปแบบพฤติกรรม ของผู้ใช้จริง

การสืบสวนครั้งแรก: การติดตามเพื่อพิสูจน์ความจริงของทราฟฟิก

พัฒนาเครื่องมือติดตามที่ไม่ได้แค่นับจำนวนคลิก แต่สังเกต รูปแบบพฤติกรรมของผู้ใช้จริง
- การเคลื่อนเมาส์: วิเคราะห์ความต่างระหว่างเส้นโค้งที่เป็นธรรมชาติกับการเคลื่อนที่เป็นเส้นตรงแบบเครื่องจักร
- รูปแบบการเลื่อนหน้าจอ: ความเร็วที่แปรผันพร้อมการหยุด/เลื่อนย้อนกลับ เทียบกับการเลื่อนแบบสม่ำเสมอสมบูรณ์ของเครื่อง
- ช่วงห่างระหว่างการโต้ตอบ: วัด ความแปรผันของช่วงเวลา ระหว่างการคลิก การโฮเวอร์ และการเพิ่มลงตะกร้า
ภายในเวลาเพียงหนึ่งสัปดาห์ พบว่า ทราฟฟิกที่ไม่ใช่มนุษย์ (Non-human) สูงถึง 68%
ส่วนใหญ่ไม่ใช่สแปมทั่วไป แต่เป็น บอตที่แยบยลซึ่งออกแบบมาเพื่อหลอกเครื่องมือวิเคราะห์

ปัญหาที่ขยายวง: ไม่ใช่เหตุการณ์เฉพาะราย แต่เป็นปรากฏการณ์ระดับอุตสาหกรรม

ในฟอรัมการตลาดและกลุ่ม Discord ผู้เขียนถามผู้ประกอบการอีคอมเมิร์ซรายอื่นว่า "เคยเจอไหมที่ทราฟฟิกกับยอดขายไม่สอดคล้องกัน?"
หลังได้รับอนุญาตให้ติดตั้งสคริปต์ติดตามบนเว็บไซต์อีคอมเมิร์ซขนาดเล็กและกลางกว่า 200 แห่ง และเก็บข้อมูลเป็นเวลา 6 เดือน ก็ยืนยันได้ว่าโดยเฉลี่ย 73% เป็นทราฟฟิกปลอม (บอต)
สิ่งนี้ไม่ใช่ปัญหาเฉพาะจุด แต่เป็น ปัญหาเชิงโครงสร้างของระบบนิเวศดิจิทัลคอมเมิร์ซทั้งหมด

โครงสร้างของการโกงโฆษณา (Ad Fraud) ยุคใหม่: วิเคราะห์ตามประเภททราฟฟิก

Engagement Bot
- เป็นบอตที่ออกแบบมาเพื่อ ทำให้รายงานวิเคราะห์ดูดีขึ้น โดยจำลองพฤติกรรมของผู้เข้าชมคุณภาพสูง
- ทำ ปฏิสัมพันธ์ที่ซับซ้อน เช่น เลื่อนหน้า วางเคอร์เซอร์เหนือสินค้า และคลิกลิงก์ภายใน
- จุดบกพร่องร้ายแรงคือ ความสม่ำเสมอที่สมบูรณ์แบบ
  - ใช้เวลาอยู่บนหน้าคำอธิบายสินค้าทุกหน้าพอดี 11~13 วินาที
  - ความเร็วการเลื่อนคงที่ที่ 3.2 หน้า/วินาทีเสมอ
- พฤติกรรมมนุษย์ย่อมไม่สม่ำเสมอ แต่บอตเหล่านี้ แม่นยำราวกับในห้องแล็บ
Cart Abandonment Bot
- เพิ่มสินค้าชิ้นเดิมลงตะกร้า ค้างไว้ 4 นาที แล้วทิ้ง ทำซ้ำ วันละหลายสิบครั้ง
- ทำซ้ำผ่าน IP และเซสชันที่หลากหลาย ซึ่งอาจมีเป้าหมายเพื่อบิดเบือนตัวชี้วัดอีคอมเมิร์ซสำคัญอย่าง อัตราการทิ้งตะกร้า โดยเจตนา หรือเพื่อปั่น อัลกอริทึมแนะนำสินค้าภายใน
Phantom Social Media Visitor
- เป็นทราฟฟิกที่ แสดงในเครื่องมือวิเคราะห์ ว่ามาจาก Instagram, TikTok และแหล่งอื่น ๆ
- ในจำนวนนี้ราว 64% จะ รอพอดี 1.8 วินาที หลังเข้าหน้าเว็บ แล้วจึงออกไป
- เด้งออกทันที โดยไม่เลื่อนหรือคลิกอะไรเลย แต่ยังถูกนับเป็น "ผู้เยี่ยมชมจากโซเชียลมีเดีย"
- เป็น องค์ประกอบสำคัญของการโกงโฆษณา: ผู้ขายเอ็นเกจเมนต์ปลอมใช้สิ่งนี้เป็นหลักฐานว่าได้ส่งทราฟฟิกมาแล้ว

ไม่ใช่ทุกบอตจะมีเจตนาร้าย: การสแครปข้อมูลที่ถูกกฎหมาย

ข้อมูลจากคนวงในอุตสาหกรรมข้อมูลอีคอมเมิร์ซ: มีการสแครป หน้าเว็บค้าปลีก 70 ล้านหน้า/วัน
เพื่อวัตถุประสงค์ด้าน Business Intelligence ที่ชอบด้วยกฎหมาย
- ผู้ค้าปลีกรายใหญ่อย่าง Amazon ไม่ได้ แจ้ง vendor เสมอไป เมื่อสินค้าใกล้หมดสต็อก
- แบรนด์ต่าง ๆ จ่ายเงินให้บริการ สแครปข้อมูล เพื่อติดตามสินค้าของตนเอง
- ตรวจสอบระดับสต็อก วิเคราะห์การแข่งขัน buy box และตรวจสอบความถูกต้องของคำอธิบายสินค้า
- ติดตาม อันดับผลการค้นหา แยกตามภูมิภาคและอุปกรณ์มือถือ
- วิเคราะห์ แบนเนอร์โฆษณา ตามกลุ่มเป้าหมาย
ตามวิดีโอของ Kurzgesagt เกือบ 50% ของทราฟฟิกอินเทอร์เน็ตทั้งหมดเป็นบอต
บางส่วนเป็น การวิเคราะห์คู่แข่ง และ การติดตามราคา ที่ถูกกฎหมาย แต่ส่วนใหญ่ไม่น้อยคือ ทราฟฟิกฉ้อโกงที่เผางบโฆษณา

เศรษฐศาสตร์ที่พังทลายของโฆษณาดิจิทัล

ลูกค้ารายหนึ่งใช้จ่ายกับ Google Ads เดือนละ 12,000 ดอลลาร์
หลังติดตั้งระบบ ตรวจจับและกรองทราฟฟิกบอตขั้นสูง:
- ทราฟฟิกที่รายงาน ลดลง 71%
- CFO ตกใจมากในช่วงแรก
- แต่ยอดขายจริงกลับ เพิ่มขึ้น 34%
ความพยายามด้าน Conversion Rate Optimization (CRO) ที่ทำไว้แต่แรกจริง ๆ แล้วได้ผล เพียงแต่ถูกกลบด้วย หิมะถล่มของคลิกปลอม
เงินหลายพันดอลลาร์ถูกทิ้งไปกับการโฆษณาให้ หุ่นยนต์ที่ถูกโปรแกรมมาไม่ให้ซื้อโดยเด็ดขาด
Marketing ROI เปลี่ยนจาก "ย่ำแย่" เป็น "ยอดเยี่ยม" ได้ทันที
ปฏิกิริยาของแพลตฟอร์มโฆษณา
- เมื่อพูดคุยกับ แพลตฟอร์มโฆษณา รายใหญ่ ทันทีที่เอ่ยถึง คลิกฟรอด หรือ ทราฟฟิกบอต ท่าทีจะเปลี่ยนไปอย่างชัดเจน
  - "ระบบตรวจจับ AI ของเราอยู่ในระดับแนวหน้าของอุตสาหกรรม"
  - "เราให้ความสำคัญกับการโกงโฆษณาอย่างมาก"
- เจ้าหน้าที่คนหนึ่งยอมรับแบบไม่เป็นทางการว่า: "ทุกคนรู้กันหมด"
  - "ถ้ากรองกันจริงจัง รายได้จะ หายไป 40% ในชั่วข้ามคืน แล้วนักลงทุนจะตื่นตระหนก"
- นี่คือ ความขัดแย้งทางผลประโยชน์ครั้งใหญ่: แพลตฟอร์มโฆษณาหารายได้จากการคลิกหรือการแสดงผล โดยไม่สนว่านั่นจะเป็นลูกค้าที่มีศักยภาพหรือ เซิร์ฟเวอร์ click farm

คุณกำลังยิงโฆษณาให้หุ่นยนต์อยู่หรือไม่? คู่มือปฏิบัติสำหรับตรวจจับทราฟฟิกปลอม

1. ตรวจสอบการพุ่งขึ้นของทราฟฟิกเทียบกับข้อมูลยอดขาย
- ทราฟฟิกที่พุ่งขึ้น สอดคล้องกับยอดขายที่พุ่งขึ้น หรือไม่?
- ถ้าช่วงโปรโมชันททราฟฟิกเพิ่มเป็นสองเท่า แต่ยอดขาย นิ่งสนิท ก็มีโอกาสสูงว่าเป็น ทราฟฟิกฉ้อโกง
2. วิเคราะห์ตัวชี้วัดพฤติกรรมผู้ใช้
- มองหาค่าที่ "สมบูรณ์แบบเกินไป"
- ค่า "เวลาเฉลี่ยบนหน้า" ของหน้าแลนดิ้งหลัก คงที่อย่างน่ากังวลทุกเดือน หรือไม่?
- พฤติกรรมของมนุษย์จริงย่อม ไม่สม่ำเสมอและแปรผัน
3. แบ่งเซกเมนต์ข้อมูลตามภูมิศาสตร์
- มีทราฟฟิกจำนวนมากมาจาก ประเทศที่คุณไม่ได้จัดส่งสินค้า หรือไม่?
- หากผู้เข้าชมเหล่านี้ ไม่เกิดคอนเวอร์ชันเลย นั่นคือสัญญาณสำคัญของทราฟฟิกคุณภาพต่ำหรือ ทราฟฟิกปลอม
4. ตรวจสอบแหล่งที่มาของรีเฟอรัล
- เจาะลึกแหล่งทราฟฟิกอันดับต้น ๆ
- หากเว็บไซต์รีเฟอรัลดู ไม่เกี่ยวข้องหรือคุณภาพต่ำ ก็อาจเป็นส่วนหนึ่งของ เครือข่ายแลกเปลี่ยนทราฟฟิก
- มองหา "ghost referral" ที่ไม่มีลิงก์มายังเว็บไซต์ของคุณอยู่จริง
5. เชื่อสัญชาตญาณของตัวเอง
- ถ้าตัวเลขดูแปลก ก็มีโอกาสสูงว่า มีปัญหาจริง
- สัญชาตญาณของเจ้าของธุรกิจที่รู้จักฐานลูกค้าของตนดี คือ เครื่องมือตรวจจับบอตที่มีค่า

บทสรุปอันเยือกเย็น: ปราสาททรายดิจิทัล

ผู้ก่อตั้งสตาร์ทอัปรายหนึ่งระดมทุนได้ 2 ล้านดอลลาร์โดยอาศัยตัวชี้วัด "การเติบโตของผู้ใช้"
ต่อมาพบว่า 80% ของตัวชี้วัดนั้นเป็นบอต
ตอนนี้หาก ยอมรับความจริง ความสัมพันธ์ระหว่างบริษัทกับนักลงทุนอาจสั่นคลอน จึงต้องแสร้งทำราวกับว่าทุกอย่างยังปกติ
เศรษฐกิจบอตที่ซ่อนอยู่
- แพลตฟอร์มโฆษณา ขายการแสดงผลให้บอต
- บริษัทต่าง ๆ ซื้อทราฟฟิกปลอม เพื่อปั่นตัวชี้วัด
- บริษัทวิเคราะห์ก็ รายงานกิจกรรมของบอตเหล่านี้อย่างซื่อตรง
- ทั้งอุตสาหกรรมกำลัง สมรู้ร่วมคิดในละครสวมหน้ากากหมู่ เพราะกลัวว่าหากยอมรับความจริง ระบบอันเปราะบางนี้จะพังทลาย
มุมมองสุดท้าย
- มากกว่าครึ่งของอินเทอร์เน็ตคือภาพลวงตา เป็นละครเวทีดิจิทัลที่บอตกำลังแสดงให้บอตด้วยกันดู
- สัดส่วนนี้กำลังเพิ่มขึ้นทุกวัน เมื่อ AI และระบบอัตโนมัติ ซับซ้อนยิ่งขึ้น
- คำถามไม่ใช่อีกต่อไปว่า "ธุรกิจของคุณได้รับผลกระทบหรือไม่?"
- คำถามที่แท้จริงคือ "จะเกิดอะไรขึ้นเมื่อปราสาททรายดิจิทัลนี้พังทลายลงในที่สุด?"

2 ความคิดเห็น

t7vonn 2025-10-16

ตอนนี้ไม่ใช่แค่บอตแบบ headless เท่านั้น แต่ยังมี agent bot อย่างเช่น comet browser โผล่มาด้วย ทำให้ตรวจจับได้ยากขึ้นไปอีก

GN⁺ 2025-10-16

ความเห็นบน Hacker News

ฉันทำเอเจนซีการตลาดอยู่ และพอข้อมูลวิเคราะห์ของลูกค้ารายหนึ่งดูไม่สมเหตุสมผลเอาเสียเลย (ผู้เข้าชม 50,000 คน แต่มียอดขาย 47 รายการ) ก็เลยขุดลึกลงไป จากนั้นจึงใช้สคริปต์ง่ายๆ ติดตามพฤติกรรมผู้ใช้และวิเคราะห์เว็บอีคอมเมิร์ซขนาดเล็กถึงกลางมากกว่า 200 แห่ง โดยเฉลี่ยแล้ว 73% ของทราฟฟิกทั้งหมดถูกนับเป็นผู้เข้าชมจริงในเครื่องมือวิเคราะห์มาตรฐาน ทั้งที่จริงเป็นบอททราฟฟิก ตอนนี้บอทเก่งมากในการเลียนแบบพฤติกรรมมนุษย์ ฉันสรุปทั้งแพตเทิร์นแปลกๆ ที่เจอเองและบทสนทนาแบบไม่เป็นทางการกับคนในวงการ adtech ด้วย สิ่งที่น่าตกใจคือ บอททราฟฟิกนี้เป็นความลับที่เปิดเผยกันอยู่ ทุกคนรู้แต่ไม่มีใครพูดตรงๆ รู้สึกเหมือนทั้งระบบนี้ทำงานอยู่ได้เพราะบอทพวกนี้ เลยอยากรู้ว่านักพัฒนา ผู้ก่อตั้ง หรือมาร์เก็ตเตอร์คนอื่นๆ เคยเห็นข้อมูลที่มันขัดแย้งกันแบบนี้ไหม
- ตอนทำงานที่ yellow pages ในสวิตเซอร์แลนด์เมื่อก่อน เรามีแดชบอร์ดให้ลูกค้าแบบเสียเงินดูจำนวนผู้เข้าชมหน้าธุรกิจของตัวเอง พอทีมพัฒนาของเรากรองบอททราฟฟิกออก ตัวเลขก็ร่วงลงมากกว่า 50% ฝั่งธุรกิจสั่งให้เอาฟิลเตอร์ออกภายในไม่ถึงวัน สุดท้ายก็ถือว่าบอทเป็นคนจริงไปด้วย
- จริงๆ ต่อให้ทั้งหมดเป็นการหลอกลวงก็ไม่เห็นเป็นไรไม่ใช่หรือ? ถ้ามีการซื้อจริง 47 ครั้ง ก็แค่ดูว่าในช่วงนั้นใช้ค่าโฆษณาไปเท่าไร แล้วเทียบกับข้อมูลก่อนหน้าและหลังจากนั้น ก็พอตัดสินได้ว่าแคมเปญสำเร็จหรือไม่ ป้ายโฆษณานอกบ้านหรือโฆษณาบนรถเมล์ก็ไม่ได้สนใจว่าใครดู หรือเป็นคนจริงไหม สิ่งสำคัญสุดท้ายคือผลกระทบในตัวเลขจริง
- ฉันทำที่ปรึกษาด้าน web analytics และเคยสืบสวนแพตเทิร์นทราฟฟิกแปลกๆ ของบริษัทโลจิสติกส์ระดับโลกในปี 2021 ไว้สรุปในบล็อกของฉันบทความนี้ ปัญหาบอททราฟฟิกมีมานานแล้ว และแม้จะมีบริการแนว “ตรวจจับ ad fraud” หน้าใหม่มากมาย แต่ฉันยังแทบไม่เห็นบริการไหนที่มีประโยชน์จริง คำถามว่า "จะแก้อย่างไร?" มักเหลืออยู่ท้ายสุดเสมอ แต่ไม่มีใครรู้วิธีหยุดบอทได้อย่างสมบูรณ์ ผู้บริโภคส่วนใหญ่ใช้แพลตฟอร์มหลักอย่าง Google, Facebook, Instagram, TikTok, LinkedIn และแทบไม่มีเครือข่ายโฆษณาทางเลือกที่มีบอทน้อยกว่าแบบใช้งานได้จริง ทุกคนรู้ว่ามีส่วนหนึ่งเป็นของปลอม แต่ก็ยังซื้อทราฟฟิกนั้นอยู่ สถานะนี้จะเปลี่ยนได้ก็ต่อเมื่อบริษัท Big Tech ที่มีรายได้โฆษณาระดับหลายพันล้านดอลลาร์มีแรงจูงใจให้เปลี่ยนระบบมากกว่ารักษามันไว้ แต่ตอนนี้ยังไม่รู้สึกว่าพวกเขาแคร์ด้วยซ้ำ "เงินครึ่งหนึ่งที่ฉันใช้กับโฆษณาคือการสูญเปล่า ปัญหาคือฉันไม่รู้ว่าครึ่งไหน" - John Wanamaker
- เรื่องทราฟฟิกจาก “บอทดีๆ” น่าสนใจมาก ตอนที่ฉันกำลังค้นคว้าอยู่ มีคนในอุตสาหกรรมข้อมูลให้เบาะแสใหญ่มา เขาบอกว่าบริษัทของเขา scrape เว็บหน้าสินค้าปลีกวันละ 70 ล้านหน้า นี่เป็นแหล่งบอททราฟฟิกที่ถูกกฎหมายขนาดมหาศาล ตัวอย่างเช่น Amazon จะไม่แจ้งซัพพลายเออร์เมื่อสินค้าหมดสต็อก แบรนด์ต่างๆ จึงใช้บริการ data scraping เพื่อตรวจดูสถานะสต็อกสินค้าของตัวเอง การแข่งขันเรื่องความได้เปรียบใน ‘Buy Box’ ความเหมาะสมของคำอธิบายสินค้า อันดับการค้นหา หรือแม้กระทั่งแบนเนอร์โฆษณาใดถูกแสดงต่อออดิเอนซ์แบบไหน แม้แต่ “บอทดีๆ” เหล่านี้เองก็อาจถูกมองต่างกันไปแล้วแต่มุมมอง ฉันไม่ชอบถ้าคู่แข่งมา scrape เว็บฉัน แต่ฉันกลับมองว่าการที่ฉันเก็บข้อมูลตลาดเป็นเรื่องดี มันคือบอทที่มีคนเขียนและคอยรัน เพราะมันให้ประโยชน์กับคนคนนั้น ครีเอเตอร์คอนเทนต์มอง AI scraping ว่าแย่ แต่ฝั่งที่สร้าง AI กลับมองว่าดี เว็บเปรียบเทียบราคามั่นใจว่าครอว์เลอร์ของตัวเองชอบธรรม แต่ฝั่งรีเทลเลอร์เกลียดมัน เรื่องของบอททราฟฟิก “ดี” หรือ “แย่” จึงขึ้นอยู่กับมุมมอง
- ฉันเห็นด้วยกับคำพูดที่ว่าทั้งระบบนี้ตั้งอยู่บนบอท เมื่อก่อนฉันไม่ใช่คนหัวขบถ แต่ส่วนหนึ่งของตัวฉันที่เคยมีความมองโลกในแง่ดีแบบอินเทอร์เน็ตยุคแรก อยากเห็นโมเดลโฆษณานี้พังยับเยิน เพราะต่อให้โฆษณาทำงาน “ได้ปกติ” มันก็มีแก่นแท้ของการเอาเปรียบและการหลอกลวงอยู่แล้ว เช่น ข้อความประเภท "ถ้าไม่ซื้อสินค้านี้ เพื่อนจะไม่ชอบคุณ" เป็นต้น
สำนวนของบทความนี้น่าสนใจ รูปแบบ "ไม่ใช่แค่ X แต่..." การเน้นตัวหนา รายการ bullet ต่างๆ เป็นสไตล์แบบ ChatGPT ที่เห็นบ่อยมากจากที่ไหนสักแห่ง แน่นอนว่าไม่มีปัญหาหากใช้ ChatGPT ช่วย แต่ตัวบทความเองก็ดันมีสำนวนแบบ AI อย่างน่าขัน ถ้านักเขียนตัวจริงเขียนแบบนี้อยู่แล้ว ก็อาจหมายความว่า ChatGPT ถูกปรับจูนตามสไตล์นี้เหมือนกัน หรือการสื่อสารในวงการ adtech เดิมทีก็เป็นแบบนี้อยู่แล้ว?
- กลับกัน ฉันว่าบทความนี้คือกรณีที่มนุษย์ใช้ “ภาษาตามแบบแผน” ได้อย่างถูกต้อง แต่ดันดูเหมือน AI แค่ในระดับผิวเผิน ซึ่งนี่แหละที่น่าขันจริงๆ ประโยคแบบ "มันไม่ใช่ X แต่เป็น Y" เป็นไวยากรณ์ที่มีเป้าหมายชัดเจน เพื่อเปลี่ยนมุมมองผู้อ่านที่คาดว่าจะคิดว่าเป็น X ไปสู่ Y ในบทความมีส่วนอย่าง "ไม่ใช่แค่นับคลิก แต่ดูพฤติกรรม" และ "ไม่ใช่บอทที่แค่เข้าเว็บแล้วออก แต่เป็นบอทที่เลียนแบบพฤติกรรมมนุษย์" ซึ่งตั้งใจแยกความคาดหมายของผู้อ่านออกจากความจริงให้ชัดเจน น่าจะสนุกดีถ้ามีการศึกษาวิจัยแยกแยะระหว่างลักษณะสำนวนแบบ AI กับงานเขียนที่มนุษย์ตั้งใจสื่อความหมายจริงๆ ต่อไปอาจมีปัญหาประเภทนี้ในระดับอุดมศึกษาหรือการรับสมัครงาน ที่ต้องแยกว่าอะไรคือ AI อะไรคือมนุษย์ก็ได้
- ฉันหมดความสนใจตั้งแต่ประโยคที่ว่า "มันเริ่มจากปัญหาที่เรียบง่ายแต่ร้ายแรง" แล้ว ช่วงต่อที่ว่า "ฉันรู้สึกแปลกและไม่สบายใจ" ก็ยิ่งทำให้หมดอารมณ์ แถมดูเหมือนผู้เขียนสุดท้ายแล้วอาจจะเป็นบริษัทที่ขายเครื่องมือโฆษณาอีกต่างหาก
- ยิ่งเป็นบทความแบบนี้ก็ยิ่งรู้สึกประชดประชันดี แต่ก็ยังดีที่ตอนนี้คนเริ่มจับทางบทความตื้นๆ แนวนี้ได้เร็วและเมินมันได้แล้ว สตาร์ตอัปอยาก fail fast แต่ฉันอยากคัดแยกคอนเทนต์ที่ AI สร้างได้เร็วแล้วข้ามมันไปมากกว่า
- ฉันจับสัญญาณความเป็น AI ในบทความได้ทันที แล้วก็เลื่อนลงมาที่คอมเมนต์เลย ถ้าใครอ่านแล้วเห็นชัดว่าเป็นบทความที่ AI สร้าง นั่นก็เป็นสัญญาณว่าไม่ได้เขียนหรือแก้ไขด้วยตัวเอง ทำให้ความน่าเชื่อถือลดลงอัตโนมัติ
- รูปภาพก็ดูเหมือนสร้างด้วย AI หรืออย่างน้อยก็เหมือนคลิปอาร์ตที่ไม่เข้ากัน
ฉันทำงานในวงการ adtech มา 15 ปี และคิดว่าบริษัทยักษ์อย่าง Google/FB ก็หลอกผู้ใช้อยู่เหมือนกัน พวกเขาไม่ยอมให้มีการติดตามแบบสองชั้น ทำให้ต้องเชื่อตัวเลขของพวกเขาเองเท่านั้น และถ้าดู IP ของคลิก ก็จะเห็น IP ของดาต้าเซ็นเตอร์ FB/Google โผล่มาเป็นครั้งคราว ทราฟฟิกจากตรงนั้นจริงๆ ก็เป็นวิธีเอาผลงานโฆษณามาแอบอ้าง ด้วยการรันอัลกอริทึมหาผู้ใช้ที่ยังไงก็คงมาซื้อบนเว็บฉันอยู่แล้ว บริษัทที่พยายามทำตัวชี้วัดด้าน impact ให้ถูกต้องก็มีบ้าง แต่มีน้อยมาก เว็บไซต์ที่ลงโฆษณาก็มีแต่ทำให้ผู้ใช้รำคาญโดยไม่ได้ประโยชน์อะไร ผู้ลงโฆษณาก็เสียเงินไปเปล่าๆ สุดท้ายมีแต่คนกลางที่ได้ประโยชน์
- เวลาทำ Google Ads มันเหมือนจ่ายเงินให้คนไปยืนแจกใบปลิวหน้าร้านฉัน ผู้เข้าชมส่วนใหญ่ของฉันอาจรับใบปลิวมาจาก Google Ads ก็จริง แต่ในนั้นจะมีลูกค้าใหม่จริงๆ กี่คนกัน
- Facebook Ads กับ SA360 รองรับ 3rd party tracking และคุณก็ใช้เครื่องมือวิเคราะห์จากภายนอกได้หลากหลาย เรื่องที่ IP โผล่เป็นดาต้าเซ็นเตอร์ของ FB/Google นี่ฟังดูง่ายเกินไปและฉันไม่เคยได้ยินมาก่อนเลย บริษัทยักษ์จะไม่มี VPN หรือ? แล้วตรรกะที่ว่า "ใช้อัลกอริทึมขโมย organic traffic" ก็ไม่ค่อยเข้าใจ ฉันเองก็อยู่ในวงการมาเกิน 10 ปี แต่คำพูดนี้ฟังไม่ขึ้นเลย ทำมา 15 ปีก็ไม่ได้แปลว่าจะเข้าใจวงการและเทคโนโลยีดีเสมอไป
ฉันคิดว่าในวงการทุกคนรู้กันดีอยู่แล้วว่าตัวเลขทราฟฟิกส่วนใหญ่เป็นเรื่องแต่ง และข้อมูลคลิกโฆษณาเกินครึ่งเป็นการฉ้อโกง แต่ OP ที่อ้างว่าเชี่ยวชาญด้าน "การวิเคราะห์ค่าโฆษณาอย่างแม่นยำ" กลับเพิ่งมารู้เรื่องนี้ตอนนี้ มันเลยดูไม่สมจริง ส่วนนี้ไม่ใช่เรื่องใหม่ และที่ OP ดูเหมือนเพิ่งรู้จริงๆ ก็ยิ่งน่าสงสัย ในทางกลับกัน ส่วนที่จัดหมวดหมู่แพตเทิร์นบอทต่างๆ นั้นน่าสนใจ และฉันยังไม่ค่อยเห็นบทความไหนพูดถึงละเอียดแบบนี้
- คนในวงการบางส่วนรู้เรื่องนี้มานานแล้ว แต่สถานการณ์กำลังเลวร้ายลงเรื่อยๆ ทฤษฎีของฉันจากการทำงานกับทีมการตลาดตลอด 10 ปีที่ผ่านมาคือ คนส่วนใหญ่เชื่อตัวเลขแบบไม่วิพากษ์วิจารณ์ โดยเฉพาะเมื่อทีมจะอยู่รอดได้ก็ต่อเมื่อ metrics ต้องโตแบบทวีคูณทุกปี ตัวเลขที่พองลมจึงกลับเป็นเรื่องดี และถ้าขายไม่ได้ก็ค่อยโทษทีมเซลส์เอา
- ที่สตาร์ตอัปก่อนหน้านี้ของฉัน เราทุ่มทั้งทรัพยากรฝั่งการตลาดและพัฒนาไปกับการปรับ conversion funnel อย่างหนัก แต่จริงๆ แล้วทิศทางธุรกิจตั้งแต่แรกมันผิด ถ้าเราไม่ถูก noise ของข้อมูลไร้สาระพวกนี้พาไป อาจ pivot ได้เร็วกว่านี้ก็ได้
- ปัญหาแบบนี้เป็นสิ่งที่คนในวงการรู้กันมาเกิน 10 ปีแล้ว ในระดับหนึ่งมันเป็นบทความการตลาดของบริษัท datacops
- มีคนตอบว่า "OP เพิ่งรู้ตัวตอนนี้เหรอ!?" แต่บริษัทนี้ (datacops) ดูเหมือนเพิ่งเริ่มต้นได้ไม่นาน จริงๆ แล้วน่าจะปล่อยบทความนี้ออกมาตามจังหวะเปิดตัวผลิตภัณฑ์ของตัวเอง อ้างอิง
- ถ้ามีทราฟฟิก 50,000 แล้วแปลงเป็น 47 ครั้ง สำหรับฉันมันดูเหมือนของปลอมเยอะกว่านั้นอีก เมื่อก่อนอาจปลอมครึ่งหนึ่ง แต่ตอนนี้รู้สึกเหมือนผู้ใช้จริงเหลืออยู่แค่ส่วนน้อยนิดเท่านั้น
ถ้ารันโฆษณา Facebook แล้วมีทราฟฟิกหลอกทะลักเข้ามา ก็อดสงสัยไม่ได้ว่าใครเป็นคนรันบอทพวกนี้ และทำไปเพื่ออะไร Facebook เองก็มีแรงจูงใจ แต่ถ้าถูกจับได้ก็คงจบเห่ เลยไม่น่ากล้าทำ คู่แข่งหรือ? ถ้าจะหวังผลให้ฉันหมดงบก็ดูซับซ้อนทางเทคนิคเกินไป หรือมีใครจ้างตัวร้ายลับๆ มาทำกันจริงๆ? เอเจนซีโฆษณาหรือ? ถ้าข้อมูลเละเทะก็โดนขอเงินคืนค่าโฆษณาทันที ไม่น่าคุ้ม งั้นสุดท้ายแล้วใคร และเพื่ออะไร?
- น่าจะเป็นบอทที่แค่จำลองตัวเองให้ดูเหมือนคนจริง มันอาจไม่ได้เลือกคลิกเฉพาะโฆษณาของฉัน แต่ตั้งใจเลียนแบบผู้ใช้จริงแบบสุ่มๆ มากกว่า
- Facebook Ads ไม่ได้มีแค่โมเดลจ่ายต่อคลิก ยังมีแบบจ่ายตามยอดขายจริงหรือ conversion ด้วย ดังนั้นฝั่งนั้นผลประโยชน์จึงชัดเจนกว่า
- แนะนำให้ไปดูกรณี methbot ส่วนใหญ่เป้าหมายคือกินรายได้โฆษณา โดยใช้บอทหลอกอัลกอริทึมให้ส่งทราฟฟิกไปยังคอนเทนต์หรือเพจที่ตัวเองลงโฆษณาไว้ จากนั้นก็แกล้งเป็นคนจริงเพื่อดึงงบโฆษณาเพิ่ม เป็นโครงสร้างที่ทำให้ FB/Google กรองออกได้ยากโดยธรรมชาติ
- พูดว่า "Facebook จะทำแบบนั้นจริงเหรอ?" แต่ในเชิงประวัติศาสตร์ การใช้แนวคิดว่า ‘เชื่อบริษัทไว้ก่อน’ กับการคำนวณตัวเลขแบบนี้เป็นเรื่องไร้เดียงสามาโดยตลอด ใช้ได้กับทุกบริษัท ถ้ารายได้ที่คาดว่าจะได้มากกว่าต้นทุนบวกความเสี่ยงที่จะถูกจับได้ พวกเขาก็ทำ
- อาจไม่ใช่ว่า Facebook ทำเองโดยตรง แต่ตราบใดที่ผู้ลงโฆษณายังซื้อโฆษณาต่อ ก็ไม่มีแรงจูงใจมากนักที่จะสนใจปัญหานี้
อยากให้เปิดเผยสคริปต์จัง จะได้ตรวจสอบว่าเมธอดถูกต้องไหม หรือเผลอเอาผู้ใช้ปกติที่ใช้ ad blocker หรือปิด JS ไปนับเป็นบอทหรือเปล่า 73% ก็ไม่ได้น่าตกใจสำหรับฉันนัก จริงๆ คาดว่าน่าจะมากกว่านั้นด้วยซ้ำ จุดที่น่าประทับใจคือเวลาไปคุยกับทีมขายของแพลตฟอร์มโฆษณาเรื่องบอทหรือ click fraud น้ำเสียงการสนทนาจะเปลี่ยนเป็นภาษาบริษัทแข็งๆ ทันที ฉันยังจำได้ว่าพนักงานขายที่เคยสนิทกันคนหนึ่งยอมพูดนอกบันทึกว่า "พวกเรารู้กันหมดแหละ รู้ทุกคน แต่ถ้ากรองออกจริงๆ หมด รายได้จะหายไป 40% ในวันเดียว แล้วนักลงทุนจะเดือดกันหมด"
- ถ้าทีมการตลาดถูกวาง incentive โดยยึด vanity metrics เป็นหลัก พวกเขาก็จะมองปัญหา conversion เป็นแค่เรื่องปลาย funnel เท่านั้น แม้แต่สตาร์ตอัปสาย venture เองก็มีแรงจูงใจชัดเจนที่จะปล่อยบอทสมัครสมาชิกไว้ เพื่อเอาตัวเลขพองๆ ไปโชว์นักลงทุน
- พอได้ยินคำยืนยันว่า "ถ้ากรองจริง รายได้หาย 40%" ก็ชวนให้คิดว่านี่น่าจะเข้าข่ายฟ้องแบบ class action ได้ไหม
ตอนทำงานในทีมปฏิบัติการโฆษณาของ Lycos ช่วงต้นยุค 2000 ฉันก็เห็นผลตรวจสอบภายในแล้วว่าบอทมีสัดส่วน 25~75% อยู่แล้ว ตอนนั้นก็พยายามหยุดแต่ไม่สำเร็จ และจนถึงตอนนี้ก็ยังเหมือนเดิม โฆษณาออนไลน์ส่วนใหญ่คือการเผาเงิน มันดูเหมือนสร้างกิจกรรมทางเศรษฐกิจ แต่จริงๆ คือการสูญเสียเวลาและทรัพยากร
- เดิมทีโฆษณาส่วนใหญ่ก็เป็นการเผาเงินอยู่แล้ว ปัญหาคือจะหาว่าส่วนไหนได้ผล อินเทอร์เน็ตโฆษณาว่าจะให้การกำหนดเป้าหมายและการวัดผลที่แม่นยำกว่า แต่ในความจริงก็ไม่ได้ผลนัก ถ้าอยากรู้ผลโฆษณาจริงๆ ต้องถามลูกค้าโดยตรงว่ารู้จักเราจากไหน แล้วปรับงบโฆษณาไปพร้อมกับสังเกตการเปลี่ยนแปลง แต่มันใช้เวลานาน และยังมีเรื่องผิดพลาดอื่นได้อีกเยอะ เช่น ทุ่มโฆษณาจนทราฟฟิกมา แต่บริการหรือองค์ประกอบต่างๆ ยังไม่พร้อมจนเสียลูกค้าไป หรือจัดแคมเปญคูปองแล้วทราฟฟิกไหลเข้ามาจนรับไม่ไหว บทความบอกว่ามีผู้เข้าชม 50,000 คน ยอดขาย 47 รายการ และค่าโฆษณา 4,000 ดอลลาร์ แต่ไม่ชัดว่านี่คือทราฟฟิกทั้งหมดหรือเฉพาะทราฟฟิกจากโฆษณา อย่าตัดสินผลงานจากแค่จำนวนผู้เข้าชมหรือยอดขาย แต่ควรดูตัวชี้วัดแก่นแท้อย่างกำไรสุทธิ ถ้าโครงสร้างธุรกิจได้กำไรสุทธิ 500 ดอลลาร์ต่อหนึ่งออเดอร์ การจ่ายโฆษณา 4,000 ดอลลาร์เพื่อขายได้ 47 รายการก็ถือว่าโอเค แต่ถ้ากำไรแค่ 1 ดอลลาร์ต่อรายการ นั่นคือปัญหาใหญ่
เนื่องจากบทความไม่ได้พูดถึงมาตรการป้องกันบอทแบบเจาะจง เลยขอเสริมว่าถ้าเพิ่มการป้องกันบอทให้เข้มขึ้น (เช่น CAPTCHA) ผู้ใช้จริงจะหลุดออกไปมากขึ้นอย่างมาก และส่งผลเสียรุนแรงต่อ conversion rate ยิ่งบอทเหมือนมนุษย์มากขึ้นเท่าไร ฉันก็ยิ่งคิดว่าปัญหานี้ต้องแก้ในขั้นตอน analytics และ attribution ไม่ใช่แก้ด้วยการทำลาย usability
- บอทมีสองประเภท คือพวกที่สร้างภาระให้เว็บไซต์โดยตรงแบบ DDoS กับพวกที่ไม่ได้ทำแบบนั้นแต่ก่อกวน ประเภทที่สองไม่จำเป็นต้องบล็อก แค่ตัดออกจากเครื่องมือวิเคราะห์แบบเงียบๆ ก็มีประสิทธิภาพที่สุดแล้ว
ด้านล่างนี้เป็นกรณีจริงที่ฉันเจอ
```
หลังจากใช้การกรองบอททราฟฟิกขั้นสูง ทราฟฟิกที่รายงานลดลง 71%
แต่ในรายงานยอดขาย กลับพบว่ายอดขายจริงเพิ่มขึ้น 34%
ความพยายามด้าน conversion rate optimization (CRO) เดิมทีได้ผลอยู่แล้ว แต่ถูกคลิกปลอมจำนวนมหาศาลกลบและรบกวน
ปัญหาไม่ใช่ว่าพวกเขาทำการตลาดไม่เก่ง แต่เป็นแค่เอางบโฆษณาไปเทให้หุ่นยนต์
ROI ทางการตลาดเปลี่ยนจาก "พังยับ" เป็น "ยอดเยี่ยม" ข้ามคืน
```
แต่สิ่งที่ฉันสงสัยคือ แล้วการกรองบอทแบบนี้ทำให้ค่าใช้จ่ายโฆษณาลดลงโดยตรงได้อย่างไร เช่น บอก Google Ads ได้ตรงๆ ไหมว่า "คลิกแบบนี้ฉันไม่อยากจ่าย" หรือว่าเป็นการปรับ targeting เองเพื่อหลบบอท?
- พอปิดกั้นบอททราฟฟิกได้ ก็พอจะนึกภาพได้ว่า retargeting จะถูกใช้กับคนจริงได้แม่นขึ้นและทำให้ conversion เพิ่มขึ้น
- น่าจะเป็นกรณีที่ถ้าระบุได้ว่า "นี่คือบอท" ก็ไม่แสดงโฆษณาให้เลยมากกว่า
- ถ้ามีบอทปนอยู่ตอนสร้าง Lookalike หรือรีมาร์เก็ตติ้งออดิเอนซ์ ก็อาจส่งสัญญาณผิดๆ ให้แพลตฟอร์มอย่าง Facebook ได้ และใน Google Ads คุณไม่สามารถบอกได้ว่าไม่อยากจ่ายสำหรับบางคลิกโดยเฉพาะ
ก่อนหน้านี้ฉันเคยเห็นบทความที่ยกตัวอย่างคล้ายกัน โดยอ้างว่า "ตลาดโฆษณาเว็บแทบทั้งหมดจริงๆ แล้วเป็นของปลอม/ฉ้อโกง/บอท และทุกบริษัท ทุกอุตสาหกรรมก็ช่วยกันทำเป็นมองไม่เห็นเพื่อคงระบบนี้ไว้" งานอาชีพมากมาย บริษัทมากมาย และทั้งอุตสาหกรรมพึ่งพาการไม่ยอมรับความจริงข้อนั้น
- ฉันก็จำบทความนั้นได้ ตอนแรกนึกว่าบทความนี้เป็นของเก่าเอามาวนซ้ำ แต่พอดูวันที่แล้วมันเป็นบทความใหม่ อาจเป็นอาการสะท้อนแบบแปลกๆ ก็ได้ (Mandela effect)

บอตกำลังเลียนแบบพฤติกรรมของผู้ใช้จริงได้มากขึ้นเรื่อย ๆ

จุดเริ่มต้นของปัญหา: ปริศนาอัตราคอนเวอร์ชัน 0.1%

การสืบสวนครั้งแรก: การติดตามเพื่อพิสูจน์ความจริงของทราฟฟิก

ปัญหาที่ขยายวง: ไม่ใช่เหตุการณ์เฉพาะราย แต่เป็นปรากฏการณ์ระดับอุตสาหกรรม

โครงสร้างของการโกงโฆษณา (Ad Fraud) ยุคใหม่: วิเคราะห์ตามประเภททราฟฟิก

Engagement Bot

Cart Abandonment Bot

Phantom Social Media Visitor

ไม่ใช่ทุกบอตจะมีเจตนาร้าย: การสแครปข้อมูลที่ถูกกฎหมาย

เศรษฐศาสตร์ที่พังทลายของโฆษณาดิจิทัล

ปฏิกิริยาของแพลตฟอร์มโฆษณา

คุณกำลังยิงโฆษณาให้หุ่นยนต์อยู่หรือไม่? คู่มือปฏิบัติสำหรับตรวจจับทราฟฟิกปลอม

1. ตรวจสอบการพุ่งขึ้นของทราฟฟิกเทียบกับข้อมูลยอดขาย

2. วิเคราะห์ตัวชี้วัดพฤติกรรมผู้ใช้

3. แบ่งเซกเมนต์ข้อมูลตามภูมิศาสตร์

4. ตรวจสอบแหล่งที่มาของรีเฟอรัล

5. เชื่อสัญชาตญาณของตัวเอง

บทสรุปอันเยือกเย็น: ปราสาททรายดิจิทัล

เศรษฐกิจบอตที่ซ่อนอยู่

มุมมองสุดท้าย

บทความที่เกี่ยวข้อง

2 ความคิดเห็น

ความเห็นบน Hacker News