- มีความเป็นไปได้สูงมากว่า 73% ของผู้เยี่ยมชมเว็บไซต์อีคอมเมิร์ซ ไม่ใช่มนุษย์จริง แต่เป็น บอตที่ซับซ้อน
- เครื่องมือวิเคราะห์ มาตรฐานแยกทราฟฟิกบอตลักษณะนี้ได้ยาก ส่งผลให้การวิเคราะห์ประสิทธิภาพโฆษณาและการคำนวณ ROI ทางการตลาด บิดเบือน
- บอตเหล่านี้ เลียนแบบกิจกรรมบนเว็บไซต์อย่างแนบเนียน ในหลายรูปแบบ เช่น Engagement Bot , Cart Abandonment Bot และ บอตทราฟฟิกจากโซเชียลมีเดีย
- ทราฟฟิกบอตบางส่วนเกิดจาก การเก็บข้อมูลหรือระบบอัตโนมัติที่ชอบด้วยเหตุผล แต่จำนวนมากมีเป้าหมายเพื่อ โกงโฆษณา หรือปั่นตัวชี้วัดภายใน
- ปัญหานี้ไม่ได้จำกัดอยู่แค่บางเว็บไซต์อีกต่อไป แต่กำลังขยายเป็น โจทย์ของทั้งอุตสาหกรรมอย่างกว้างขวางและเป็นระบบ
จุดเริ่มต้นของปัญหา: ปริศนาอัตราคอนเวอร์ชัน 0.1%
- เว็บไซต์ของลูกค้าอีคอมเมิร์ซรายหนึ่งมีผู้เข้าชม 50,000 คนต่อเดือน แต่เกิดยอดขายจริงเพียง 47 รายการเท่านั้น
- ในแพลตฟอร์มวิเคราะห์อย่าง Google Analytics ข้อมูลดูเป็นบวกมาก แต่พบว่า เชื่อมโยงกับรายได้จริงได้ต่ำมาก
- แม้จะใช้จ่ายค่าโฆษณาเดือนละ 4,000 ดอลลาร์ แต่ การเติบโตกับรายได้กลับไม่สัดส่วนกันเลย
- ต่างจากข้อสันนิษฐานแรกที่คิดว่าเป็นปัญหาของตัวสินค้าเอง ผู้เขียนเริ่มเห็นสัญญาณผิดปกติเมื่อ วิเคราะห์ข้อมูลทราฟฟิกเว็บไซต์โดยตรง
- เพื่อหาสาเหตุ จึงพัฒนา สคริปต์ติดตาม สำหรับเฝ้าดู รูปแบบพฤติกรรม ของผู้ใช้จริง
การสืบสวนครั้งแรก: การติดตามเพื่อพิสูจน์ความจริงของทราฟฟิก
- พัฒนาเครื่องมือติดตามที่ไม่ได้แค่นับจำนวนคลิก แต่สังเกต รูปแบบพฤติกรรมของผู้ใช้จริง
- การเคลื่อนเมาส์: วิเคราะห์ความต่างระหว่างเส้นโค้งที่เป็นธรรมชาติกับการเคลื่อนที่เป็นเส้นตรงแบบเครื่องจักร
- รูปแบบการเลื่อนหน้าจอ: ความเร็วที่แปรผันพร้อมการหยุด/เลื่อนย้อนกลับ เทียบกับการเลื่อนแบบสม่ำเสมอสมบูรณ์ของเครื่อง
- ช่วงห่างระหว่างการโต้ตอบ: วัด ความแปรผันของช่วงเวลา ระหว่างการคลิก การโฮเวอร์ และการเพิ่มลงตะกร้า
- ภายในเวลาเพียงหนึ่งสัปดาห์ พบว่า ทราฟฟิกที่ไม่ใช่มนุษย์ (Non-human) สูงถึง 68%
- ส่วนใหญ่ไม่ใช่สแปมทั่วไป แต่เป็น บอตที่แยบยลซึ่งออกแบบมาเพื่อหลอกเครื่องมือวิเคราะห์
ปัญหาที่ขยายวง: ไม่ใช่เหตุการณ์เฉพาะราย แต่เป็นปรากฏการณ์ระดับอุตสาหกรรม
- ในฟอรัมการตลาดและกลุ่ม Discord ผู้เขียนถามผู้ประกอบการอีคอมเมิร์ซรายอื่นว่า "เคยเจอไหมที่ทราฟฟิกกับยอดขายไม่สอดคล้องกัน?"
- หลังได้รับอนุญาตให้ติดตั้งสคริปต์ติดตามบนเว็บไซต์อีคอมเมิร์ซขนาดเล็กและกลางกว่า 200 แห่ง และเก็บข้อมูลเป็นเวลา 6 เดือน ก็ยืนยันได้ว่าโดยเฉลี่ย 73% เป็นทราฟฟิกปลอม (บอต)
- สิ่งนี้ไม่ใช่ปัญหาเฉพาะจุด แต่เป็น ปัญหาเชิงโครงสร้างของระบบนิเวศดิจิทัลคอมเมิร์ซทั้งหมด
โครงสร้างของการโกงโฆษณา (Ad Fraud) ยุคใหม่: วิเคราะห์ตามประเภททราฟฟิก
-
Engagement Bot
- เป็นบอตที่ออกแบบมาเพื่อ ทำให้รายงานวิเคราะห์ดูดีขึ้น โดยจำลองพฤติกรรมของผู้เข้าชมคุณภาพสูง
- ทำ ปฏิสัมพันธ์ที่ซับซ้อน เช่น เลื่อนหน้า วางเคอร์เซอร์เหนือสินค้า และคลิกลิงก์ภายใน
- จุดบกพร่องร้ายแรงคือ ความสม่ำเสมอที่สมบูรณ์แบบ
- ใช้เวลาอยู่บนหน้าคำอธิบายสินค้าทุกหน้าพอดี 11~13 วินาที
- ความเร็วการเลื่อนคงที่ที่ 3.2 หน้า/วินาทีเสมอ
- พฤติกรรมมนุษย์ย่อมไม่สม่ำเสมอ แต่บอตเหล่านี้ แม่นยำราวกับในห้องแล็บ
-
Cart Abandonment Bot
- เพิ่มสินค้าชิ้นเดิมลงตะกร้า ค้างไว้ 4 นาที แล้วทิ้ง ทำซ้ำ วันละหลายสิบครั้ง
- ทำซ้ำผ่าน IP และเซสชันที่หลากหลาย ซึ่งอาจมีเป้าหมายเพื่อบิดเบือนตัวชี้วัดอีคอมเมิร์ซสำคัญอย่าง อัตราการทิ้งตะกร้า โดยเจตนา หรือเพื่อปั่น อัลกอริทึมแนะนำสินค้าภายใน
-
Phantom Social Media Visitor
- เป็นทราฟฟิกที่ แสดงในเครื่องมือวิเคราะห์ ว่ามาจาก Instagram, TikTok และแหล่งอื่น ๆ
- ในจำนวนนี้ราว 64% จะ รอพอดี 1.8 วินาที หลังเข้าหน้าเว็บ แล้วจึงออกไป
- เด้งออกทันที โดยไม่เลื่อนหรือคลิกอะไรเลย แต่ยังถูกนับเป็น "ผู้เยี่ยมชมจากโซเชียลมีเดีย"
- เป็น องค์ประกอบสำคัญของการโกงโฆษณา: ผู้ขายเอ็นเกจเมนต์ปลอมใช้สิ่งนี้เป็นหลักฐานว่าได้ส่งทราฟฟิกมาแล้ว
ไม่ใช่ทุกบอตจะมีเจตนาร้าย: การสแครปข้อมูลที่ถูกกฎหมาย
- ข้อมูลจากคนวงในอุตสาหกรรมข้อมูลอีคอมเมิร์ซ: มีการสแครป หน้าเว็บค้าปลีก 70 ล้านหน้า/วัน
- เพื่อวัตถุประสงค์ด้าน Business Intelligence ที่ชอบด้วยกฎหมาย
- ผู้ค้าปลีกรายใหญ่อย่าง Amazon ไม่ได้ แจ้ง vendor เสมอไป เมื่อสินค้าใกล้หมดสต็อก
- แบรนด์ต่าง ๆ จ่ายเงินให้บริการ สแครปข้อมูล เพื่อติดตามสินค้าของตนเอง
- ตรวจสอบระดับสต็อก วิเคราะห์การแข่งขัน buy box และตรวจสอบความถูกต้องของคำอธิบายสินค้า
- ติดตาม อันดับผลการค้นหา แยกตามภูมิภาคและอุปกรณ์มือถือ
- วิเคราะห์ แบนเนอร์โฆษณา ตามกลุ่มเป้าหมาย
- ตามวิดีโอของ Kurzgesagt เกือบ 50% ของทราฟฟิกอินเทอร์เน็ตทั้งหมดเป็นบอต
- บางส่วนเป็น การวิเคราะห์คู่แข่ง และ การติดตามราคา ที่ถูกกฎหมาย แต่ส่วนใหญ่ไม่น้อยคือ ทราฟฟิกฉ้อโกงที่เผางบโฆษณา
เศรษฐศาสตร์ที่พังทลายของโฆษณาดิจิทัล
- ลูกค้ารายหนึ่งใช้จ่ายกับ Google Ads เดือนละ 12,000 ดอลลาร์
- หลังติดตั้งระบบ ตรวจจับและกรองทราฟฟิกบอตขั้นสูง:
- ทราฟฟิกที่รายงาน ลดลง 71%
- CFO ตกใจมากในช่วงแรก
- แต่ยอดขายจริงกลับ เพิ่มขึ้น 34%
- ความพยายามด้าน Conversion Rate Optimization (CRO) ที่ทำไว้แต่แรกจริง ๆ แล้วได้ผล เพียงแต่ถูกกลบด้วย หิมะถล่มของคลิกปลอม
- เงินหลายพันดอลลาร์ถูกทิ้งไปกับการโฆษณาให้ หุ่นยนต์ที่ถูกโปรแกรมมาไม่ให้ซื้อโดยเด็ดขาด
- Marketing ROI เปลี่ยนจาก "ย่ำแย่" เป็น "ยอดเยี่ยม" ได้ทันที
-
ปฏิกิริยาของแพลตฟอร์มโฆษณา
- เมื่อพูดคุยกับ แพลตฟอร์มโฆษณา รายใหญ่ ทันทีที่เอ่ยถึง คลิกฟรอด หรือ ทราฟฟิกบอต ท่าทีจะเปลี่ยนไปอย่างชัดเจน
- "ระบบตรวจจับ AI ของเราอยู่ในระดับแนวหน้าของอุตสาหกรรม"
- "เราให้ความสำคัญกับการโกงโฆษณาอย่างมาก"
- เจ้าหน้าที่คนหนึ่งยอมรับแบบไม่เป็นทางการว่า: "ทุกคนรู้กันหมด"
- "ถ้ากรองกันจริงจัง รายได้จะ หายไป 40% ในชั่วข้ามคืน แล้วนักลงทุนจะตื่นตระหนก"
- นี่คือ ความขัดแย้งทางผลประโยชน์ครั้งใหญ่: แพลตฟอร์มโฆษณาหารายได้จากการคลิกหรือการแสดงผล โดยไม่สนว่านั่นจะเป็นลูกค้าที่มีศักยภาพหรือ เซิร์ฟเวอร์ click farm
คุณกำลังยิงโฆษณาให้หุ่นยนต์อยู่หรือไม่? คู่มือปฏิบัติสำหรับตรวจจับทราฟฟิกปลอม
-
1. ตรวจสอบการพุ่งขึ้นของทราฟฟิกเทียบกับข้อมูลยอดขาย
- ทราฟฟิกที่พุ่งขึ้น สอดคล้องกับยอดขายที่พุ่งขึ้น หรือไม่?
- ถ้าช่วงโปรโมชันททราฟฟิกเพิ่มเป็นสองเท่า แต่ยอดขาย นิ่งสนิท ก็มีโอกาสสูงว่าเป็น ทราฟฟิกฉ้อโกง
-
2. วิเคราะห์ตัวชี้วัดพฤติกรรมผู้ใช้
- มองหาค่าที่ "สมบูรณ์แบบเกินไป"
- ค่า "เวลาเฉลี่ยบนหน้า" ของหน้าแลนดิ้งหลัก คงที่อย่างน่ากังวลทุกเดือน หรือไม่?
- พฤติกรรมของมนุษย์จริงย่อม ไม่สม่ำเสมอและแปรผัน
-
3. แบ่งเซกเมนต์ข้อมูลตามภูมิศาสตร์
- มีทราฟฟิกจำนวนมากมาจาก ประเทศที่คุณไม่ได้จัดส่งสินค้า หรือไม่?
- หากผู้เข้าชมเหล่านี้ ไม่เกิดคอนเวอร์ชันเลย นั่นคือสัญญาณสำคัญของทราฟฟิกคุณภาพต่ำหรือ ทราฟฟิกปลอม
-
4. ตรวจสอบแหล่งที่มาของรีเฟอรัล
- เจาะลึกแหล่งทราฟฟิกอันดับต้น ๆ
- หากเว็บไซต์รีเฟอรัลดู ไม่เกี่ยวข้องหรือคุณภาพต่ำ ก็อาจเป็นส่วนหนึ่งของ เครือข่ายแลกเปลี่ยนทราฟฟิก
- มองหา "ghost referral" ที่ไม่มีลิงก์มายังเว็บไซต์ของคุณอยู่จริง
-
5. เชื่อสัญชาตญาณของตัวเอง
- ถ้าตัวเลขดูแปลก ก็มีโอกาสสูงว่า มีปัญหาจริง
- สัญชาตญาณของเจ้าของธุรกิจที่รู้จักฐานลูกค้าของตนดี คือ เครื่องมือตรวจจับบอตที่มีค่า
บทสรุปอันเยือกเย็น: ปราสาททรายดิจิทัล
- ผู้ก่อตั้งสตาร์ทอัปรายหนึ่งระดมทุนได้ 2 ล้านดอลลาร์โดยอาศัยตัวชี้วัด "การเติบโตของผู้ใช้"
- ต่อมาพบว่า 80% ของตัวชี้วัดนั้นเป็นบอต
- ตอนนี้หาก ยอมรับความจริง ความสัมพันธ์ระหว่างบริษัทกับนักลงทุนอาจสั่นคลอน จึงต้องแสร้งทำราวกับว่าทุกอย่างยังปกติ
-
เศรษฐกิจบอตที่ซ่อนอยู่
- แพลตฟอร์มโฆษณา ขายการแสดงผลให้บอต
- บริษัทต่าง ๆ ซื้อทราฟฟิกปลอม เพื่อปั่นตัวชี้วัด
- บริษัทวิเคราะห์ก็ รายงานกิจกรรมของบอตเหล่านี้อย่างซื่อตรง
- ทั้งอุตสาหกรรมกำลัง สมรู้ร่วมคิดในละครสวมหน้ากากหมู่ เพราะกลัวว่าหากยอมรับความจริง ระบบอันเปราะบางนี้จะพังทลาย
-
มุมมองสุดท้าย
- มากกว่าครึ่งของอินเทอร์เน็ตคือภาพลวงตา เป็นละครเวทีดิจิทัลที่บอตกำลังแสดงให้บอตด้วยกันดู
- สัดส่วนนี้กำลังเพิ่มขึ้นทุกวัน เมื่อ AI และระบบอัตโนมัติ ซับซ้อนยิ่งขึ้น
- คำถามไม่ใช่อีกต่อไปว่า "ธุรกิจของคุณได้รับผลกระทบหรือไม่?"
- คำถามที่แท้จริงคือ "จะเกิดอะไรขึ้นเมื่อปราสาททรายดิจิทัลนี้พังทลายลงในที่สุด?"
2 ความคิดเห็น
ตอนนี้ไม่ใช่แค่บอตแบบ headless เท่านั้น แต่ยังมี agent bot อย่างเช่น comet browser โผล่มาด้วย ทำให้ตรวจจับได้ยากขึ้นไปอีก
ความเห็นบน Hacker News
ฉันทำเอเจนซีการตลาดอยู่ และพอข้อมูลวิเคราะห์ของลูกค้ารายหนึ่งดูไม่สมเหตุสมผลเอาเสียเลย (ผู้เข้าชม 50,000 คน แต่มียอดขาย 47 รายการ) ก็เลยขุดลึกลงไป จากนั้นจึงใช้สคริปต์ง่ายๆ ติดตามพฤติกรรมผู้ใช้และวิเคราะห์เว็บอีคอมเมิร์ซขนาดเล็กถึงกลางมากกว่า 200 แห่ง โดยเฉลี่ยแล้ว 73% ของทราฟฟิกทั้งหมดถูกนับเป็นผู้เข้าชมจริงในเครื่องมือวิเคราะห์มาตรฐาน ทั้งที่จริงเป็นบอททราฟฟิก ตอนนี้บอทเก่งมากในการเลียนแบบพฤติกรรมมนุษย์ ฉันสรุปทั้งแพตเทิร์นแปลกๆ ที่เจอเองและบทสนทนาแบบไม่เป็นทางการกับคนในวงการ adtech ด้วย สิ่งที่น่าตกใจคือ บอททราฟฟิกนี้เป็นความลับที่เปิดเผยกันอยู่ ทุกคนรู้แต่ไม่มีใครพูดตรงๆ รู้สึกเหมือนทั้งระบบนี้ทำงานอยู่ได้เพราะบอทพวกนี้ เลยอยากรู้ว่านักพัฒนา ผู้ก่อตั้ง หรือมาร์เก็ตเตอร์คนอื่นๆ เคยเห็นข้อมูลที่มันขัดแย้งกันแบบนี้ไหม
ตอนทำงานที่ yellow pages ในสวิตเซอร์แลนด์เมื่อก่อน เรามีแดชบอร์ดให้ลูกค้าแบบเสียเงินดูจำนวนผู้เข้าชมหน้าธุรกิจของตัวเอง พอทีมพัฒนาของเรากรองบอททราฟฟิกออก ตัวเลขก็ร่วงลงมากกว่า 50% ฝั่งธุรกิจสั่งให้เอาฟิลเตอร์ออกภายในไม่ถึงวัน สุดท้ายก็ถือว่าบอทเป็นคนจริงไปด้วย
จริงๆ ต่อให้ทั้งหมดเป็นการหลอกลวงก็ไม่เห็นเป็นไรไม่ใช่หรือ? ถ้ามีการซื้อจริง 47 ครั้ง ก็แค่ดูว่าในช่วงนั้นใช้ค่าโฆษณาไปเท่าไร แล้วเทียบกับข้อมูลก่อนหน้าและหลังจากนั้น ก็พอตัดสินได้ว่าแคมเปญสำเร็จหรือไม่ ป้ายโฆษณานอกบ้านหรือโฆษณาบนรถเมล์ก็ไม่ได้สนใจว่าใครดู หรือเป็นคนจริงไหม สิ่งสำคัญสุดท้ายคือผลกระทบในตัวเลขจริง
ฉันทำที่ปรึกษาด้าน web analytics และเคยสืบสวนแพตเทิร์นทราฟฟิกแปลกๆ ของบริษัทโลจิสติกส์ระดับโลกในปี 2021 ไว้สรุปในบล็อกของฉันบทความนี้ ปัญหาบอททราฟฟิกมีมานานแล้ว และแม้จะมีบริการแนว “ตรวจจับ ad fraud” หน้าใหม่มากมาย แต่ฉันยังแทบไม่เห็นบริการไหนที่มีประโยชน์จริง คำถามว่า "จะแก้อย่างไร?" มักเหลืออยู่ท้ายสุดเสมอ แต่ไม่มีใครรู้วิธีหยุดบอทได้อย่างสมบูรณ์ ผู้บริโภคส่วนใหญ่ใช้แพลตฟอร์มหลักอย่าง Google, Facebook, Instagram, TikTok, LinkedIn และแทบไม่มีเครือข่ายโฆษณาทางเลือกที่มีบอทน้อยกว่าแบบใช้งานได้จริง ทุกคนรู้ว่ามีส่วนหนึ่งเป็นของปลอม แต่ก็ยังซื้อทราฟฟิกนั้นอยู่ สถานะนี้จะเปลี่ยนได้ก็ต่อเมื่อบริษัท Big Tech ที่มีรายได้โฆษณาระดับหลายพันล้านดอลลาร์มีแรงจูงใจให้เปลี่ยนระบบมากกว่ารักษามันไว้ แต่ตอนนี้ยังไม่รู้สึกว่าพวกเขาแคร์ด้วยซ้ำ "เงินครึ่งหนึ่งที่ฉันใช้กับโฆษณาคือการสูญเปล่า ปัญหาคือฉันไม่รู้ว่าครึ่งไหน" - John Wanamaker
เรื่องทราฟฟิกจาก “บอทดีๆ” น่าสนใจมาก ตอนที่ฉันกำลังค้นคว้าอยู่ มีคนในอุตสาหกรรมข้อมูลให้เบาะแสใหญ่มา เขาบอกว่าบริษัทของเขา scrape เว็บหน้าสินค้าปลีกวันละ 70 ล้านหน้า นี่เป็นแหล่งบอททราฟฟิกที่ถูกกฎหมายขนาดมหาศาล ตัวอย่างเช่น Amazon จะไม่แจ้งซัพพลายเออร์เมื่อสินค้าหมดสต็อก แบรนด์ต่างๆ จึงใช้บริการ data scraping เพื่อตรวจดูสถานะสต็อกสินค้าของตัวเอง การแข่งขันเรื่องความได้เปรียบใน ‘Buy Box’ ความเหมาะสมของคำอธิบายสินค้า อันดับการค้นหา หรือแม้กระทั่งแบนเนอร์โฆษณาใดถูกแสดงต่อออดิเอนซ์แบบไหน แม้แต่ “บอทดีๆ” เหล่านี้เองก็อาจถูกมองต่างกันไปแล้วแต่มุมมอง ฉันไม่ชอบถ้าคู่แข่งมา scrape เว็บฉัน แต่ฉันกลับมองว่าการที่ฉันเก็บข้อมูลตลาดเป็นเรื่องดี มันคือบอทที่มีคนเขียนและคอยรัน เพราะมันให้ประโยชน์กับคนคนนั้น ครีเอเตอร์คอนเทนต์มอง AI scraping ว่าแย่ แต่ฝั่งที่สร้าง AI กลับมองว่าดี เว็บเปรียบเทียบราคามั่นใจว่าครอว์เลอร์ของตัวเองชอบธรรม แต่ฝั่งรีเทลเลอร์เกลียดมัน เรื่องของบอททราฟฟิก “ดี” หรือ “แย่” จึงขึ้นอยู่กับมุมมอง
ฉันเห็นด้วยกับคำพูดที่ว่าทั้งระบบนี้ตั้งอยู่บนบอท เมื่อก่อนฉันไม่ใช่คนหัวขบถ แต่ส่วนหนึ่งของตัวฉันที่เคยมีความมองโลกในแง่ดีแบบอินเทอร์เน็ตยุคแรก อยากเห็นโมเดลโฆษณานี้พังยับเยิน เพราะต่อให้โฆษณาทำงาน “ได้ปกติ” มันก็มีแก่นแท้ของการเอาเปรียบและการหลอกลวงอยู่แล้ว เช่น ข้อความประเภท "ถ้าไม่ซื้อสินค้านี้ เพื่อนจะไม่ชอบคุณ" เป็นต้น
สำนวนของบทความนี้น่าสนใจ รูปแบบ "ไม่ใช่แค่ X แต่..." การเน้นตัวหนา รายการ bullet ต่างๆ เป็นสไตล์แบบ ChatGPT ที่เห็นบ่อยมากจากที่ไหนสักแห่ง แน่นอนว่าไม่มีปัญหาหากใช้ ChatGPT ช่วย แต่ตัวบทความเองก็ดันมีสำนวนแบบ AI อย่างน่าขัน ถ้านักเขียนตัวจริงเขียนแบบนี้อยู่แล้ว ก็อาจหมายความว่า ChatGPT ถูกปรับจูนตามสไตล์นี้เหมือนกัน หรือการสื่อสารในวงการ adtech เดิมทีก็เป็นแบบนี้อยู่แล้ว?
กลับกัน ฉันว่าบทความนี้คือกรณีที่มนุษย์ใช้ “ภาษาตามแบบแผน” ได้อย่างถูกต้อง แต่ดันดูเหมือน AI แค่ในระดับผิวเผิน ซึ่งนี่แหละที่น่าขันจริงๆ ประโยคแบบ "มันไม่ใช่ X แต่เป็น Y" เป็นไวยากรณ์ที่มีเป้าหมายชัดเจน เพื่อเปลี่ยนมุมมองผู้อ่านที่คาดว่าจะคิดว่าเป็น X ไปสู่ Y ในบทความมีส่วนอย่าง "ไม่ใช่แค่นับคลิก แต่ดูพฤติกรรม" และ "ไม่ใช่บอทที่แค่เข้าเว็บแล้วออก แต่เป็นบอทที่เลียนแบบพฤติกรรมมนุษย์" ซึ่งตั้งใจแยกความคาดหมายของผู้อ่านออกจากความจริงให้ชัดเจน น่าจะสนุกดีถ้ามีการศึกษาวิจัยแยกแยะระหว่างลักษณะสำนวนแบบ AI กับงานเขียนที่มนุษย์ตั้งใจสื่อความหมายจริงๆ ต่อไปอาจมีปัญหาประเภทนี้ในระดับอุดมศึกษาหรือการรับสมัครงาน ที่ต้องแยกว่าอะไรคือ AI อะไรคือมนุษย์ก็ได้
ฉันหมดความสนใจตั้งแต่ประโยคที่ว่า "มันเริ่มจากปัญหาที่เรียบง่ายแต่ร้ายแรง" แล้ว ช่วงต่อที่ว่า "ฉันรู้สึกแปลกและไม่สบายใจ" ก็ยิ่งทำให้หมดอารมณ์ แถมดูเหมือนผู้เขียนสุดท้ายแล้วอาจจะเป็นบริษัทที่ขายเครื่องมือโฆษณาอีกต่างหาก
ยิ่งเป็นบทความแบบนี้ก็ยิ่งรู้สึกประชดประชันดี แต่ก็ยังดีที่ตอนนี้คนเริ่มจับทางบทความตื้นๆ แนวนี้ได้เร็วและเมินมันได้แล้ว สตาร์ตอัปอยาก fail fast แต่ฉันอยากคัดแยกคอนเทนต์ที่ AI สร้างได้เร็วแล้วข้ามมันไปมากกว่า
ฉันจับสัญญาณความเป็น AI ในบทความได้ทันที แล้วก็เลื่อนลงมาที่คอมเมนต์เลย ถ้าใครอ่านแล้วเห็นชัดว่าเป็นบทความที่ AI สร้าง นั่นก็เป็นสัญญาณว่าไม่ได้เขียนหรือแก้ไขด้วยตัวเอง ทำให้ความน่าเชื่อถือลดลงอัตโนมัติ
รูปภาพก็ดูเหมือนสร้างด้วย AI หรืออย่างน้อยก็เหมือนคลิปอาร์ตที่ไม่เข้ากัน
ฉันทำงานในวงการ adtech มา 15 ปี และคิดว่าบริษัทยักษ์อย่าง Google/FB ก็หลอกผู้ใช้อยู่เหมือนกัน พวกเขาไม่ยอมให้มีการติดตามแบบสองชั้น ทำให้ต้องเชื่อตัวเลขของพวกเขาเองเท่านั้น และถ้าดู IP ของคลิก ก็จะเห็น IP ของดาต้าเซ็นเตอร์ FB/Google โผล่มาเป็นครั้งคราว ทราฟฟิกจากตรงนั้นจริงๆ ก็เป็นวิธีเอาผลงานโฆษณามาแอบอ้าง ด้วยการรันอัลกอริทึมหาผู้ใช้ที่ยังไงก็คงมาซื้อบนเว็บฉันอยู่แล้ว บริษัทที่พยายามทำตัวชี้วัดด้าน impact ให้ถูกต้องก็มีบ้าง แต่มีน้อยมาก เว็บไซต์ที่ลงโฆษณาก็มีแต่ทำให้ผู้ใช้รำคาญโดยไม่ได้ประโยชน์อะไร ผู้ลงโฆษณาก็เสียเงินไปเปล่าๆ สุดท้ายมีแต่คนกลางที่ได้ประโยชน์
เวลาทำ Google Ads มันเหมือนจ่ายเงินให้คนไปยืนแจกใบปลิวหน้าร้านฉัน ผู้เข้าชมส่วนใหญ่ของฉันอาจรับใบปลิวมาจาก Google Ads ก็จริง แต่ในนั้นจะมีลูกค้าใหม่จริงๆ กี่คนกัน
Facebook Ads กับ SA360 รองรับ 3rd party tracking และคุณก็ใช้เครื่องมือวิเคราะห์จากภายนอกได้หลากหลาย เรื่องที่ IP โผล่เป็นดาต้าเซ็นเตอร์ของ FB/Google นี่ฟังดูง่ายเกินไปและฉันไม่เคยได้ยินมาก่อนเลย บริษัทยักษ์จะไม่มี VPN หรือ? แล้วตรรกะที่ว่า "ใช้อัลกอริทึมขโมย organic traffic" ก็ไม่ค่อยเข้าใจ ฉันเองก็อยู่ในวงการมาเกิน 10 ปี แต่คำพูดนี้ฟังไม่ขึ้นเลย ทำมา 15 ปีก็ไม่ได้แปลว่าจะเข้าใจวงการและเทคโนโลยีดีเสมอไป
ฉันคิดว่าในวงการทุกคนรู้กันดีอยู่แล้วว่าตัวเลขทราฟฟิกส่วนใหญ่เป็นเรื่องแต่ง และข้อมูลคลิกโฆษณาเกินครึ่งเป็นการฉ้อโกง แต่ OP ที่อ้างว่าเชี่ยวชาญด้าน "การวิเคราะห์ค่าโฆษณาอย่างแม่นยำ" กลับเพิ่งมารู้เรื่องนี้ตอนนี้ มันเลยดูไม่สมจริง ส่วนนี้ไม่ใช่เรื่องใหม่ และที่ OP ดูเหมือนเพิ่งรู้จริงๆ ก็ยิ่งน่าสงสัย ในทางกลับกัน ส่วนที่จัดหมวดหมู่แพตเทิร์นบอทต่างๆ นั้นน่าสนใจ และฉันยังไม่ค่อยเห็นบทความไหนพูดถึงละเอียดแบบนี้
คนในวงการบางส่วนรู้เรื่องนี้มานานแล้ว แต่สถานการณ์กำลังเลวร้ายลงเรื่อยๆ ทฤษฎีของฉันจากการทำงานกับทีมการตลาดตลอด 10 ปีที่ผ่านมาคือ คนส่วนใหญ่เชื่อตัวเลขแบบไม่วิพากษ์วิจารณ์ โดยเฉพาะเมื่อทีมจะอยู่รอดได้ก็ต่อเมื่อ metrics ต้องโตแบบทวีคูณทุกปี ตัวเลขที่พองลมจึงกลับเป็นเรื่องดี และถ้าขายไม่ได้ก็ค่อยโทษทีมเซลส์เอา
ที่สตาร์ตอัปก่อนหน้านี้ของฉัน เราทุ่มทั้งทรัพยากรฝั่งการตลาดและพัฒนาไปกับการปรับ conversion funnel อย่างหนัก แต่จริงๆ แล้วทิศทางธุรกิจตั้งแต่แรกมันผิด ถ้าเราไม่ถูก noise ของข้อมูลไร้สาระพวกนี้พาไป อาจ pivot ได้เร็วกว่านี้ก็ได้
ปัญหาแบบนี้เป็นสิ่งที่คนในวงการรู้กันมาเกิน 10 ปีแล้ว ในระดับหนึ่งมันเป็นบทความการตลาดของบริษัท datacops
มีคนตอบว่า "OP เพิ่งรู้ตัวตอนนี้เหรอ!?" แต่บริษัทนี้ (datacops) ดูเหมือนเพิ่งเริ่มต้นได้ไม่นาน จริงๆ แล้วน่าจะปล่อยบทความนี้ออกมาตามจังหวะเปิดตัวผลิตภัณฑ์ของตัวเอง อ้างอิง
ถ้ามีทราฟฟิก 50,000 แล้วแปลงเป็น 47 ครั้ง สำหรับฉันมันดูเหมือนของปลอมเยอะกว่านั้นอีก เมื่อก่อนอาจปลอมครึ่งหนึ่ง แต่ตอนนี้รู้สึกเหมือนผู้ใช้จริงเหลืออยู่แค่ส่วนน้อยนิดเท่านั้น
ถ้ารันโฆษณา Facebook แล้วมีทราฟฟิกหลอกทะลักเข้ามา ก็อดสงสัยไม่ได้ว่าใครเป็นคนรันบอทพวกนี้ และทำไปเพื่ออะไร Facebook เองก็มีแรงจูงใจ แต่ถ้าถูกจับได้ก็คงจบเห่ เลยไม่น่ากล้าทำ คู่แข่งหรือ? ถ้าจะหวังผลให้ฉันหมดงบก็ดูซับซ้อนทางเทคนิคเกินไป หรือมีใครจ้างตัวร้ายลับๆ มาทำกันจริงๆ? เอเจนซีโฆษณาหรือ? ถ้าข้อมูลเละเทะก็โดนขอเงินคืนค่าโฆษณาทันที ไม่น่าคุ้ม งั้นสุดท้ายแล้วใคร และเพื่ออะไร?
น่าจะเป็นบอทที่แค่จำลองตัวเองให้ดูเหมือนคนจริง มันอาจไม่ได้เลือกคลิกเฉพาะโฆษณาของฉัน แต่ตั้งใจเลียนแบบผู้ใช้จริงแบบสุ่มๆ มากกว่า
Facebook Ads ไม่ได้มีแค่โมเดลจ่ายต่อคลิก ยังมีแบบจ่ายตามยอดขายจริงหรือ conversion ด้วย ดังนั้นฝั่งนั้นผลประโยชน์จึงชัดเจนกว่า
แนะนำให้ไปดูกรณี methbot ส่วนใหญ่เป้าหมายคือกินรายได้โฆษณา โดยใช้บอทหลอกอัลกอริทึมให้ส่งทราฟฟิกไปยังคอนเทนต์หรือเพจที่ตัวเองลงโฆษณาไว้ จากนั้นก็แกล้งเป็นคนจริงเพื่อดึงงบโฆษณาเพิ่ม เป็นโครงสร้างที่ทำให้ FB/Google กรองออกได้ยากโดยธรรมชาติ
พูดว่า "Facebook จะทำแบบนั้นจริงเหรอ?" แต่ในเชิงประวัติศาสตร์ การใช้แนวคิดว่า ‘เชื่อบริษัทไว้ก่อน’ กับการคำนวณตัวเลขแบบนี้เป็นเรื่องไร้เดียงสามาโดยตลอด ใช้ได้กับทุกบริษัท ถ้ารายได้ที่คาดว่าจะได้มากกว่าต้นทุนบวกความเสี่ยงที่จะถูกจับได้ พวกเขาก็ทำ
อาจไม่ใช่ว่า Facebook ทำเองโดยตรง แต่ตราบใดที่ผู้ลงโฆษณายังซื้อโฆษณาต่อ ก็ไม่มีแรงจูงใจมากนักที่จะสนใจปัญหานี้
อยากให้เปิดเผยสคริปต์จัง จะได้ตรวจสอบว่าเมธอดถูกต้องไหม หรือเผลอเอาผู้ใช้ปกติที่ใช้ ad blocker หรือปิด JS ไปนับเป็นบอทหรือเปล่า 73% ก็ไม่ได้น่าตกใจสำหรับฉันนัก จริงๆ คาดว่าน่าจะมากกว่านั้นด้วยซ้ำ จุดที่น่าประทับใจคือเวลาไปคุยกับทีมขายของแพลตฟอร์มโฆษณาเรื่องบอทหรือ click fraud น้ำเสียงการสนทนาจะเปลี่ยนเป็นภาษาบริษัทแข็งๆ ทันที ฉันยังจำได้ว่าพนักงานขายที่เคยสนิทกันคนหนึ่งยอมพูดนอกบันทึกว่า "พวกเรารู้กันหมดแหละ รู้ทุกคน แต่ถ้ากรองออกจริงๆ หมด รายได้จะหายไป 40% ในวันเดียว แล้วนักลงทุนจะเดือดกันหมด"
ถ้าทีมการตลาดถูกวาง incentive โดยยึด vanity metrics เป็นหลัก พวกเขาก็จะมองปัญหา conversion เป็นแค่เรื่องปลาย funnel เท่านั้น แม้แต่สตาร์ตอัปสาย venture เองก็มีแรงจูงใจชัดเจนที่จะปล่อยบอทสมัครสมาชิกไว้ เพื่อเอาตัวเลขพองๆ ไปโชว์นักลงทุน
พอได้ยินคำยืนยันว่า "ถ้ากรองจริง รายได้หาย 40%" ก็ชวนให้คิดว่านี่น่าจะเข้าข่ายฟ้องแบบ class action ได้ไหม
ตอนทำงานในทีมปฏิบัติการโฆษณาของ Lycos ช่วงต้นยุค 2000 ฉันก็เห็นผลตรวจสอบภายในแล้วว่าบอทมีสัดส่วน 25~75% อยู่แล้ว ตอนนั้นก็พยายามหยุดแต่ไม่สำเร็จ และจนถึงตอนนี้ก็ยังเหมือนเดิม โฆษณาออนไลน์ส่วนใหญ่คือการเผาเงิน มันดูเหมือนสร้างกิจกรรมทางเศรษฐกิจ แต่จริงๆ คือการสูญเสียเวลาและทรัพยากร
เนื่องจากบทความไม่ได้พูดถึงมาตรการป้องกันบอทแบบเจาะจง เลยขอเสริมว่าถ้าเพิ่มการป้องกันบอทให้เข้มขึ้น (เช่น CAPTCHA) ผู้ใช้จริงจะหลุดออกไปมากขึ้นอย่างมาก และส่งผลเสียรุนแรงต่อ conversion rate ยิ่งบอทเหมือนมนุษย์มากขึ้นเท่าไร ฉันก็ยิ่งคิดว่าปัญหานี้ต้องแก้ในขั้นตอน analytics และ attribution ไม่ใช่แก้ด้วยการทำลาย usability
ด้านล่างนี้เป็นกรณีจริงที่ฉันเจอ
แต่สิ่งที่ฉันสงสัยคือ แล้วการกรองบอทแบบนี้ทำให้ค่าใช้จ่ายโฆษณาลดลงโดยตรงได้อย่างไร เช่น บอก Google Ads ได้ตรงๆ ไหมว่า "คลิกแบบนี้ฉันไม่อยากจ่าย" หรือว่าเป็นการปรับ targeting เองเพื่อหลบบอท?
พอปิดกั้นบอททราฟฟิกได้ ก็พอจะนึกภาพได้ว่า retargeting จะถูกใช้กับคนจริงได้แม่นขึ้นและทำให้ conversion เพิ่มขึ้น
น่าจะเป็นกรณีที่ถ้าระบุได้ว่า "นี่คือบอท" ก็ไม่แสดงโฆษณาให้เลยมากกว่า
ถ้ามีบอทปนอยู่ตอนสร้าง Lookalike หรือรีมาร์เก็ตติ้งออดิเอนซ์ ก็อาจส่งสัญญาณผิดๆ ให้แพลตฟอร์มอย่าง Facebook ได้ และใน Google Ads คุณไม่สามารถบอกได้ว่าไม่อยากจ่ายสำหรับบางคลิกโดยเฉพาะ
ก่อนหน้านี้ฉันเคยเห็นบทความที่ยกตัวอย่างคล้ายกัน โดยอ้างว่า "ตลาดโฆษณาเว็บแทบทั้งหมดจริงๆ แล้วเป็นของปลอม/ฉ้อโกง/บอท และทุกบริษัท ทุกอุตสาหกรรมก็ช่วยกันทำเป็นมองไม่เห็นเพื่อคงระบบนี้ไว้" งานอาชีพมากมาย บริษัทมากมาย และทั้งอุตสาหกรรมพึ่งพาการไม่ยอมรับความจริงข้อนั้น