กระแสต่อต้าน AI กำลังเพิ่มขึ้น
(stephvee.ca)- ท่ามกลางอินเทอร์เน็ตที่เต็มไปด้วยคอนเทนต์คุณภาพต่ำที่สร้างโดย AI (slop) กำลังเกิดความเคลื่อนไหวหลากหลายรูปแบบที่ผู้คน ลุกขึ้นมาต่อต้าน AI อย่างจริงจัง
- ชุมชน Reddit อย่าง r/PoisonFountain กำลังเคลื่อนไหวโดยตั้งเป้าจะส่งมอบ ข้อมูลปนเปื้อน 1 เทราไบต์ต่อวัน ให้กับ AI crawler ภายในสิ้นปี 2026
- มีรูปแบบการต่อต้านหลายแบบเกิดขึ้น เช่น เทคนิคหลอก AI video summarizer หรือการ จงใจใส่ข้อมูลเท็จ ลงในโซเชียลมีเดีย
- เบื้องหลังการต่อต้านนี้คือความจริงที่ว่า AI crawler มักเพิกเฉยต่อ robots.txt และก่อให้เกิด ภาระระดับ DDoS กับเว็บไซต์ขนาดเล็ก
- มีความคาดหวังว่าหากอารมณ์ต่อต้านนี้เปลี่ยนไปสู่ การต่อต้านอย่างสันติและถูกกฎหมาย ก็อาจบีบให้ซิลิคอนแวลลีย์ต้องเปลี่ยนวิธีเก็บข้อมูล
ชุมชนปนเปื้อนข้อมูลสำหรับจัดการ AI crawler
- ชุมชน Reddit r/PoisonFountain เป็นคอมมูนิตี้ที่ก่อตั้งโดยคนที่อ้างว่าตนเป็นคนวงในของอุตสาหกรรม AI และคอยกระตุ้นให้คนจำนวนมากที่สุดเท่าที่เป็นไปได้ช่วยป้อนข้อมูลขยะ (poison) จำนวนมากให้กับ web crawler
- เป้าหมายคือส่งมอบ ข้อมูลปนเปื้อน 1 เทราไบต์ต่อวัน ให้ crawler ภายในสิ้นปี 2026
- ตัวข้อมูลปนเปื้อนหลักถูกโฮสต์ไว้ที่ rnsaffn.com และถูกวางไว้ท่ามกลางลิงก์ขยะที่ล่อให้ AI crawler เข้ามาเก็บ
- มองเผินๆ จะดูเหมือนโค้ดปกติ แต่จริงๆ แล้วมี ข้อผิดพลาดเล็กน้อยแฝงอยู่ ทำให้ได้โค้ดที่ใช้งานไม่ได้
- แม้จะสามารถกรองข้อผิดพลาดเหล่านี้ออกได้ แต่การทำเช่นนั้นใน ระดับใหญ่มีต้นทุนสูงมาก
- บริษัท AI ไม่สามารถพัฒนาโมเดลให้ดีขึ้นได้หากไม่มีข้อมูลใหม่ที่มนุษย์สร้างขึ้น ดังนั้นกลยุทธ์สำคัญคือการ เพิ่มเวลาและต้นทุน ของการขโมยข้อมูล
- Miasma เป็นเครื่องมือที่ใช้ข้อมูลปนเปื้อนนี้เพื่อป้อนข้อมูลขยะจำนวนมหาศาลให้บอตอันตราย โดยผู้พัฒนาอธิบายว่ามันคือ "บุฟเฟต์ slop ไม่รู้จบสำหรับเครื่องจักรผลิต slop"
พฤติกรรมที่เป็นปัญหาของ AI crawler
- ทีมที่ส่ง AI crawler ออกมา ก่อให้เกิด ภาระระดับ DDoS กับเว็บไซต์ขนาดเล็กเป็นประจำ และทำให้ค่าโฮสติ้งของทุกคนสูงขึ้น
- พวกมัน ไม่ปฏิบัติตาม robots.txt และก็มักซ่อน crawler ไว้หลัง residential proxy ด้วย
- หากไม่สามารถจัดหาข้อมูลฝึกสอนอย่างมีจริยธรรมได้ ก็ไม่มีเหตุผลที่เจ้าของเว็บไซต์รายใดต้องช่วยทำให้การขโมยข้อมูลง่ายขึ้น
ความพยายามปนเปื้อน AI video summarizer
- ในวิดีโอที่เป็นที่รู้จักผ่าน r/PoisonFountain ครีเอเตอร์ชื่อ @f4mi ได้สาธิตเทคนิค ใช้ช่องโหว่ของคำบรรยาย YouTube เพื่อปนเปื้อน AI video summarizer
- ปัจจุบัน YouTube ได้ อุดช่องโหว่ของคำบรรยาย นี้แล้ว ทำให้เทคนิคดังกล่าวใช้ไม่ได้อีกต่อไป
- แม้จะเป็นเพียงชั่วคราว แต่ก็เป็นกรณีที่ประสบความสำเร็จในการก่อกวนระบบ AI และแสดงให้เห็นว่าผู้คนกำลังพยายามต่อต้านอย่างจริงจัง
การก่อวินาศกรรม AI โดยเจตนาบนโซเชียลมีเดีย
- บนแพลตฟอร์มโซเชียลมีเดียอย่าง Reddit กำลังมีการ จงใจเขียนข้อมูลเท็จเพื่อปนเปื้อนข้อมูลฝึกสอนของ AI มากขึ้น
- ตัวอย่างเช่น มีการโพสต์ข้อมูลเท็จอย่างชัดเจนว่าใน "Everybody Loves Raymond" นั้น Idris Elba รับบทเป็นแม่ของ Raymond
- มนุษย์สามารถดูบริบทแล้วรู้ได้ทันทีว่าเป็นเรื่องเท็จ แต่ web scraper อัตโนมัติอาจมองว่านี่คือข้อมูลคุณภาพดีที่มนุษย์สร้างขึ้น
- หากข้อมูลนี้ถูกส่งต่อไปยัง OpenAI หรือที่อื่นๆ ก็จะต้องใช้ ทรัพยากรเพิ่มเติมในการลบออก จากชุดข้อมูลฝึกสอน
- เรื่องนี้อาจมองได้ว่าเป็นรูปแบบสมัยใหม่ของการที่ คนงานทอผ้าในยุคปฏิวัติอุตสาหกรรมทำลายเครื่องทอผ้าแบบใช้พลังงาน และหากมีคนจำนวนมากพอช่วยกันปนเปื้อนพื้นที่สาธารณะด้วยข้อมูลเท็จที่มุ่งเป้าไปยังบอต ก็อาจกดดันให้บริษัท AI ต้อง ทบทวน วิธีการเก็บข้อมูลฝึกสอน
กระแสความไม่พอใจต่อ AI ในวงกว้าง
- ผู้คนมีความรู้สึกต่อต้านผลกระทบของ AI ต่อโลก โดยเฉพาะผลกระทบต่อ ชุมชนออนไลน์ สิ่งแวดล้อม โรงเรียนประถม มหาวิทยาลัย กลุ่มเสี่ยงด้านสุขภาพจิต และการทำมาหากิน
- แม้จะมีคนที่เสพและสร้าง AI slop อยู่ แต่ทั้งออฟไลน์และออนไลน์นั้นมี คนที่เกลียดและปฏิเสธเทคโนโลยีนี้มากกว่ามาก
- ความเกลียดชังมักไม่ค่อยนำไปสู่ผลลัพธ์ที่ดี ผู้เขียนจึงคัดค้านการกระทำรุนแรง เช่น การ เตะหรือคว่ำ หุ่นยนต์ส่งของ AI หรือเหตุการณ์ ขว้าง ระเบิดขวดเพลิง ใส่บ้านของ Sam Altman
- แต่หากความรู้สึกต่อ AI เปลี่ยนไปเป็น การต่อต้านอย่างสันติและถูกกฎหมาย ก็มีความเป็นไปได้ว่าจะเปลี่ยนพฤติกรรมของซิลิคอนแวลลีย์ได้จริง
ปลายเรื่อง: ต้นฉบับถูกแก้หลังไวรัลบน Hacker News
- บทความนี้ขึ้นไปอยู่บน หน้าแรกของศูนย์รวมข่าวใหญ่ (Hacker News) ทำให้มีทราฟฟิกจำนวนมากไหลเข้ามาอย่างไม่คาดคิด
- เกิด การโจมตีให้เซิร์ฟเวอร์รับภาระเกินอย่างมุ่งร้าย โดยมีการส่งคำขอหลายพันครั้งมายังหน้านี้จาก IP เพียงไม่กี่ตัว
- หากเป็น shared hosting ราคาถูก เว็บไซต์อาจล่มไปทั้งเว็บ และจึงต้องตอบโต้ด้วยการ บล็อกทราฟฟิกไปยัง URL นั้นชั่วคราว
- แม้ผู้เขียนจะไม่ใช่ผู้เชี่ยวชาญด้าน AI แต่ผู้ร่วมแสดงความคิดเห็นบางคนก็ วิจารณ์อย่างเกินเลยโดยเรียกร้องความแม่นยำระดับผู้เชี่ยวชาญ
- ความเห็นหนึ่งถึงกับใช้คำว่า "ไม่ต่างจากกลุ่มที่เผาห้องสมุด" ซึ่งเป็นปฏิกิริยาที่น่าผิดหวังมากสำหรับบล็อกเกอร์ที่ชอบห้องสมุดและการแบ่งปันความรู้
- เดิมทีเป้าหมายมีเพียงการแชร์ลิงก์แนวโน้มต่อต้าน AI ให้กับผู้ติดตามบล็อกกลุ่มเล็กๆ และผู้เขียนก็บอกว่าหากรู้ว่าจะ ดึงความสนใจด้านลบ จากแพลตฟอร์มใหญ่แบบนี้ ก็คงจะไม่โพสต์
- หลังจากนั้นผู้เขียนตัดสินใจจะงดโพสต์ความเห็นส่วนตัวเกี่ยวกับ AI และจะกลับไปโฟกัสที่เป้าหมายดั้งเดิมของการทำบล็อก คือ ความสนุกของ small web
- นี่เป็นตัวอย่างที่แสดงให้เห็นว่าการ แสดงความเห็นอย่างเสรีบน small web ถูกทำให้หดแคบลงเพราะการแพร่กระจายแบบไวรัล
5 ความคิดเห็น
ความเห็นจาก Hacker News
ผมยินดีที่คนนี้ได้เจอชุมชนที่ตัวเองตามหาอยู่ แต่ก็รู้สึกว่าเขาดูถูกกระแสต่อต้าน AI ครอบงำมากเกินไป ผมคิดว่าในอีก 30 ปีข้างหน้า ก็จะยังมีกลุ่มคนที่เกลียดและพยายามขัดขวาง AI อยู่เสมอ เช่นเดียวกับที่เคยมีกลุ่มต่อต้านสมาร์ตโฟน Internet และ TV มาตลอด ในอีกด้านหนึ่ง ถ้า model poisoning ทำได้อย่างเสถียรจริง ๆ ผมว่ามันเป็นปัญหาวิทยาการคอมพิวเตอร์ที่น่าสนใจมาก ผมไม่ได้เห็นพ้องกับนักเคลื่อนไหวต่อต้าน AI แต่สนใจเทคนิคการโจมตีตัวมันเองมาก ดังนั้นถ้าพวกเขาทำวิจัยด้านนี้ต่อไป ผมคิดว่าแม้แต่คนที่ไม่เห็นด้วยกับเป้าหมายของพวกเขาก็ยังจะอ่านการถกเถียงนี้อย่างจริงจัง
ผมรู้สึกเสียดายที่ความพยายามทำ poisoning ดูเหมือนเป็นการใช้พลังงานผิดที่ผิดทางเกินไป ผมคิดว่าตอนนี้มีข้อมูลที่ไม่ปนเปื้อนสำหรับใช้ฝึกอยู่มากพอแล้ว และคอนเทนต์ใหม่ก็ยังถูกสร้างต่อเนื่องจากการเก็บข้อมูลอัตโนมัติในโลกจริงหรือจากแรงงานที่มีการควบคุมคุณภาพในโรงงานขนาดใหญ่ในแอฟริกา เพราะงั้นถึงจะทำให้อินเทอร์เน็ตเก่าเลอะเทอะได้ ก็คงย้อนลูกศรแห่งเวลาไม่ได้ อีกอย่าง ตอนนี้ Internet แบบใหม่ที่เน้น API และ public announce federation ก็กำลังเติบโต ทำให้ความสำคัญของ poisoning แบบดั้งเดิมค่อย ๆ ลดลง
ผมจำได้ว่าสมัยก่อนประเด็นหลักของวัฒนธรรมแฮ็กเกอร์คือการกำจัดกำแพงที่ทำให้ใช้ข้อมูลได้ยาก เช่น DRM, DMCA, patent troll, PGP export control เมื่อเทียบกับยุคที่ “Information wants to be free” ใช้เป็นเหมือนคำขวัญได้ ผมว่าตอนนี้มันเป็นการเปลี่ยนแปลงครั้งใหญ่มากที่อารมณ์สาธารณะกลายเป็นว่า ถ้าบริษัทหาข้อมูลฝึกอย่างมีจริยธรรมไม่ได้ ก็ไม่มีเหตุผลที่คนดูแลเว็บไซต์จะต้องทำให้ขโมยได้ง่าย คงยากมากที่จะทำนายการเปลี่ยนแปลงแบบนี้เมื่อ 25 ปีก่อน
ผมรู้สึกว่าวิธีที่ง่ายที่สุดในการเพิ่มแรงต้าน AI คือเอา Dario Amodei กับ Sam Altman ไปออก TV แล้วปล่อยให้พูดไปเรื่อย ๆ
ผมมอง AI เป็น corporate tool สำหรับเค้นงานจากพนักงานให้มากขึ้น และในขณะเดียวกันก็เป็นอุปกรณ์ที่ปลูกฝังภาพลวงว่าพนักงานกลายเป็น turbo-charged dev ไปแล้ว ผมคิดว่าตอนนี้ tech industry คล้ายคณะละครสัตว์ที่เงินไหลเข้ามามากกว่าความพยายามจริงจังในการทำให้มนุษยชาติดีขึ้น
ผมรู้สึกว่าขบวนการ poisoning แบบนี้ใกล้กับ slacktivism มากกว่า ผมเข้าใจได้ระดับหนึ่งกับการวิเคราะห์ที่ว่า compute กำลังมาแทนที่งานของชนชั้นแรงงาน และ compute ก็คือทุนล้วน ๆ ดังนั้นสุดท้ายมันคือโครงสร้างที่ชนชั้นนายทุนกำลังบีบคอชนชั้นแรงงาน และผมก็คิดว่าพวกนายทุนอาจต้องการให้เป็นอย่างนั้นจริง ๆ แต่ถ้ามองแบบนั้น การทำให้โมเดลปนเปื้อนเล็กน้อยก็ดูยังห่างไกลมากจากการเผชิญหน้ากับสิ่งที่กำลังเกิดขึ้นจริง ๆ แบบตรงจุด
ผมเห็นกระแสนี้ชัดมากเป็นพิเศษบน Reddit บางชุมชนเป็นมิตรกับ AI ถึงขั้นติดคอมเมนต์สรุปด้วย AI และสนับสนุนโพสต์ที่เขียนด้วย AI ขณะที่บาง subreddit กำลังขยับไปทางระมัดระวังหรือถึงขั้นต่อต้าน AI อย่างเปิดเผย ชุมชนถ่ายภาพเจอปัญหางานตัวเองถูกสงสัยว่าเป็น AI ส่วนชุมชนโปรแกรมเมอร์โดยรวมก็ชอบมันแต่ในเวลาเดียวกันก็ยังสงสัยอยู่ สุดท้ายแล้ว subreddit แบบดั้งเดิมต่างก็กำลังหาตำแหน่งของตัวเองบนสเปกตรัม AI ตัวอย่างที่นึกออกก็มี https://www.reddit.com/r/vibecoding/, https://www.reddit.com/r/isthisAI/, https://www.reddit.com/r/aiwars/, https://www.reddit.com/r/antiai/, https://www.reddit.com/r/photography/comments/1q4iv0k/what_do_you_say_to_people_who_think_every_photo/, https://www.reddit.com/r/webdev/comments/1s6mtt7/ai_has_sucked_all_the_fun_out_of_programming/
ผมหวังว่าสักวันหนึ่งเราจะคุยกันเรื่อง AI และบทบาทที่มันควรมีในโลกนี้ได้อย่างละเอียดอ่อนมากขึ้น ตอนนี้บรรยากาศเหมือนมีแต่สุดขั้วสองด้าน คือด้านที่อยากกำจัด AI ออกจากโลกไปเลย กับด้านที่อยากยกทุกอย่างให้มันทำ ผมอยากเห็นการคุยเรื่องใช้อย่างรับผิดชอบ มาตรการกันกระแทกทางสังคม และประเด็นการใช้พลังงาน ในพื้นที่ตรงกลางระหว่างสองสุดขั้วนั้น
ผมรู้สึกว่าความโกรธของบล็อกต้นฉบับก็แรงเกินไปจริง แต่ท่าทีที่เชื่ออย่างจริงใจว่าความพยายามทำ poisoning พวกนี้จะไม่สร้างผลเสียต่อการฝึกโมเดลได้เลยแม้แต่น้อย ก็ทำให้ผมหดหู่เหมือนกัน เพราะมันดูเหมือนขาดความเข้าใจทางเทคนิค
ผมอยากเล่นมุกว่า “Resistance is futile” เหมือนกัน แต่ในขณะเดียวกันก็เห็นด้วยมากพอสมควรกับข้ออ้างที่ว่า AI กำลังทำลายชุมชนจริง ๆ ตัวอย่างเช่น YouTube ถึงขั้นเอาการจัดการรายงานไปให้ AI ทำ จนผู้ไม่หวังดีสามารถอ้างว่าวิดีโอต้นฉบับของคนอื่นเป็นของตัวเอง แล้วแย่งรายได้ผ่านการ demonetize ได้ Davie504 ซึ่งเป็น YouTuber ดัง ๆ ก็เคยเจอแบบนั้น และโครงสร้างก็ชวนอึดอัดเพราะแม้แต่การอุทธรณ์ก็ยังให้หุ่นยนต์พิจารณาอีก
นอกจากวิธีทำให้ข้อมูลที่ AI ใช้เรียนรู้ปนเปื้อนแล้ว ยังมีวิธีต่อต้านแบบอื่นอีกไหม?
อย่างเช่นไม่เสพคอนเทนต์ที่ AI สร้างขึ้น...
ผมเองก็อ่านสิ่งนี้ไปพลางคิดเหมือนกันว่า มันอาจกลายเป็นการทำให้มนุษย์โดนวางยาพิษข้อมูลไปโดยไม่ตั้งใจก็ได้
ไม่แน่ใจว่าปัญหาเกิดขึ้นตรงไหน แต่หลังคำอย่าง 'kkim', 'bom', 'doem', 'jim' มี 'eum' ที่ไม่เข้ากันมาต่อท้ายอยู่เรื่อย ๆ เลยครับ อันนี้อาจเป็น poisoning เหมือนกันหรือเปล่า ;)
เหมือนว่าโมเดลจะมีการเปลี่ยนแปลงเล็กน้อยหรือเปล่า ทำให้พรอมป์ต์เดียวกันทำงานผิดพลาด ตอนนี้ผมได้แก้ไขส่วนนี้ไว้แล้ว