การต่อต้าน AI กำลังเพิ่มมากขึ้น
(stephvee.ca)- ขณะที่อินเทอร์เน็ตกำลังล้นไปด้วยคอนเทนต์คุณภาพต่ำที่สร้างโดย AI (slop) ก็เกิดความเคลื่อนไหวหลากหลายรูปแบบที่ผู้คน ลุกขึ้นต่อต้าน AI อย่างจริงจัง มากขึ้น
- คอมมูนิตี้ Reddit ชื่อ r/PoisonFountain กำลังเคลื่อนไหวโดยตั้งเป้าจะป้อน ข้อมูลปนเปื้อน 1 เทราไบต์ต่อวัน ให้กับ AI crawler ภายในปลายปี 2026
- มีการต่อต้านหลายรูปแบบเกิดขึ้น ทั้งเทคนิคหลอก AI video summarizer และ การใส่ข้อมูลเท็จโดยเจตนา บนโซเชียลมีเดีย
- เบื้องหลังของการต่อต้านนี้คือความจริงที่ว่า AI crawler มักเพิกเฉยต่อ robots.txt และสร้าง ภาระระดับ DDoS ให้กับเว็บไซต์ขนาดเล็ก
- มีความคาดหวังว่าหากความรู้สึกนี้นำไปสู่ การต่อต้านอย่างสันติและถูกกฎหมาย ก็อาจเปลี่ยนวิธีเก็บข้อมูลของซิลิคอนแวลลีย์ได้
คอมมูนิตี้ป้อนข้อมูลปนเปื้อนให้ AI crawler
- คอมมูนิตี้ Reddit r/PoisonFountain เป็นชุมชนที่ตั้งขึ้นโดยผู้ที่อ้างตัวว่าเป็นคนวงในอุตสาหกรรม AI และสนับสนุนให้คนจำนวนมากที่สุดเท่าที่จะทำได้ช่วยกันป้อนข้อมูลขยะ (poison) ปริมาณมากให้กับ web crawler
- เป้าหมายคือการส่ง ข้อมูลปนเปื้อน 1 เทราไบต์ต่อวัน ให้ crawler ภายในปลายปี 2026
- ตัวข้อมูลปนเปื้อนหลักถูกโฮสต์ไว้ที่ rnsaffn.com และวางแทรกอยู่ท่ามกลางลิงก์ขยะที่ชวนล่อให้ AI crawler เข้ามาเก็บ
- มองเผิน ๆ เหมือนโค้ดปกติ แต่จริง ๆ แล้วมี ข้อผิดพลาดเล็กน้อยที่แฝงอยู่ ทำให้โค้ดที่ได้ใช้งานไม่ได้
- แม้จะสามารถกรองข้อผิดพลาดเหล่านี้ออกได้ แต่หากทำใน สเกลใหญ่จะมีต้นทุนสูงมาก
- บริษัท AI ไม่สามารถพัฒนาโมเดลให้ดีขึ้นได้หากไม่มีข้อมูลใหม่ที่มนุษย์สร้างขึ้น ดังนั้นกลยุทธ์สำคัญคือการ เพิ่มเวลาและต้นทุน ของการขโมยข้อมูล
- Miasma เป็นเครื่องมือที่ใช้ข้อมูลปนเปื้อนนี้เพื่อป้อนข้อมูลขยะจำนวนมากให้บอตอันตราย โดยผู้พัฒนาอธิบายว่ามันคือ “บุฟเฟต์ slop ไม่รู้จบสำหรับเครื่องจักรผลิต slop”
พฤติกรรมที่เป็นปัญหาของ AI crawler
- ทีมที่ส่ง AI crawler ออกไปกำลังก่อให้เกิดภาระระดับ DDoS กับเว็บไซต์ขนาดเล็กเป็นประจำ และผลักให้ค่าโฮสติ้งของทุกคนสูงขึ้น
- พวกมันไม่ปฏิบัติตาม robots.txt และบ่อยครั้งก็ซ่อน crawler ไว้หลัง residential proxy
- หากไม่สามารถจัดหาข้อมูลฝึกอย่างมีจริยธรรมได้ ก็ไม่มีเหตุผลที่ผู้ดูแลเว็บไซต์จะต้องทำให้การขโมยข้อมูลง่ายขึ้น
ความพยายามปนเปื้อน AI video summarizer
- ในวิดีโอที่ถูกพูดถึงผ่าน r/PoisonFountain ครีเอเตอร์ชื่อ @f4mi ได้สาธิตเทคนิค ปนเปื้อน AI video summarizer โดยใช้ช่องโหว่ของคำบรรยาย YouTube
- ปัจจุบัน YouTube ได้ อุดช่องโหว่ของคำบรรยายนั้นแล้ว ทำให้เทคนิคนี้ใช้ไม่ได้อีกต่อไป
- แม้จะเป็นเพียงช่วงเวลาสั้น ๆ แต่ก็เป็นกรณีที่รบกวนระบบ AI ได้สำเร็จ และแสดงให้เห็นว่าผู้คนกำลังพยายามต่อต้านอย่างจริงจัง
การก่อกวน AI โดยเจตนาบนโซเชียลมีเดีย
- บนแพลตฟอร์มโซเชียลมีเดียอย่าง Reddit กำลังมีการเพิ่มขึ้นของการ เขียนข้อมูลเท็จโดยเจตนาเพื่อปนเปื้อนข้อมูลฝึก AI
- ตัวอย่างเช่น การโพสต์ข้อมูลเท็จอย่างชัดเจนว่าใน “Everybody Loves Raymond” นั้น Idris Elba รับบทเป็นแม่ของ Raymond
- มนุษย์สามารถมองจากบริบทแล้วรู้ได้ทันทีว่าเป็นข้อมูลเท็จ แต่ web scraper อัตโนมัติอาจมองว่านี่คือข้อมูลคุณภาพดีที่มนุษย์สร้างขึ้น
- หากข้อมูลนี้ถูกส่งต่อไปยัง OpenAI หรือที่อื่น ๆ ก็จะต้องใช้ ทรัพยากรเพิ่มเติมเพื่อลบมันออก จากชุดข้อมูลฝึก
- สิ่งนี้อาจมองได้ว่าเป็นรูปแบบร่วมสมัยของการที่ แรงงานทอผ้าในยุคปฏิวัติอุตสาหกรรมทำลายเครื่องทอพลังงาน และหากมีคนจำนวนมากพอช่วยกันทำให้พื้นที่สาธารณะปนเปื้อนด้วยข้อมูลเท็จสำหรับบอต ก็อาจกดดันให้บริษัท AI ทบทวนวิธีเก็บข้อมูลฝึก ของตนได้
ความไม่พอใจต่อ AI ในวงกว้าง
- ผู้คนมีความรู้สึกต่อต้านผลกระทบของ AI ต่อโลก โดยเฉพาะผลกระทบต่อ คอมมูนิตี้ออนไลน์ สิ่งแวดล้อม โรงเรียนประถมและมหาวิทยาลัย กลุ่มเสี่ยงด้านสุขภาพจิต และการทำมาหากิน
- แม้จะมีคนที่ทั้งเสพและสร้าง AI slop อยู่ แต่ทั้งในโลกออนไลน์และออฟไลน์ยังมี คนที่เกลียดและปฏิเสธเทคโนโลยีนี้มากกว่ามาก
- โดยทั่วไปความเกลียดชังมักไม่ค่อยนำไปสู่ผลลัพธ์ที่ดี และผู้เขียนคัดค้านการใช้ความรุนแรง เช่น การเตะหรือคว่ำหุ่นยนต์ส่งของของ AI หรือเหตุการณ์ขว้างระเบิดเพลิงใส่บ้านของ Sam Altman
- แต่หากความรู้สึกที่มีต่อ AI เปลี่ยนไปเป็น การต่อต้านอย่างสันติและถูกกฎหมาย ก็อาจมีโอกาสเปลี่ยนพฤติกรรมของซิลิคอนแวลลีย์ได้จริง
ภายหลัง: ต้นฉบับถูกแก้หลังไวรัลบน Hacker News
- บทความนี้ขึ้นไปอยู่บน หน้าแรกของศูนย์รวมข่าวขนาดใหญ่ (Hacker News) ทำให้มีทราฟฟิกจำนวนมากไหลเข้ามาอย่างไม่คาดคิด
- เกิด การโจมตีทำให้เซิร์ฟเวอร์รับภาระเกินโดยมุ่งร้าย จาก IP จำนวนน้อยที่ส่งคำขอมายังหน้านี้หลายพันครั้ง
- หากเป็น shared hosting ราคาถูก เว็บไซต์อาจล่มไปทั้งเว็บ และผู้เขียนจึงต้อง บล็อกทราฟฟิกของ URL นี้ชั่วคราว เพื่อรับมือ
- แม้ผู้เขียนจะไม่ใช่ผู้เชี่ยวชาญด้าน AI แต่ผู้ร่วมแสดงความเห็นบางคนก็ เรียกร้องความแม่นยำระดับผู้เชี่ยวชาญ พร้อมวิจารณ์อย่างเกินเลย
- ความเห็นหนึ่งถึงกับใช้คำว่า “ไม่ต่างจากพวกเผาห้องสมุด” ซึ่งเป็นปฏิกิริยาที่น่าผิดหวังเป็นพิเศษสำหรับบล็อกเกอร์ที่ชอบห้องสมุดและการแบ่งปันความรู้
- เดิมทีจุดประสงค์ก็แค่แชร์ลิงก์แนวโน้มต่อต้าน AI ให้ผู้ติดตามบล็อกขนาดเล็กอ่าน และหากรู้ว่าจะ ดึงดูดความสนใจด้านลบ จากแพลตฟอร์มใหญ่ขนาดนี้ ก็คงไม่โพสต์
- หลังจากนั้นผู้เขียนตัดสินใจจะงดโพสต์ความเห็นส่วนตัวเกี่ยวกับ AI และจะกลับไปโฟกัสกับเป้าหมายดั้งเดิมของการทำบล็อก คือ ความสนุกของ small web
- นี่เป็นกรณีที่แสดงให้เห็นว่าการ แสดงความเห็นอย่างอิสระบน small web ถูกทำให้หดตัวลงเพราะการแพร่กระจายแบบไวรัล
5 ความคิดเห็น
ความเห็นจาก Hacker News
ผมยินดีที่คนนี้ได้เจอชุมชนที่ตัวเองตามหาอยู่ แต่ก็รู้สึกว่าเขาดูถูกกระแสต่อต้าน AI ครอบงำมากเกินไป ผมคิดว่าในอีก 30 ปีข้างหน้า ก็จะยังมีกลุ่มคนที่เกลียดและพยายามขัดขวาง AI อยู่เสมอ เช่นเดียวกับที่เคยมีกลุ่มต่อต้านสมาร์ตโฟน Internet และ TV มาตลอด ในอีกด้านหนึ่ง ถ้า model poisoning ทำได้อย่างเสถียรจริง ๆ ผมว่ามันเป็นปัญหาวิทยาการคอมพิวเตอร์ที่น่าสนใจมาก ผมไม่ได้เห็นพ้องกับนักเคลื่อนไหวต่อต้าน AI แต่สนใจเทคนิคการโจมตีตัวมันเองมาก ดังนั้นถ้าพวกเขาทำวิจัยด้านนี้ต่อไป ผมคิดว่าแม้แต่คนที่ไม่เห็นด้วยกับเป้าหมายของพวกเขาก็ยังจะอ่านการถกเถียงนี้อย่างจริงจัง
ผมรู้สึกเสียดายที่ความพยายามทำ poisoning ดูเหมือนเป็นการใช้พลังงานผิดที่ผิดทางเกินไป ผมคิดว่าตอนนี้มีข้อมูลที่ไม่ปนเปื้อนสำหรับใช้ฝึกอยู่มากพอแล้ว และคอนเทนต์ใหม่ก็ยังถูกสร้างต่อเนื่องจากการเก็บข้อมูลอัตโนมัติในโลกจริงหรือจากแรงงานที่มีการควบคุมคุณภาพในโรงงานขนาดใหญ่ในแอฟริกา เพราะงั้นถึงจะทำให้อินเทอร์เน็ตเก่าเลอะเทอะได้ ก็คงย้อนลูกศรแห่งเวลาไม่ได้ อีกอย่าง ตอนนี้ Internet แบบใหม่ที่เน้น API และ public announce federation ก็กำลังเติบโต ทำให้ความสำคัญของ poisoning แบบดั้งเดิมค่อย ๆ ลดลง
ผมจำได้ว่าสมัยก่อนประเด็นหลักของวัฒนธรรมแฮ็กเกอร์คือการกำจัดกำแพงที่ทำให้ใช้ข้อมูลได้ยาก เช่น DRM, DMCA, patent troll, PGP export control เมื่อเทียบกับยุคที่ “Information wants to be free” ใช้เป็นเหมือนคำขวัญได้ ผมว่าตอนนี้มันเป็นการเปลี่ยนแปลงครั้งใหญ่มากที่อารมณ์สาธารณะกลายเป็นว่า ถ้าบริษัทหาข้อมูลฝึกอย่างมีจริยธรรมไม่ได้ ก็ไม่มีเหตุผลที่คนดูแลเว็บไซต์จะต้องทำให้ขโมยได้ง่าย คงยากมากที่จะทำนายการเปลี่ยนแปลงแบบนี้เมื่อ 25 ปีก่อน
ผมรู้สึกว่าวิธีที่ง่ายที่สุดในการเพิ่มแรงต้าน AI คือเอา Dario Amodei กับ Sam Altman ไปออก TV แล้วปล่อยให้พูดไปเรื่อย ๆ
ผมมอง AI เป็น corporate tool สำหรับเค้นงานจากพนักงานให้มากขึ้น และในขณะเดียวกันก็เป็นอุปกรณ์ที่ปลูกฝังภาพลวงว่าพนักงานกลายเป็น turbo-charged dev ไปแล้ว ผมคิดว่าตอนนี้ tech industry คล้ายคณะละครสัตว์ที่เงินไหลเข้ามามากกว่าความพยายามจริงจังในการทำให้มนุษยชาติดีขึ้น
ผมรู้สึกว่าขบวนการ poisoning แบบนี้ใกล้กับ slacktivism มากกว่า ผมเข้าใจได้ระดับหนึ่งกับการวิเคราะห์ที่ว่า compute กำลังมาแทนที่งานของชนชั้นแรงงาน และ compute ก็คือทุนล้วน ๆ ดังนั้นสุดท้ายมันคือโครงสร้างที่ชนชั้นนายทุนกำลังบีบคอชนชั้นแรงงาน และผมก็คิดว่าพวกนายทุนอาจต้องการให้เป็นอย่างนั้นจริง ๆ แต่ถ้ามองแบบนั้น การทำให้โมเดลปนเปื้อนเล็กน้อยก็ดูยังห่างไกลมากจากการเผชิญหน้ากับสิ่งที่กำลังเกิดขึ้นจริง ๆ แบบตรงจุด
ผมเห็นกระแสนี้ชัดมากเป็นพิเศษบน Reddit บางชุมชนเป็นมิตรกับ AI ถึงขั้นติดคอมเมนต์สรุปด้วย AI และสนับสนุนโพสต์ที่เขียนด้วย AI ขณะที่บาง subreddit กำลังขยับไปทางระมัดระวังหรือถึงขั้นต่อต้าน AI อย่างเปิดเผย ชุมชนถ่ายภาพเจอปัญหางานตัวเองถูกสงสัยว่าเป็น AI ส่วนชุมชนโปรแกรมเมอร์โดยรวมก็ชอบมันแต่ในเวลาเดียวกันก็ยังสงสัยอยู่ สุดท้ายแล้ว subreddit แบบดั้งเดิมต่างก็กำลังหาตำแหน่งของตัวเองบนสเปกตรัม AI ตัวอย่างที่นึกออกก็มี https://www.reddit.com/r/vibecoding/, https://www.reddit.com/r/isthisAI/, https://www.reddit.com/r/aiwars/, https://www.reddit.com/r/antiai/, https://www.reddit.com/r/photography/comments/1q4iv0k/what_do_you_say_to_people_who_think_every_photo/, https://www.reddit.com/r/webdev/comments/1s6mtt7/ai_has_sucked_all_the_fun_out_of_programming/
ผมหวังว่าสักวันหนึ่งเราจะคุยกันเรื่อง AI และบทบาทที่มันควรมีในโลกนี้ได้อย่างละเอียดอ่อนมากขึ้น ตอนนี้บรรยากาศเหมือนมีแต่สุดขั้วสองด้าน คือด้านที่อยากกำจัด AI ออกจากโลกไปเลย กับด้านที่อยากยกทุกอย่างให้มันทำ ผมอยากเห็นการคุยเรื่องใช้อย่างรับผิดชอบ มาตรการกันกระแทกทางสังคม และประเด็นการใช้พลังงาน ในพื้นที่ตรงกลางระหว่างสองสุดขั้วนั้น
ผมรู้สึกว่าความโกรธของบล็อกต้นฉบับก็แรงเกินไปจริง แต่ท่าทีที่เชื่ออย่างจริงใจว่าความพยายามทำ poisoning พวกนี้จะไม่สร้างผลเสียต่อการฝึกโมเดลได้เลยแม้แต่น้อย ก็ทำให้ผมหดหู่เหมือนกัน เพราะมันดูเหมือนขาดความเข้าใจทางเทคนิค
ผมอยากเล่นมุกว่า “Resistance is futile” เหมือนกัน แต่ในขณะเดียวกันก็เห็นด้วยมากพอสมควรกับข้ออ้างที่ว่า AI กำลังทำลายชุมชนจริง ๆ ตัวอย่างเช่น YouTube ถึงขั้นเอาการจัดการรายงานไปให้ AI ทำ จนผู้ไม่หวังดีสามารถอ้างว่าวิดีโอต้นฉบับของคนอื่นเป็นของตัวเอง แล้วแย่งรายได้ผ่านการ demonetize ได้ Davie504 ซึ่งเป็น YouTuber ดัง ๆ ก็เคยเจอแบบนั้น และโครงสร้างก็ชวนอึดอัดเพราะแม้แต่การอุทธรณ์ก็ยังให้หุ่นยนต์พิจารณาอีก
นอกจากวิธีทำให้ข้อมูลที่ AI ใช้เรียนรู้ปนเปื้อนแล้ว ยังมีวิธีต่อต้านแบบอื่นอีกไหม?
อย่างเช่นไม่เสพคอนเทนต์ที่ AI สร้างขึ้น...
ผมเองก็อ่านสิ่งนี้ไปพลางคิดเหมือนกันว่า มันอาจกลายเป็นการทำให้มนุษย์โดนวางยาพิษข้อมูลไปโดยไม่ตั้งใจก็ได้
ไม่แน่ใจว่าปัญหาเกิดขึ้นตรงไหน แต่หลังคำอย่าง 'kkim', 'bom', 'doem', 'jim' มี 'eum' ที่ไม่เข้ากันมาต่อท้ายอยู่เรื่อย ๆ เลยครับ อันนี้อาจเป็น poisoning เหมือนกันหรือเปล่า ;)
เหมือนว่าโมเดลจะมีการเปลี่ยนแปลงเล็กน้อยหรือเปล่า ทำให้พรอมป์ต์เดียวกันทำงานผิดพลาด ตอนนี้ผมได้แก้ไขส่วนนี้ไว้แล้ว