- ก่อนการไต่สวน AI ของวุฒิสภาสหรัฐ Anthropic อ้างว่ากิจกรรมที่เกี่ยวข้องกับ Alibaba เป็นการโจมตีลักษณะเดียวกันที่มุ่งเป้ามายังบริษัทซึ่งมีขนาด ใหญ่ที่สุด เท่าที่เคยพบ
- วิธีการหลักคือ การกลั่นแบบจำลอง (distillation) ซึ่งใช้เอาต์พุตของโมเดลที่แข็งแกร่งกว่ามาฝึกโมเดลที่อ่อนกว่า โดย Anthropic มองว่าจีนอาจไปถึงความสามารถระดับ Mythos Preview ได้เร็วขึ้น
- ระหว่างวันที่ 22 เมษายน 2026 ถึง 5 มิถุนายน 2026 มีการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้ง และมีบัญชีปลอมเกือบ 25,000 บัญชี
- Anthropic อ้างว่าผู้ดำเนินการมีความเชื่อมโยงกับ Alibaba และสถาบันวิจัย AI Alibaba Qwen ขณะที่ Alibaba ไม่ได้ตอบคำขอความเห็นจาก Reuters ในทันที
- Anthropic สนับสนุนการ แบ่งปันข่าวกรองภัยคุกคาม และการตอบสนองร่วมกันระหว่างรัฐบาลสหรัฐกับบริษัท AI ภาคเอกชน แต่ในช่วงเวลาใกล้เคียงกัน โมเดล Mythos และ Fable ของบริษัทก็ถูกจำกัดการเข้าถึงเช่นกัน
ข้อกล่าวหาเรื่องการดึงข้อมูลอย่างผิดกฎหมายที่เกี่ยวข้องกับ Alibaba
- Anthropic ระบุในจดหมายที่ส่งถึงวุฒิสภาสหรัฐว่า บริษัทเทคโนโลยีและอีคอมเมิร์ซจีน Alibaba ได้ลักลอบดึงความสามารถของโมเดล Claude AI ออกไปอย่างผิดกฎหมาย
- ตามจดหมายที่ Reuters ได้เห็น Anthropic ประเมินว่ากิจกรรมครั้งนี้เป็นการโจมตีลักษณะเดียวกันที่มีขนาด ใหญ่ที่สุด ที่บริษัทเคยยืนยันได้
- Alibaba ไม่ได้ตอบคำขอความเห็นจาก Reuters ในทันที
วิธี distillation และขนาดของการโจมตี
- Anthropic ระบุว่ากิจกรรมดังกล่าวเป็นความพยายามทำ distillation
- distillation คือวิธีที่ใช้เอาต์พุตของโมเดลที่ทรงพลังกว่ามาฝึกโมเดลที่อ่อนกว่าค่อนข้างมาก
- ช่วงเวลาของแคมเปญคือ 22 เมษายน 2026 ถึง 5 มิถุนายน 2026
- ในช่วงนี้มีการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้ง
- มีการใช้บัญชีปลอมเกือบ 25,000 บัญชี
- Anthropic มองว่า distillation เป็นวิธีที่ช่วยให้จีนเร่งความเร็วในการไปถึงความสามารถขั้นสูงระดับ Mythos Preview ของ Anthropic
ข้ออ้างเรื่องความเชื่อมโยงกับ Alibaba Qwen และผู้รับจดหมาย
- Anthropic อ้างว่าแคมเปญนี้ดำเนินการโดยผู้ปฏิบัติการที่เชื่อมโยงกับ Alibaba และสถาบันวิจัย AI ของ Alibaba อย่าง Alibaba Qwen
- จดหมายลงวันที่ 10 มิถุนายน
- ผู้รับคือ Tim Scott และ Elizabeth Warren ซึ่งเป็นประธานและกรรมการอาวุโสของคณะกรรมาธิการการธนาคารของวุฒิสภาสหรัฐ
- จดหมายฉบับนี้ถูกส่งก่อนการ ไต่สวน AI ที่กำหนดไว้
กรณีก่อนหน้าของสถาบันวิจัย AI จีน
- Anthropic เคยเปิดเผยว่าในเดือนกุมภาพันธ์ 2026 บริษัทได้ระบุแคมเปญที่สตาร์ตอัป AI จีน DeepSeek และสถาบันวิจัย AI จีนอีก 2 แห่งพยายามดึงความสามารถออกจากแพลตฟอร์ม Claude AI อย่างผิดกฎหมาย
- ขนาดที่ Anthropic ระบุในครั้งนั้นมีดังนี้
- DeepSeek: การโต้ตอบมากกว่า 150,000 ครั้ง
- Moonshot AI: มากกว่า 3.4 ล้านครั้ง
- MiniMax: มากกว่า 13 ล้านครั้ง
- Anthropic ระบุในตอนนั้นว่าความ เข้มข้นและความซับซ้อน ของแคมเปญเหล่านี้กำลังเพิ่มขึ้น และจำเป็นต้องมีการตอบสนองอย่างรวดเร็วและประสานกันจากอุตสาหกรรม ผู้กำหนดนโยบาย และชุมชน AI ทั่วโลก
มาตรการของรัฐบาลสหรัฐและข้อจำกัดต่อโมเดลของ Anthropic
- Anthropic ระบุว่าสนับสนุนความพยายามตอบสนองของรัฐบาลสหรัฐ
- รวมถึงการ แบ่งปันข่าวกรองภัยคุกคาม กับบริษัท AI ภาคเอกชน
- และกิจกรรมตอบสนองร่วมอื่น ๆ
- ในเดือนเมษายน 2026 ทำเนียบขาวกล่าวหาว่าจีนกำลังขโมยทรัพย์สินทางปัญญาของสถาบันวิจัย AI สหรัฐในระดับ อุตสาหกรรม
- ในเดือนเดียวกัน Alibaba ถูกเพิ่มเข้าไปใน รายชื่อบริษัททหารจีน ของกระทรวงกลาโหมสหรัฐ และ Alibaba กำลังโต้แย้งการกำหนดสถานะดังกล่าว
- กระทรวงพาณิชย์สหรัฐชะลอการขึ้นบัญชีดำทางการค้าต่อ DeepSeek แม้ว่าหน่วยงานร่วมของรัฐบาลจะมองว่าเป็นความเสี่ยงด้านความมั่นคงแห่งชาติ โดยพยายามหลีกเลี่ยงการยกระดับความตึงเครียดกับ Beijing
- สองวันหลังจาก Anthropic ส่งจดหมาย คือวันที่ 12 มิถุนายน กระทรวงพาณิชย์สหรัฐได้กำหนดข้อจำกัดต่อโมเดล AI ล่าสุดของ Anthropic ได้แก่ Mythos และ Fable
- ทางการกังวลว่าโมเดลเหล่านี้อาจถูกนำไปใช้งานโดยผู้ใช้ด้านข่าวกรองทางทหารในจีนและประเทศอื่นที่น่ากังวล
- ข้อจำกัดนี้ทำให้ Anthropic ปิดการเข้าถึงทั่วโลก สำหรับโมเดลเหล่านี้
1 ความคิดเห็น
ความเห็นจาก Hacker News
เอามาทิ้งไว้ตรงนี้: “ผู้พิพากษาตัดสินว่า การที่ Anthropic ดาวน์โหลดหนังสือจากเว็บเถื่อนอย่าง LibGen มากกว่า 7 ล้านเล่ม ถือเป็นการละเมิด และยังยกคำแก้ต่างเรื่อง ‘เพื่อการวิจัย’ ของ Anthropic ทิ้งด้วย: ‘คุณจะอวยพรให้ตัวเองว่ามีจุดประสงค์เพื่อการวิจัย แล้วหยิบตำราเล่มไหนก็ได้ตามใจไม่ได้’”
https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...
โดยพื้นฐานแล้วการ distillation มีอยู่สองแบบ 1) วิธีทื่อ ๆ แบบสเกลใหญ่ คือโยนคำถามเข้าไปแล้วใช้คำตอบเป็นสัญญาณเสริมแรง (black box) 2) การ distillation ที่เจาะจงกว่าซึ่งโมเดลหนึ่งสอน ฝึก และชี้นำอีกโมเดลโดยตรง (RLAIF)
แบบหลังนี้โดยแก่นแล้วก็คือการปรับจูนโมเดลอย่างละเอียดโดยมีอีกโมเดลเป็นคนชี้ทิศ หลายบริษัททำ fine-tuning แบบนี้กันทุกวัน สถาบันวิจัยในจีนก็น่าจะแทบจะแน่นอนว่าใช้วิธีนี้เหมือนกัน เพราะมันให้ผลกับผลลัพธ์สุดท้ายดีกว่าการไปขูดเอาคำตอบง่าย ๆ จากคำถามง่าย ๆ มาก
การบ่นเรื่อง distillation แบบนี้ทำให้ปัญหาดูใหญ่เกินจริง และดูเหมือนเป้าหมายคือผลักดันเชิงกีดกันการค้าให้รัฐบาลสหรัฐไปสกัดหรือแบนผู้ให้บริการโมเดลจากจีน พวกเขาเรียกร้องให้คุมเข้มการส่งออกชิปไปแล้ว ซึ่งก็น่าขำเมื่อ DeepSeek v4 ถูกออกแบบมาให้รันบนชิป Huawei และบริษัทจีนรายอื่นก็กำลังเดินตาม แต่พูดตรง ๆ แบบนั้นไม่ได้ ก็เลยอ้างแทนว่าโมเดลที่ผ่านการ distill อาจไม่ปลอดภัยเท่าโมเดลของตัวเอง จึงต้องเพิ่มมาตรการควบคุมการส่งออก ทั้งที่ถ้าคุณโชว์ jailbreak ที่ทะลุ guardrail ของโมเดลตัวเองได้ สุดท้ายพวกเขาก็จะบอกว่าไม่ต้องกังวลเรื่องความปลอดภัย เพราะไม่ว่าโมเดลไหนก็โดน jailbreak ได้อยู่ดี
2) เป็นไปไม่ได้ที่จะสร้างโมเดลภาษาขนาดใหญ่ที่มีภูมิคุ้มกันต่อ jailbreak ทุกแบบ ซึ่งเรื่องนี้ก็ไม่มีหลักฐานที่น่าเชื่อถือมาหักล้างเช่นกัน ดังนั้น Anthropic ถูกเต็ม ๆ
ถ้าข้อ 1 ไม่จริง ก็แค่เปิดเผยรายละเอียดของ jailbreak ออกมาได้เลย เพราะตามที่กล่าวกันมันใช้ได้กับ Fable 5 เท่านั้น จึงไม่มีความเสี่ยงที่เป็นไปได้ด้วยซ้ำ
ถ้าข้อ 2 ไม่จริง ห้องแล็บ LLM อื่นก็น่าจะทำสำเร็จไปแล้ว โดยเฉพาะเมื่อหลายรัฐบาลก็แสดงชัดเจนว่ามีตลาดสำหรับโครงการแบบนั้น
โดยพื้นฐานแล้ว ถ้ายังอยากให้โมเดล AI มีประโยชน์อยู่ การป้องกันสิ่งนี้ทำได้ยากมาก
มันทำให้นึกถึงเรื่องเล่าช่วงกลางถึงปลายทศวรรษ 1980 ที่ Steve Jobs บ่นว่า Mac GUI ถูกลอก ทั้งที่เขาเองก็ไม่ได้ยอมรับอย่างเปิดเผยถึงงานที่ทำไว้ใน ระบบปฏิบัติการ Xerox Alto และ Star
“คุณกำลังจะลอกของที่ฉันลอกมาแล้วนะ!”
ภาพมันก็เหมือนกับการ crawl อินเทอร์เน็ตทั้งก้อนเพื่อสร้าง LLM ขนาดมหึมา แล้วมาบ่นว่าตัวเองถูกก๊อบปี้
ข้อมูลนั้นอยากเป็นอิสระจริง ๆ แต่บริษัท AI อยากเป็นคนเฝ้าประตู ในระยะยาวผมคิดว่าแนวทางที่ยั่งยืนกว่าคือ open weights จะเป็นฝ่ายชนะ
น่าขำจริง ๆ ที่ Anthropic บ่นว่า “มีการสกัดความสามารถของโมเดล Claude AI อย่างผิดกฎหมาย” พร้อมกับสนับสนุนคำกล่าวหาจากทำเนียบขาวที่ว่าจีน “ขโมยทรัพย์สินทางปัญญาของห้องแล็บ AI สหรัฐในระดับอุตสาหกรรม”
Anthropic, OpenAI, Google, Microsoft และรายอื่น ๆ ฝึกโมเดลโดยกวาดเก็บคอนเทนต์ทุกอย่างเท่าที่หาได้ พร้อมเมินสิทธิของเจ้าของลิขสิทธิ์ แล้วตอนนี้หนึ่งในนั้นกำลังโวยว่ามันไม่ยุติธรรมที่คนอื่นทำในสิ่งเดียวกับที่พวกเขาทำกันมาหรือ
robots.txt, และทำให้ค่าแบนด์วิดท์พุ่งสูงถือว่าไม่เป็นไร แต่ถ้าแนวปฏิบัติการเก็บข้อมูลทำให้ผู้ให้บริการ AI ต้องมีต้นทุนขึ้นมา แบบนั้นกลับถูกมองว่ายอมรับไม่ได้อย่างชัดเจนสิ่งที่กำลังเกิดขึ้นตอนนี้คือ: ผู้ค้าต่อในจีนกำลังขาย Claude token ในราคาต่ำกว่าราคา Anthropic API อย่างเป็นทางการ 70~90% พวกเขาทำได้โดยการรวมบัญชี Claude Max แล้วขายต่อความจุ ใช้การฉ้อโกงการชำระเงิน และขายต่อเอาต์พุตของโมเดลกับ chain-of-thought ให้กับสถาบันวิจัยหลายแห่งในจีน ผู้ค้าพวกนี้ช่วยให้เข้าถึงโมเดลแลกกับการได้รับล็อกผู้ใช้และร่องรอยการอนุมาน แล้วนำสิ่งนั้นไปขายเป็นข้อมูลฝึก ทำให้ดำเนินการได้ต่ำกว่าต้นทุน
ทั้ง Claude และ ChatGPT ถูกบล็อกในจีน ต้องใช้ VPN ถึงจะเข้าได้ และก็จ่ายเงินด้วยบัตรธนาคารจีนไม่ได้ เพราะงั้นคนส่วนใหญ่ที่อยากเข้าถึง Claude จึงซื้อสิทธิ์เข้าถึงผ่านผู้ค้าต่อ นี่คือวิธีที่ง่ายและถูกที่สุดในการเข้าถึงโมเดลของ Anthropic ในจีน
ผู้ค้าต่อเหล่านี้รันบัญชีบอตนับหมื่นบัญชี และนี่ก็เป็นเหตุผลที่ Anthropic เริ่มใช้การยืนยันตัวตนเพื่อชะลอการบุกของบอต
ผู้ค้าต่อ token รายหนึ่งเสนอ Opus 4.8 ที่ลดราคา 93% จากค่า API ทางการ: https://yunwu.ai/pricing?provider=Anthropic
นี่เป็นหนึ่งในเหตุผลที่ DeepSeek และ GLM มีราคาถูกมาก เพราะต้องแข่งขันกับราคา token ที่ต่ำจนน่าเหลือเชื่อในจีน จึงต้องกดราคาให้ต่ำเพื่อให้คนใช้งาน
เคยแชร์เรื่องนี้ไปเมื่อไม่กี่เดือนก่อน แต่แทบไม่มีใครสนใจ นี่คือบทความที่อธิบายเศรษฐกิจการขายต่อ token ในจีนได้ยอดเยี่ยมมาก: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...
ฉันยังเคยเรียนอีกว่า ถ้า Anthropic อยากแข่งขันก็ต้องทำงานของตัวเองให้ดีกว่านี้ ไม่อย่างนั้นก็จะมีคนอื่นชนะ
หรือว่าตอนนี้หลักการนี้ไม่ใช้กับบริษัทยักษ์ใหญ่ของสหรัฐแล้ว
DeepSeek และ GLM เป็น open weights และผู้ให้บริการ inference ในสหรัฐก็ขายถูกกว่านี้มากอยู่แล้ว ที่ราคาถูกเป็นเพราะโมเดลมีประสิทธิภาพมากกว่า
ถ้าไม่ใช่ มันก็ฟังดูเหมือนคำพูดที่สายหมี AI ชอบพูดกันว่า “Anthropic/OpenAI กำลังขาย token มูลค่า 1,000 ดอลลาร์ในราคา 100 ดอลลาร์แล้วเสียเงินมหาศาล”
การกระทำของ Alibaba ถูกอธิบายว่าเป็นความพยายามด้าน “distillation” ซึ่ง Anthropic บอกว่าหมายถึงการใช้เอาต์พุตของโมเดลที่เก่งกว่าไปฝึกโมเดลที่ด้อยกว่า
Claude ใช้คอนเทนต์ระดับเทราไบต์เพื่อฝึกโมเดลของตัวเองโดยไม่ได้รับอนุญาต แล้วบอกว่าไม่เป็นไร แต่ตอนนี้กลับร้องว่าไม่ยุติธรรมเมื่อมีคนเอาเอาต์พุตของ Claude ไปฝึกโมเดล
น่ารอดูคดีที่ Anthropic ต้องเปิดเผยแหล่งที่มาของข้อมูลฝึก และอธิบายว่าทำไมตัวเองถึงมีสิทธิ์นำข้อมูลฝึกที่ถูกนำมาใช้ซ้ำมาขายให้ลูกค้าได้ แต่ Alibaba ที่ฝึกโมเดลของตัวเองด้วยโมเดลของ Anthropic กลับทำไม่ได้
น่าจะสนุกดี
การกระทำของ Anthropic ดูเหมือนเป็นท่าทีเชิงสัญลักษณ์มากกว่า คนอื่น ๆ ก็เดาไปแล้วว่ากำลังส่งสัญญาณให้ผู้ชมกลุ่มไหน
ตกลงแล้วอะไรกันแน่ที่ผิดกฎหมาย
ในทางกฎหมาย เอาต์พุตของโมเดลไม่อาจได้รับความคุ้มครองเป็นทรัพย์สินทางปัญญาได้ ไม่ว่าจะตามกฎหมายภายในประเทศหรือกฎหมายระหว่างประเทศ สิ่งที่คาดหวังได้มากที่สุดคือการเยียวยาทางแพ่ง แต่เมื่อพิจารณาว่าวิธีที่พวกเขาใช้ฝึกโมเดลนั้นผิดกฎหมายอย่างตรงตัวอยู่แล้ว แม้แต่เรื่องนั้นก็ดูเกินไป
Anthropic ก็แค่ถูกปฏิบัติแบบเดียวกับที่ตัวเองเคยทำกับทุกคน พวกเขาปูที่นอนเอง ก็ต้องนอนบนมันเอง
การกระทำของ Alibaba ถูกเรียกว่า “distillation” คือการฝึกโมเดลที่อ่อนกว่าด้วยผลลัพธ์จากโมเดลที่แข็งแกร่งกว่า แต่ไม่เข้าใจว่ามันผิดตรงไหน
Anthropic บอกว่าแคมเปญนี้ดำเนินมาตั้งแต่ 22 เมษายน 2026 ถึง 5 มิถุนายน และสร้างการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้งผ่านบัญชีหลอกลวงเกือบ 25,000 บัญชี
อะไรทำให้บัญชีเหล่านั้นเป็นบัญชีหลอกลวง ถ้าจ่ายในราคาที่ตกลงกันไว้แล้วก็น่าจะโอเคไม่ใช่หรือ ถ้าไม่จ่ายเงิน แล้วทำไม Anthropic ถึงให้บริการ
โดยพื้นฐานแล้ว distillation ป้องกันไม่ได้ ทำได้แค่ทำให้ช้าลงเท่านั้น ลองแย้งมาสิ
สุดท้ายบริษัทจีนก็คงปล่อยส่วนขยายแบบ Honey ออกมา แล้วอาศัยลูกค้าที่ไม่ใช่จีนตัวจริงเป็นหน้าฉาก ก่อนจะส่งทุกอย่างกลับไปจีนอยู่ดี
เกมจบแล้ว
แต่แล็บ AI ก็ยังสามารถสร้างมูลค่าทางเศรษฐกิจมหาศาลต่อไปได้โดยไม่ต้องเปิดเผยโมเดลให้เสี่ยงต่อการถูก distill เช่น ใช้โมเดลภายในองค์กรเท่านั้นเพื่อพัฒนายารักษาโรค
หวังว่าสักวันจะมีอนาคตที่คนอื่นเข้าถึงโมเดลระดับแนวหน้าได้ด้วย แต่ถ้าตัดสินว่าการป้องกันการแพร่กระจายผ่าน distillation สำคัญกว่า ก็อาจไม่จำเป็นต้องเป็นแบบนั้น
[1]: อ้างอิงเรื่อง distillation ใน https://dualuse.dev/posts/export-controls-on-fable
ประเด็นคืออาจไม่มีทางแก้เชิงเทคนิค แต่ในทางทฤษฎีอาจมี ทางแก้เชิงการเมือง
งานของ Berkeley เรื่อง “False Promise of Imitating Proprietary LLMs” ก็เห็นว่าการเลียนแบบช่วยลดช่องว่างด้านสไตล์ได้เร็ว แต่ ช่องว่างด้านความสามารถ ยังเหลืออยู่มาก
https://arxiv.org/abs/2305.15717