Anthropic ระบุว่า “Alibaba ลักลอบดึงความสามารถของโมเดล Claude AI ออกไป”

(reuters.com)

1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ก่อนการไต่สวน AI ของวุฒิสภาสหรัฐ Anthropic อ้างว่ากิจกรรมที่เกี่ยวข้องกับ Alibaba เป็นการโจมตีลักษณะเดียวกันที่มุ่งเป้ามายังบริษัทซึ่งมีขนาด ใหญ่ที่สุด เท่าที่เคยพบ
วิธีการหลักคือ การกลั่นแบบจำลอง (distillation) ซึ่งใช้เอาต์พุตของโมเดลที่แข็งแกร่งกว่ามาฝึกโมเดลที่อ่อนกว่า โดย Anthropic มองว่าจีนอาจไปถึงความสามารถระดับ Mythos Preview ได้เร็วขึ้น
ระหว่างวันที่ 22 เมษายน 2026 ถึง 5 มิถุนายน 2026 มีการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้ง และมีบัญชีปลอมเกือบ 25,000 บัญชี
Anthropic อ้างว่าผู้ดำเนินการมีความเชื่อมโยงกับ Alibaba และสถาบันวิจัย AI Alibaba Qwen ขณะที่ Alibaba ไม่ได้ตอบคำขอความเห็นจาก Reuters ในทันที
Anthropic สนับสนุนการ แบ่งปันข่าวกรองภัยคุกคาม และการตอบสนองร่วมกันระหว่างรัฐบาลสหรัฐกับบริษัท AI ภาคเอกชน แต่ในช่วงเวลาใกล้เคียงกัน โมเดล Mythos และ Fable ของบริษัทก็ถูกจำกัดการเข้าถึงเช่นกัน

ข้อกล่าวหาเรื่องการดึงข้อมูลอย่างผิดกฎหมายที่เกี่ยวข้องกับ Alibaba

Anthropic ระบุในจดหมายที่ส่งถึงวุฒิสภาสหรัฐว่า บริษัทเทคโนโลยีและอีคอมเมิร์ซจีน Alibaba ได้ลักลอบดึงความสามารถของโมเดล Claude AI ออกไปอย่างผิดกฎหมาย
ตามจดหมายที่ Reuters ได้เห็น Anthropic ประเมินว่ากิจกรรมครั้งนี้เป็นการโจมตีลักษณะเดียวกันที่มีขนาด ใหญ่ที่สุด ที่บริษัทเคยยืนยันได้
Alibaba ไม่ได้ตอบคำขอความเห็นจาก Reuters ในทันที

วิธี distillation และขนาดของการโจมตี

Anthropic ระบุว่ากิจกรรมดังกล่าวเป็นความพยายามทำ distillation
- distillation คือวิธีที่ใช้เอาต์พุตของโมเดลที่ทรงพลังกว่ามาฝึกโมเดลที่อ่อนกว่าค่อนข้างมาก
ช่วงเวลาของแคมเปญคือ 22 เมษายน 2026 ถึง 5 มิถุนายน 2026
ในช่วงนี้มีการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้ง
มีการใช้บัญชีปลอมเกือบ 25,000 บัญชี
Anthropic มองว่า distillation เป็นวิธีที่ช่วยให้จีนเร่งความเร็วในการไปถึงความสามารถขั้นสูงระดับ Mythos Preview ของ Anthropic

ข้ออ้างเรื่องความเชื่อมโยงกับ Alibaba Qwen และผู้รับจดหมาย

Anthropic อ้างว่าแคมเปญนี้ดำเนินการโดยผู้ปฏิบัติการที่เชื่อมโยงกับ Alibaba และสถาบันวิจัย AI ของ Alibaba อย่าง Alibaba Qwen
จดหมายลงวันที่ 10 มิถุนายน
ผู้รับคือ Tim Scott และ Elizabeth Warren ซึ่งเป็นประธานและกรรมการอาวุโสของคณะกรรมาธิการการธนาคารของวุฒิสภาสหรัฐ
จดหมายฉบับนี้ถูกส่งก่อนการ ไต่สวน AI ที่กำหนดไว้

กรณีก่อนหน้าของสถาบันวิจัย AI จีน

Anthropic เคยเปิดเผยว่าในเดือนกุมภาพันธ์ 2026 บริษัทได้ระบุแคมเปญที่สตาร์ตอัป AI จีน DeepSeek และสถาบันวิจัย AI จีนอีก 2 แห่งพยายามดึงความสามารถออกจากแพลตฟอร์ม Claude AI อย่างผิดกฎหมาย
ขนาดที่ Anthropic ระบุในครั้งนั้นมีดังนี้
- DeepSeek: การโต้ตอบมากกว่า 150,000 ครั้ง
- Moonshot AI: มากกว่า 3.4 ล้านครั้ง
- MiniMax: มากกว่า 13 ล้านครั้ง
Anthropic ระบุในตอนนั้นว่าความ เข้มข้นและความซับซ้อน ของแคมเปญเหล่านี้กำลังเพิ่มขึ้น และจำเป็นต้องมีการตอบสนองอย่างรวดเร็วและประสานกันจากอุตสาหกรรม ผู้กำหนดนโยบาย และชุมชน AI ทั่วโลก

มาตรการของรัฐบาลสหรัฐและข้อจำกัดต่อโมเดลของ Anthropic

Anthropic ระบุว่าสนับสนุนความพยายามตอบสนองของรัฐบาลสหรัฐ
- รวมถึงการ แบ่งปันข่าวกรองภัยคุกคาม กับบริษัท AI ภาคเอกชน
- และกิจกรรมตอบสนองร่วมอื่น ๆ
ในเดือนเมษายน 2026 ทำเนียบขาวกล่าวหาว่าจีนกำลังขโมยทรัพย์สินทางปัญญาของสถาบันวิจัย AI สหรัฐในระดับ อุตสาหกรรม
ในเดือนเดียวกัน Alibaba ถูกเพิ่มเข้าไปใน รายชื่อบริษัททหารจีน ของกระทรวงกลาโหมสหรัฐ และ Alibaba กำลังโต้แย้งการกำหนดสถานะดังกล่าว
กระทรวงพาณิชย์สหรัฐชะลอการขึ้นบัญชีดำทางการค้าต่อ DeepSeek แม้ว่าหน่วยงานร่วมของรัฐบาลจะมองว่าเป็นความเสี่ยงด้านความมั่นคงแห่งชาติ โดยพยายามหลีกเลี่ยงการยกระดับความตึงเครียดกับ Beijing
สองวันหลังจาก Anthropic ส่งจดหมาย คือวันที่ 12 มิถุนายน กระทรวงพาณิชย์สหรัฐได้กำหนดข้อจำกัดต่อโมเดล AI ล่าสุดของ Anthropic ได้แก่ Mythos และ Fable
- ทางการกังวลว่าโมเดลเหล่านี้อาจถูกนำไปใช้งานโดยผู้ใช้ด้านข่าวกรองทางทหารในจีนและประเทศอื่นที่น่ากังวล
- ข้อจำกัดนี้ทำให้ Anthropic ปิดการเข้าถึงทั่วโลก สำหรับโมเดลเหล่านี้

1 ความคิดเห็น

GN⁺ 4 시간 전

ความเห็นจาก Hacker News

เอามาทิ้งไว้ตรงนี้: “ผู้พิพากษาตัดสินว่า การที่ Anthropic ดาวน์โหลดหนังสือจากเว็บเถื่อนอย่าง LibGen มากกว่า 7 ล้านเล่ม ถือเป็นการละเมิด และยังยกคำแก้ต่างเรื่อง ‘เพื่อการวิจัย’ ของ Anthropic ทิ้งด้วย: ‘คุณจะอวยพรให้ตัวเองว่ามีจุดประสงค์เพื่อการวิจัย แล้วหยิบตำราเล่มไหนก็ได้ตามใจไม่ได้’”
https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...
- ช่วงแรก ๆ ของบริการสตรีมเพลง ผู้เล่นหน้าใหม่หลายรายก็เติมบริการของตัวเองด้วยคลังคอนเทนต์ ละเมิดลิขสิทธิ์ ขนาดมหาศาล ผู้ชนะคือรายที่ไปทำสัญญากับเจ้าของลิขสิทธิ์ก่อน แล้วค่อยไล่จัดการส่วนที่เหลือ
- มันไม่น่าขำเหรอ เวลาถามเนื้อเพลง โมเดลพวกนี้ก็จู่ ๆ ดัน จำเนื้อหาที่มีลิขสิทธิ์ ขึ้นมาได้
- แล้วแบบนี้ไม่ต้อง ทิ้งโมเดล ที่ฝึกจากหนังสือพวกนั้นด้วยเหรอ
- มัน “สกัด” “ความสามารถ” ออกมาจากหนังสือพวกนั้นได้มากแค่ไหนกันนะ
- “คุณกำลังลักพาตัวของที่ฉันขโมยมาอย่างถูกต้องนะสิ!”
โดยพื้นฐานแล้วการ distillation มีอยู่สองแบบ 1) วิธีทื่อ ๆ แบบสเกลใหญ่ คือโยนคำถามเข้าไปแล้วใช้คำตอบเป็นสัญญาณเสริมแรง (black box) 2) การ distillation ที่เจาะจงกว่าซึ่งโมเดลหนึ่งสอน ฝึก และชี้นำอีกโมเดลโดยตรง (RLAIF)
แบบหลังนี้โดยแก่นแล้วก็คือการปรับจูนโมเดลอย่างละเอียดโดยมีอีกโมเดลเป็นคนชี้ทิศ หลายบริษัททำ fine-tuning แบบนี้กันทุกวัน สถาบันวิจัยในจีนก็น่าจะแทบจะแน่นอนว่าใช้วิธีนี้เหมือนกัน เพราะมันให้ผลกับผลลัพธ์สุดท้ายดีกว่าการไปขูดเอาคำตอบง่าย ๆ จากคำถามง่าย ๆ มาก
การบ่นเรื่อง distillation แบบนี้ทำให้ปัญหาดูใหญ่เกินจริง และดูเหมือนเป้าหมายคือผลักดันเชิงกีดกันการค้าให้รัฐบาลสหรัฐไปสกัดหรือแบนผู้ให้บริการโมเดลจากจีน พวกเขาเรียกร้องให้คุมเข้มการส่งออกชิปไปแล้ว ซึ่งก็น่าขำเมื่อ DeepSeek v4 ถูกออกแบบมาให้รันบนชิป Huawei และบริษัทจีนรายอื่นก็กำลังเดินตาม แต่พูดตรง ๆ แบบนั้นไม่ได้ ก็เลยอ้างแทนว่าโมเดลที่ผ่านการ distill อาจไม่ปลอดภัยเท่าโมเดลของตัวเอง จึงต้องเพิ่มมาตรการควบคุมการส่งออก ทั้งที่ถ้าคุณโชว์ jailbreak ที่ทะลุ guardrail ของโมเดลตัวเองได้ สุดท้ายพวกเขาก็จะบอกว่าไม่ต้องกังวลเรื่องความปลอดภัย เพราะไม่ว่าโมเดลไหนก็โดน jailbreak ได้อยู่ดี
- ส่วนที่บอกว่า “การบ่นเรื่อง distillation ทำให้ปัญหาดูใหญ่เกินจริง” นั้นถูกต้อง แต่ที่น่าเสียดายคือบทความ Reuters เองก็มีส่วนร่วมใน การทำให้เป็นดราม่า นี้ด้วย ย่อหน้าแรกเอาคำเรียกของ Anthropic ที่ว่าการ distillation เป็น “การโจมตี” มาใช้ซ้ำโดยไม่ใส่เครื่องหมายคำพูด ทำให้ผู้อ่านจับได้ยากว่านี่เป็นกรอบภาษาจากฝั่งบริษัทเอง การ distillation ไม่ใช่การโจมตี
- อาจเป็นคำถามงี่เง่า แต่ผมเข้าใจว่าโมเดลพวกนี้ฝึกด้วยข้อมูลระดับเพตะไบต์ ปริมาณคำถาม/คำตอบที่สกัดได้จากการ query โมเดลใหญ่กว่าอย่าง Claude น่าจะมีจำกัดพอสมควร เมื่อเทียบกับชุดข้อมูลฝึกแล้วมันไม่ใช่แค่ หยดน้ำหยดเดียว เหรอ
- https://research.nvidia.com/labs/lpr/slm-agents/ — ข้อมูลสำหรับ distillation เป็นผลพลอยได้ที่เกิดขึ้นเองตามธรรมชาติถ้าใช้โมเดลแบบนี้ ไม่มีวิธีป้องกันที่ได้ผล Anthropic กำลังพยายามชะลอเรื่องนี้และซ่อนภายในโมเดลด้วยการทำให้ บล็อกความคิด เสื่อมสภาพเหลือแค่สรุป แต่สุดท้ายในเชิงคณิตศาสตร์มันไม่มีทางออก และในระดับบริษัทข้ามชาติ/บริษัทยักษ์ใหญ่ มันก็ใช้ได้ผลดีพออยู่ดี ทันทีที่ต้นทุนกลายเป็นสิ่งสำคัญเป็นอันดับต้น ๆ แรงล็อกอินที่จะมัดลูกค้าไว้ก็หายไป
- พวกเขากำลังอ้างอยู่สองข้อ 1) jailbreak สาธารณะตัวหนึ่งที่มีอยู่ใน Fable 5 นั้นไม่เป็นอันตราย และผู้เชี่ยวชาญหลายคนก็ยืนยันแล้ว โดยไม่มีหลักฐานที่น่าเชื่อถือมาคัดค้าน ดังนั้น Anthropic น่าจะถูก
  2) เป็นไปไม่ได้ที่จะสร้างโมเดลภาษาขนาดใหญ่ที่มีภูมิคุ้มกันต่อ jailbreak ทุกแบบ ซึ่งเรื่องนี้ก็ไม่มีหลักฐานที่น่าเชื่อถือมาหักล้างเช่นกัน ดังนั้น Anthropic ถูกเต็ม ๆ
  ถ้าข้อ 1 ไม่จริง ก็แค่เปิดเผยรายละเอียดของ jailbreak ออกมาได้เลย เพราะตามที่กล่าวกันมันใช้ได้กับ Fable 5 เท่านั้น จึงไม่มีความเสี่ยงที่เป็นไปได้ด้วยซ้ำ
  ถ้าข้อ 2 ไม่จริง ห้องแล็บ LLM อื่นก็น่าจะทำสำเร็จไปแล้ว โดยเฉพาะเมื่อหลายรัฐบาลก็แสดงชัดเจนว่ามีตลาดสำหรับโครงการแบบนั้น
- ถ้าคุณกำลังทำ evaluation อยู่ ในทางปฏิบัติก็แทบไม่ต่างจากทำ RLAIF เพียงแค่ไม่ได้เอาไปฝึกโมเดล คุณกำลังดูแค่ผลลัพธ์เท่านั้น
  โดยพื้นฐานแล้ว ถ้ายังอยากให้โมเดล AI มีประโยชน์อยู่ การป้องกันสิ่งนี้ทำได้ยากมาก
มันทำให้นึกถึงเรื่องเล่าช่วงกลางถึงปลายทศวรรษ 1980 ที่ Steve Jobs บ่นว่า Mac GUI ถูกลอก ทั้งที่เขาเองก็ไม่ได้ยอมรับอย่างเปิดเผยถึงงานที่ทำไว้ใน ระบบปฏิบัติการ Xerox Alto และ Star
“คุณกำลังจะลอกของที่ฉันลอกมาแล้วนะ!”
ภาพมันก็เหมือนกับการ crawl อินเทอร์เน็ตทั้งก้อนเพื่อสร้าง LLM ขนาดมหึมา แล้วมาบ่นว่าตัวเองถูกก๊อบปี้
- น่าจะหมายถึงคำพูดนี้ที่มักยกให้ Bill Gates: “คือแบบนี้นะ Steve ผมว่าเรื่องนี้มองได้มากกว่ามุมเดียว เราสองคนต่างก็มีเพื่อนบ้านรวยชื่อ Xerox และมันใกล้เคียงกับสถานการณ์ที่ผมแอบเข้าไปขโมยทีวี แต่กลับพบว่าคุณขโมยไปก่อนแล้ว”
- Apple ให้ Xerox มีสิทธิซื้อ หุ้นก่อน IPO มูลค่า 1 ล้านดอลลาร์ ก่อนที่จะมีการประชุมนั้นเกิดขึ้น
- ใช่แล้ว วงการ AI ทั้งวงการมีแต่คนลอกกันเอง มันเริ่มจากบริษัท AI กลืนข้อมูลที่ผู้คนสายเทคนิคหรือสายอุดมการณ์แบ่งปันไว้บนอินเทอร์เน็ตตลอด 40 ปีที่ผ่านมาเพื่อช่วยมนุษย์คนอื่น จากนั้นก็กินทั้งของเถื่อนและเนื้อหามีลิขสิทธิ์ และตอนนี้บริษัท AI ก็กำลังลอกกันเองอีก
  ข้อมูลนั้นอยากเป็นอิสระจริง ๆ แต่บริษัท AI อยากเป็นคนเฝ้าประตู ในระยะยาวผมคิดว่าแนวทางที่ยั่งยืนกว่าคือ open weights จะเป็นฝ่ายชนะ
- LLM ทุกตัวบูชา Jon Skeet เป็นพระเจ้า
- “คุณกำลังลักพาตัวของที่ฉันขโมยมาอย่างถูกต้องนะสิ!”
น่าขำจริง ๆ ที่ Anthropic บ่นว่า “มีการสกัดความสามารถของโมเดล Claude AI อย่างผิดกฎหมาย” พร้อมกับสนับสนุนคำกล่าวหาจากทำเนียบขาวที่ว่าจีน “ขโมยทรัพย์สินทางปัญญาของห้องแล็บ AI สหรัฐในระดับอุตสาหกรรม”
Anthropic, OpenAI, Google, Microsoft และรายอื่น ๆ ฝึกโมเดลโดยกวาดเก็บคอนเทนต์ทุกอย่างเท่าที่หาได้ พร้อมเมินสิทธิของเจ้าของลิขสิทธิ์ แล้วตอนนี้หนึ่งในนั้นกำลังโวยว่ามันไม่ยุติธรรมที่คนอื่นทำในสิ่งเดียวกับที่พวกเขาทำกันมาหรือ
- ดูเหมือนว่าบริษัท AI จะมองว่าสิ่งทุกอย่างบนอินเทอร์เน็ตเป็นของฟรี ยกเว้นของตัวเองเท่านั้น การถล่มเว็บไซต์สุ่มด้วย AI crawler, เมิน robots.txt, และทำให้ค่าแบนด์วิดท์พุ่งสูงถือว่าไม่เป็นไร แต่ถ้าแนวปฏิบัติการเก็บข้อมูลทำให้ผู้ให้บริการ AI ต้องมีต้นทุนขึ้นมา แบบนั้นกลับถูกมองว่ายอมรับไม่ได้อย่างชัดเจน
- ตามกฎหมายปัจจุบัน เอาต์พุตของ Claude เป็น สาธารณสมบัติ จึงไม่ใช่กรณีเดียวกันเป๊ะ ๆ ดังนั้นฝั่งจีนไม่ได้ขโมยอะไรไปจากเรื่องนี้เลย
- ของคุณคือของฉัน และของฉันก็ยังเป็นของฉันอยู่ดี
- ในหมู่โจรไม่มีคำว่าศักดิ์ศรี
สิ่งที่กำลังเกิดขึ้นตอนนี้คือ: ผู้ค้าต่อในจีนกำลังขาย Claude token ในราคาต่ำกว่าราคา Anthropic API อย่างเป็นทางการ 70~90% พวกเขาทำได้โดยการรวมบัญชี Claude Max แล้วขายต่อความจุ ใช้การฉ้อโกงการชำระเงิน และขายต่อเอาต์พุตของโมเดลกับ chain-of-thought ให้กับสถาบันวิจัยหลายแห่งในจีน ผู้ค้าพวกนี้ช่วยให้เข้าถึงโมเดลแลกกับการได้รับล็อกผู้ใช้และร่องรอยการอนุมาน แล้วนำสิ่งนั้นไปขายเป็นข้อมูลฝึก ทำให้ดำเนินการได้ต่ำกว่าต้นทุน
ทั้ง Claude และ ChatGPT ถูกบล็อกในจีน ต้องใช้ VPN ถึงจะเข้าได้ และก็จ่ายเงินด้วยบัตรธนาคารจีนไม่ได้ เพราะงั้นคนส่วนใหญ่ที่อยากเข้าถึง Claude จึงซื้อสิทธิ์เข้าถึงผ่านผู้ค้าต่อ นี่คือวิธีที่ง่ายและถูกที่สุดในการเข้าถึงโมเดลของ Anthropic ในจีน
ผู้ค้าต่อเหล่านี้รันบัญชีบอตนับหมื่นบัญชี และนี่ก็เป็นเหตุผลที่ Anthropic เริ่มใช้การยืนยันตัวตนเพื่อชะลอการบุกของบอต
ผู้ค้าต่อ token รายหนึ่งเสนอ Opus 4.8 ที่ลดราคา 93% จากค่า API ทางการ: https://yunwu.ai/pricing?provider=Anthropic
นี่เป็นหนึ่งในเหตุผลที่ DeepSeek และ GLM มีราคาถูกมาก เพราะต้องแข่งขันกับราคา token ที่ต่ำจนน่าเหลือเชื่อในจีน จึงต้องกดราคาให้ต่ำเพื่อให้คนใช้งาน
เคยแชร์เรื่องนี้ไปเมื่อไม่กี่เดือนก่อน แต่แทบไม่มีใครสนใจ นี่คือบทความที่อธิบายเศรษฐกิจการขายต่อ token ในจีนได้ยอดเยี่ยมมาก: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...
- ถือเป็นเรื่องดีต่อการแข่งขัน ผู้ขายจีนเสนอทางออกที่ถูกกว่า ซึ่งก็คือ ตลาดเสรี ตามที่ฉันเคยเรียนในเศรษฐศาสตร์
  ฉันยังเคยเรียนอีกว่า ถ้า Anthropic อยากแข่งขันก็ต้องทำงานของตัวเองให้ดีกว่านี้ ไม่อย่างนั้นก็จะมีคนอื่นชนะ
  หรือว่าตอนนี้หลักการนี้ไม่ใช้กับบริษัทยักษ์ใหญ่ของสหรัฐแล้ว
- คำอธิบายที่ว่า DeepSeek กับ GLM ราคาถูกเพราะต้องแข่งกับราคา token ที่ต่ำแบบเหลือเชื่อในจีน ฟังไม่ขึ้นเลย
  DeepSeek และ GLM เป็น open weights และผู้ให้บริการ inference ในสหรัฐก็ขายถูกกว่านี้มากอยู่แล้ว ที่ราคาถูกเป็นเพราะโมเดลมีประสิทธิภาพมากกว่า
- ถ้ากำลังพูดว่าพวกเขารวมบัญชี Claude Max 5x แล้วขายต่อความจุ ใช้การฉ้อโกงการจ่ายเงิน และขายเอาต์พุตของโมเดลให้หลายสถาบันวิจัยในจีน แบบนั้นมันถูกกว่าการหาบัญชีมาใช้เองโดยตรงหรือ
  ถ้าไม่ใช่ มันก็ฟังดูเหมือนคำพูดที่สายหมี AI ชอบพูดกันว่า “Anthropic/OpenAI กำลังขาย token มูลค่า 1,000 ดอลลาร์ในราคา 100 ดอลลาร์แล้วเสียเงินมหาศาล”
- Anthropic น่าจะเอา Mythos มาใช้จัดการปัญหาผู้ค้าต่อแบบตรง ๆ ได้ ซื้อหลายบัญชีผ่านผู้ค้าต่อ ส่งข้อความที่มี UID แฝงไว้ ตรวจจับจากล็อกของ Anthropic จากนั้นปิดบัญชี แล้วใช้ metadata เพื่อหาบัญชีที่เชื่อมโยงกัน วนลูปแบบนี้ไปเรื่อย ๆ
- จริง ๆ แล้วผู้ค้าต่อพวกนั้นก็แค่เอา Kimi K2.5 หรือ GLM5.1 มาหลอกขายว่าเป็น Opus เท่านั้นเอง คนจีนรู้จักเกมของปลอมในหลายอุตสาหกรรมมานานแล้ว
การกระทำของ Alibaba ถูกอธิบายว่าเป็นความพยายามด้าน “distillation” ซึ่ง Anthropic บอกว่าหมายถึงการใช้เอาต์พุตของโมเดลที่เก่งกว่าไปฝึกโมเดลที่ด้อยกว่า
Claude ใช้คอนเทนต์ระดับเทราไบต์เพื่อฝึกโมเดลของตัวเองโดยไม่ได้รับอนุญาต แล้วบอกว่าไม่เป็นไร แต่ตอนนี้กลับร้องว่าไม่ยุติธรรมเมื่อมีคนเอาเอาต์พุตของ Claude ไปฝึกโมเดล
- ไม่ใช่ว่ามันไม่เป็นไร ต้องจ่ายไป 1 พันล้านดอลลาร์
น่ารอดูคดีที่ Anthropic ต้องเปิดเผยแหล่งที่มาของข้อมูลฝึก และอธิบายว่าทำไมตัวเองถึงมีสิทธิ์นำข้อมูลฝึกที่ถูกนำมาใช้ซ้ำมาขายให้ลูกค้าได้ แต่ Alibaba ที่ฝึกโมเดลของตัวเองด้วยโมเดลของ Anthropic กลับทำไม่ได้
น่าจะสนุกดี
- เปิดเผยไปแล้ว และจ่ายไป 1.5 พันล้านดอลลาร์: https://authorsguild.org/advocacy/artificial-intelligence/wh...
- ถ้ามีซอร์ส GPL อยู่ในนั้นแม้แต่ไฟล์เดียว ก็ต้องเปิดเผย weights ภายใต้ สัญญาอนุญาต GPL
- การก้าวร้าวและส่งเสียงดังทำกำไรได้มากกว่าการมีตรรกะที่สอดคล้องกัน
- เข้าใจความรู้สึกนั้น แต่เมื่อดูจากสถานะระหว่างประเทศและความสัมพันธ์อันซับซ้อนของคู่กรณีแล้ว ก็ดูมีโอกาสน้อยที่เรื่องจะไปถึงศาลจริง ๆ
  การกระทำของ Anthropic ดูเหมือนเป็นท่าทีเชิงสัญลักษณ์มากกว่า คนอื่น ๆ ก็เดาไปแล้วว่ากำลังส่งสัญญาณให้ผู้ชมกลุ่มไหน
ตกลงแล้วอะไรกันแน่ที่ผิดกฎหมาย
ในทางกฎหมาย เอาต์พุตของโมเดลไม่อาจได้รับความคุ้มครองเป็นทรัพย์สินทางปัญญาได้ ไม่ว่าจะตามกฎหมายภายในประเทศหรือกฎหมายระหว่างประเทศ สิ่งที่คาดหวังได้มากที่สุดคือการเยียวยาทางแพ่ง แต่เมื่อพิจารณาว่าวิธีที่พวกเขาใช้ฝึกโมเดลนั้นผิดกฎหมายอย่างตรงตัวอยู่แล้ว แม้แต่เรื่องนั้นก็ดูเกินไป
Anthropic ก็แค่ถูกปฏิบัติแบบเดียวกับที่ตัวเองเคยทำกับทุกคน พวกเขาปูที่นอนเอง ก็ต้องนอนบนมันเอง
- Anthropic เป็นเจ้าแห่ง Newspeak ก่อนหน้านี้กับเรื่อง Mythos ก็เคยเปลี่ยนคำเรียก bug ให้เป็นช่องโหว่มาแล้ว distillation เป็นแค่การละเมิดข้อกำหนดการให้บริการ ซึ่งเป็นประเด็นทางแพ่ง ไม่ใช่อาชญากรรม ไม่ได้ผิดกฎหมาย และไม่ได้ละเมิดกฎหมาย
การกระทำของ Alibaba ถูกเรียกว่า “distillation” คือการฝึกโมเดลที่อ่อนกว่าด้วยผลลัพธ์จากโมเดลที่แข็งแกร่งกว่า แต่ไม่เข้าใจว่ามันผิดตรงไหน
Anthropic บอกว่าแคมเปญนี้ดำเนินมาตั้งแต่ 22 เมษายน 2026 ถึง 5 มิถุนายน และสร้างการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้งผ่านบัญชีหลอกลวงเกือบ 25,000 บัญชี
อะไรทำให้บัญชีเหล่านั้นเป็นบัญชีหลอกลวง ถ้าจ่ายในราคาที่ตกลงกันไว้แล้วก็น่าจะโอเคไม่ใช่หรือ ถ้าไม่จ่ายเงิน แล้วทำไม Anthropic ถึงให้บริการ
- อะไรทำให้มันเป็นบัญชีหลอกลวงน่ะเหรอ? อาจเป็นเพราะใช้ ตัวตนปลอม และมีการหลอกลวงโดยรวมเกี่ยวกับวัตถุประสงค์การใช้งาน
- เพราะข้อกำหนดการให้บริการของ Anthropic มีเงื่อนไขมากกว่าแค่ “จ่ายเงินแล้วจะใช้บริการเพื่อจุดประสงค์อะไรก็ได้” มาก
- หรือจะอ่านร่องรอยการให้เหตุผลแล้วเรียนรู้ด้วยตัวเองก็ได้นะ? /s
โดยพื้นฐานแล้ว distillation ป้องกันไม่ได้ ทำได้แค่ทำให้ช้าลงเท่านั้น ลองแย้งมาสิ
สุดท้ายบริษัทจีนก็คงปล่อยส่วนขยายแบบ Honey ออกมา แล้วอาศัยลูกค้าที่ไม่ใช่จีนตัวจริงเป็นหน้าฉาก ก่อนจะส่งทุกอย่างกลับไปจีนอยู่ดี
เกมจบแล้ว
- สำหรับการป้องกันการ distill ความสามารถบางอย่าง เช่น การเขียนโค้ดหรือการหาช่องโหว่ ตอนนี้สายเกินไปแล้ว [1]
  แต่แล็บ AI ก็ยังสามารถสร้างมูลค่าทางเศรษฐกิจมหาศาลต่อไปได้โดยไม่ต้องเปิดเผยโมเดลให้เสี่ยงต่อการถูก distill เช่น ใช้โมเดลภายในองค์กรเท่านั้นเพื่อพัฒนายารักษาโรค
  หวังว่าสักวันจะมีอนาคตที่คนอื่นเข้าถึงโมเดลระดับแนวหน้าได้ด้วย แต่ถ้าตัดสินว่าการป้องกันการแพร่กระจายผ่าน distillation สำคัญกว่า ก็อาจไม่จำเป็นต้องเป็นแบบนั้น
  [1]: อ้างอิงเรื่อง distillation ใน https://dualuse.dev/posts/export-controls-on-fable
- สิ่งที่ยังไม่ค่อยเข้าใจคือ distillation ที่เราเห็นดูเหมือนเกิดขึ้นในจีนเท่านั้น อะไรที่ขัดขวางไม่ให้บริษัทเทคโนโลยีในสหราชอาณาจักรหรือเยอรมนี distill Claude, GPT ฯลฯ กันบ้าง หรือเป็นแค่เพราะความสามารถยังไม่พอ
  ประเด็นคืออาจไม่มีทางแก้เชิงเทคนิค แต่ในทางทฤษฎีอาจมี ทางแก้เชิงการเมือง
- ตราบใดที่โมเดลยังพัฒนาต่อไป โมเดลที่ได้จาก distillation ก็ย่อมตามหลังอย่างหลีกเลี่ยงไม่ได้ โมเดลยังพัฒนาอยู่เรื่อย ๆ วันหนึ่งในอนาคตมันอาจจบลงก็ได้
  งานของ Berkeley เรื่อง “False Promise of Imitating Proprietary LLMs” ก็เห็นว่าการเลียนแบบช่วยลดช่องว่างด้านสไตล์ได้เร็ว แต่ ช่องว่างด้านความสามารถ ยังเหลืออยู่มาก
  https://arxiv.org/abs/2305.15717
- นึกเหตุผลไม่ออกเลยด้วยซ้ำว่าทำไมถึงจะถือว่ามันผิด
- ก็เหมือนกับการห้าม web scraping ไม่ได้นั่นแหละ ลองแย้งมาสิ

Anthropic ระบุว่า “Alibaba ลักลอบดึงความสามารถของโมเดล Claude AI ออกไป”

ข้อกล่าวหาเรื่องการดึงข้อมูลอย่างผิดกฎหมายที่เกี่ยวข้องกับ Alibaba

วิธี distillation และขนาดของการโจมตี

ข้ออ้างเรื่องความเชื่อมโยงกับ Alibaba Qwen และผู้รับจดหมาย

กรณีก่อนหน้าของสถาบันวิจัย AI จีน

มาตรการของรัฐบาลสหรัฐและข้อจำกัดต่อโมเดลของ Anthropic

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความเห็นจาก Hacker News