1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ก่อนการไต่สวน AI ของวุฒิสภาสหรัฐ Anthropic อ้างว่ากิจกรรมที่เกี่ยวข้องกับ Alibaba เป็นการโจมตีลักษณะเดียวกันที่มุ่งเป้ามายังบริษัทซึ่งมีขนาด ใหญ่ที่สุด เท่าที่เคยพบ
  • วิธีการหลักคือ การกลั่นแบบจำลอง (distillation) ซึ่งใช้เอาต์พุตของโมเดลที่แข็งแกร่งกว่ามาฝึกโมเดลที่อ่อนกว่า โดย Anthropic มองว่าจีนอาจไปถึงความสามารถระดับ Mythos Preview ได้เร็วขึ้น
  • ระหว่างวันที่ 22 เมษายน 2026 ถึง 5 มิถุนายน 2026 มีการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้ง และมีบัญชีปลอมเกือบ 25,000 บัญชี
  • Anthropic อ้างว่าผู้ดำเนินการมีความเชื่อมโยงกับ Alibaba และสถาบันวิจัย AI Alibaba Qwen ขณะที่ Alibaba ไม่ได้ตอบคำขอความเห็นจาก Reuters ในทันที
  • Anthropic สนับสนุนการ แบ่งปันข่าวกรองภัยคุกคาม และการตอบสนองร่วมกันระหว่างรัฐบาลสหรัฐกับบริษัท AI ภาคเอกชน แต่ในช่วงเวลาใกล้เคียงกัน โมเดล Mythos และ Fable ของบริษัทก็ถูกจำกัดการเข้าถึงเช่นกัน

ข้อกล่าวหาเรื่องการดึงข้อมูลอย่างผิดกฎหมายที่เกี่ยวข้องกับ Alibaba

  • Anthropic ระบุในจดหมายที่ส่งถึงวุฒิสภาสหรัฐว่า บริษัทเทคโนโลยีและอีคอมเมิร์ซจีน Alibaba ได้ลักลอบดึงความสามารถของโมเดล Claude AI ออกไปอย่างผิดกฎหมาย
  • ตามจดหมายที่ Reuters ได้เห็น Anthropic ประเมินว่ากิจกรรมครั้งนี้เป็นการโจมตีลักษณะเดียวกันที่มีขนาด ใหญ่ที่สุด ที่บริษัทเคยยืนยันได้
  • Alibaba ไม่ได้ตอบคำขอความเห็นจาก Reuters ในทันที

วิธี distillation และขนาดของการโจมตี

  • Anthropic ระบุว่ากิจกรรมดังกล่าวเป็นความพยายามทำ distillation
    • distillation คือวิธีที่ใช้เอาต์พุตของโมเดลที่ทรงพลังกว่ามาฝึกโมเดลที่อ่อนกว่าค่อนข้างมาก
  • ช่วงเวลาของแคมเปญคือ 22 เมษายน 2026 ถึง 5 มิถุนายน 2026
  • ในช่วงนี้มีการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้ง
  • มีการใช้บัญชีปลอมเกือบ 25,000 บัญชี
  • Anthropic มองว่า distillation เป็นวิธีที่ช่วยให้จีนเร่งความเร็วในการไปถึงความสามารถขั้นสูงระดับ Mythos Preview ของ Anthropic

ข้ออ้างเรื่องความเชื่อมโยงกับ Alibaba Qwen และผู้รับจดหมาย

  • Anthropic อ้างว่าแคมเปญนี้ดำเนินการโดยผู้ปฏิบัติการที่เชื่อมโยงกับ Alibaba และสถาบันวิจัย AI ของ Alibaba อย่าง Alibaba Qwen
  • จดหมายลงวันที่ 10 มิถุนายน
  • ผู้รับคือ Tim Scott และ Elizabeth Warren ซึ่งเป็นประธานและกรรมการอาวุโสของคณะกรรมาธิการการธนาคารของวุฒิสภาสหรัฐ
  • จดหมายฉบับนี้ถูกส่งก่อนการ ไต่สวน AI ที่กำหนดไว้

กรณีก่อนหน้าของสถาบันวิจัย AI จีน

  • Anthropic เคยเปิดเผยว่าในเดือนกุมภาพันธ์ 2026 บริษัทได้ระบุแคมเปญที่สตาร์ตอัป AI จีน DeepSeek และสถาบันวิจัย AI จีนอีก 2 แห่งพยายามดึงความสามารถออกจากแพลตฟอร์ม Claude AI อย่างผิดกฎหมาย
  • ขนาดที่ Anthropic ระบุในครั้งนั้นมีดังนี้
    • DeepSeek: การโต้ตอบมากกว่า 150,000 ครั้ง
    • Moonshot AI: มากกว่า 3.4 ล้านครั้ง
    • MiniMax: มากกว่า 13 ล้านครั้ง
  • Anthropic ระบุในตอนนั้นว่าความ เข้มข้นและความซับซ้อน ของแคมเปญเหล่านี้กำลังเพิ่มขึ้น และจำเป็นต้องมีการตอบสนองอย่างรวดเร็วและประสานกันจากอุตสาหกรรม ผู้กำหนดนโยบาย และชุมชน AI ทั่วโลก

มาตรการของรัฐบาลสหรัฐและข้อจำกัดต่อโมเดลของ Anthropic

  • Anthropic ระบุว่าสนับสนุนความพยายามตอบสนองของรัฐบาลสหรัฐ
    • รวมถึงการ แบ่งปันข่าวกรองภัยคุกคาม กับบริษัท AI ภาคเอกชน
    • และกิจกรรมตอบสนองร่วมอื่น ๆ
  • ในเดือนเมษายน 2026 ทำเนียบขาวกล่าวหาว่าจีนกำลังขโมยทรัพย์สินทางปัญญาของสถาบันวิจัย AI สหรัฐในระดับ อุตสาหกรรม
  • ในเดือนเดียวกัน Alibaba ถูกเพิ่มเข้าไปใน รายชื่อบริษัททหารจีน ของกระทรวงกลาโหมสหรัฐ และ Alibaba กำลังโต้แย้งการกำหนดสถานะดังกล่าว
  • กระทรวงพาณิชย์สหรัฐชะลอการขึ้นบัญชีดำทางการค้าต่อ DeepSeek แม้ว่าหน่วยงานร่วมของรัฐบาลจะมองว่าเป็นความเสี่ยงด้านความมั่นคงแห่งชาติ โดยพยายามหลีกเลี่ยงการยกระดับความตึงเครียดกับ Beijing
  • สองวันหลังจาก Anthropic ส่งจดหมาย คือวันที่ 12 มิถุนายน กระทรวงพาณิชย์สหรัฐได้กำหนดข้อจำกัดต่อโมเดล AI ล่าสุดของ Anthropic ได้แก่ Mythos และ Fable
    • ทางการกังวลว่าโมเดลเหล่านี้อาจถูกนำไปใช้งานโดยผู้ใช้ด้านข่าวกรองทางทหารในจีนและประเทศอื่นที่น่ากังวล
    • ข้อจำกัดนี้ทำให้ Anthropic ปิดการเข้าถึงทั่วโลก สำหรับโมเดลเหล่านี้

1 ความคิดเห็น

 
GN⁺ 4 시간 전
ความเห็นจาก Hacker News
  • เอามาทิ้งไว้ตรงนี้: “ผู้พิพากษาตัดสินว่า การที่ Anthropic ดาวน์โหลดหนังสือจากเว็บเถื่อนอย่าง LibGen มากกว่า 7 ล้านเล่ม ถือเป็นการละเมิด และยังยกคำแก้ต่างเรื่อง ‘เพื่อการวิจัย’ ของ Anthropic ทิ้งด้วย: ‘คุณจะอวยพรให้ตัวเองว่ามีจุดประสงค์เพื่อการวิจัย แล้วหยิบตำราเล่มไหนก็ได้ตามใจไม่ได้’”
    https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...

    • ช่วงแรก ๆ ของบริการสตรีมเพลง ผู้เล่นหน้าใหม่หลายรายก็เติมบริการของตัวเองด้วยคลังคอนเทนต์ ละเมิดลิขสิทธิ์ ขนาดมหาศาล ผู้ชนะคือรายที่ไปทำสัญญากับเจ้าของลิขสิทธิ์ก่อน แล้วค่อยไล่จัดการส่วนที่เหลือ
    • มันไม่น่าขำเหรอ เวลาถามเนื้อเพลง โมเดลพวกนี้ก็จู่ ๆ ดัน จำเนื้อหาที่มีลิขสิทธิ์ ขึ้นมาได้
    • แล้วแบบนี้ไม่ต้อง ทิ้งโมเดล ที่ฝึกจากหนังสือพวกนั้นด้วยเหรอ
    • มัน “สกัด” “ความสามารถ” ออกมาจากหนังสือพวกนั้นได้มากแค่ไหนกันนะ
    • “คุณกำลังลักพาตัวของที่ฉันขโมยมาอย่างถูกต้องนะสิ!”
  • โดยพื้นฐานแล้วการ distillation มีอยู่สองแบบ 1) วิธีทื่อ ๆ แบบสเกลใหญ่ คือโยนคำถามเข้าไปแล้วใช้คำตอบเป็นสัญญาณเสริมแรง (black box) 2) การ distillation ที่เจาะจงกว่าซึ่งโมเดลหนึ่งสอน ฝึก และชี้นำอีกโมเดลโดยตรง (RLAIF)
    แบบหลังนี้โดยแก่นแล้วก็คือการปรับจูนโมเดลอย่างละเอียดโดยมีอีกโมเดลเป็นคนชี้ทิศ หลายบริษัททำ fine-tuning แบบนี้กันทุกวัน สถาบันวิจัยในจีนก็น่าจะแทบจะแน่นอนว่าใช้วิธีนี้เหมือนกัน เพราะมันให้ผลกับผลลัพธ์สุดท้ายดีกว่าการไปขูดเอาคำตอบง่าย ๆ จากคำถามง่าย ๆ มาก
    การบ่นเรื่อง distillation แบบนี้ทำให้ปัญหาดูใหญ่เกินจริง และดูเหมือนเป้าหมายคือผลักดันเชิงกีดกันการค้าให้รัฐบาลสหรัฐไปสกัดหรือแบนผู้ให้บริการโมเดลจากจีน พวกเขาเรียกร้องให้คุมเข้มการส่งออกชิปไปแล้ว ซึ่งก็น่าขำเมื่อ DeepSeek v4 ถูกออกแบบมาให้รันบนชิป Huawei และบริษัทจีนรายอื่นก็กำลังเดินตาม แต่พูดตรง ๆ แบบนั้นไม่ได้ ก็เลยอ้างแทนว่าโมเดลที่ผ่านการ distill อาจไม่ปลอดภัยเท่าโมเดลของตัวเอง จึงต้องเพิ่มมาตรการควบคุมการส่งออก ทั้งที่ถ้าคุณโชว์ jailbreak ที่ทะลุ guardrail ของโมเดลตัวเองได้ สุดท้ายพวกเขาก็จะบอกว่าไม่ต้องกังวลเรื่องความปลอดภัย เพราะไม่ว่าโมเดลไหนก็โดน jailbreak ได้อยู่ดี

    • ส่วนที่บอกว่า “การบ่นเรื่อง distillation ทำให้ปัญหาดูใหญ่เกินจริง” นั้นถูกต้อง แต่ที่น่าเสียดายคือบทความ Reuters เองก็มีส่วนร่วมใน การทำให้เป็นดราม่า นี้ด้วย ย่อหน้าแรกเอาคำเรียกของ Anthropic ที่ว่าการ distillation เป็น “การโจมตี” มาใช้ซ้ำโดยไม่ใส่เครื่องหมายคำพูด ทำให้ผู้อ่านจับได้ยากว่านี่เป็นกรอบภาษาจากฝั่งบริษัทเอง การ distillation ไม่ใช่การโจมตี
    • อาจเป็นคำถามงี่เง่า แต่ผมเข้าใจว่าโมเดลพวกนี้ฝึกด้วยข้อมูลระดับเพตะไบต์ ปริมาณคำถาม/คำตอบที่สกัดได้จากการ query โมเดลใหญ่กว่าอย่าง Claude น่าจะมีจำกัดพอสมควร เมื่อเทียบกับชุดข้อมูลฝึกแล้วมันไม่ใช่แค่ หยดน้ำหยดเดียว เหรอ
    • https://research.nvidia.com/labs/lpr/slm-agents/ — ข้อมูลสำหรับ distillation เป็นผลพลอยได้ที่เกิดขึ้นเองตามธรรมชาติถ้าใช้โมเดลแบบนี้ ไม่มีวิธีป้องกันที่ได้ผล Anthropic กำลังพยายามชะลอเรื่องนี้และซ่อนภายในโมเดลด้วยการทำให้ บล็อกความคิด เสื่อมสภาพเหลือแค่สรุป แต่สุดท้ายในเชิงคณิตศาสตร์มันไม่มีทางออก และในระดับบริษัทข้ามชาติ/บริษัทยักษ์ใหญ่ มันก็ใช้ได้ผลดีพออยู่ดี ทันทีที่ต้นทุนกลายเป็นสิ่งสำคัญเป็นอันดับต้น ๆ แรงล็อกอินที่จะมัดลูกค้าไว้ก็หายไป
    • พวกเขากำลังอ้างอยู่สองข้อ 1) jailbreak สาธารณะตัวหนึ่งที่มีอยู่ใน Fable 5 นั้นไม่เป็นอันตราย และผู้เชี่ยวชาญหลายคนก็ยืนยันแล้ว โดยไม่มีหลักฐานที่น่าเชื่อถือมาคัดค้าน ดังนั้น Anthropic น่าจะถูก
      2) เป็นไปไม่ได้ที่จะสร้างโมเดลภาษาขนาดใหญ่ที่มีภูมิคุ้มกันต่อ jailbreak ทุกแบบ ซึ่งเรื่องนี้ก็ไม่มีหลักฐานที่น่าเชื่อถือมาหักล้างเช่นกัน ดังนั้น Anthropic ถูกเต็ม ๆ
      ถ้าข้อ 1 ไม่จริง ก็แค่เปิดเผยรายละเอียดของ jailbreak ออกมาได้เลย เพราะตามที่กล่าวกันมันใช้ได้กับ Fable 5 เท่านั้น จึงไม่มีความเสี่ยงที่เป็นไปได้ด้วยซ้ำ
      ถ้าข้อ 2 ไม่จริง ห้องแล็บ LLM อื่นก็น่าจะทำสำเร็จไปแล้ว โดยเฉพาะเมื่อหลายรัฐบาลก็แสดงชัดเจนว่ามีตลาดสำหรับโครงการแบบนั้น
    • ถ้าคุณกำลังทำ evaluation อยู่ ในทางปฏิบัติก็แทบไม่ต่างจากทำ RLAIF เพียงแค่ไม่ได้เอาไปฝึกโมเดล คุณกำลังดูแค่ผลลัพธ์เท่านั้น
      โดยพื้นฐานแล้ว ถ้ายังอยากให้โมเดล AI มีประโยชน์อยู่ การป้องกันสิ่งนี้ทำได้ยากมาก
  • มันทำให้นึกถึงเรื่องเล่าช่วงกลางถึงปลายทศวรรษ 1980 ที่ Steve Jobs บ่นว่า Mac GUI ถูกลอก ทั้งที่เขาเองก็ไม่ได้ยอมรับอย่างเปิดเผยถึงงานที่ทำไว้ใน ระบบปฏิบัติการ Xerox Alto และ Star
    “คุณกำลังจะลอกของที่ฉันลอกมาแล้วนะ!”
    ภาพมันก็เหมือนกับการ crawl อินเทอร์เน็ตทั้งก้อนเพื่อสร้าง LLM ขนาดมหึมา แล้วมาบ่นว่าตัวเองถูกก๊อบปี้

    • น่าจะหมายถึงคำพูดนี้ที่มักยกให้ Bill Gates: “คือแบบนี้นะ Steve ผมว่าเรื่องนี้มองได้มากกว่ามุมเดียว เราสองคนต่างก็มีเพื่อนบ้านรวยชื่อ Xerox และมันใกล้เคียงกับสถานการณ์ที่ผมแอบเข้าไปขโมยทีวี แต่กลับพบว่าคุณขโมยไปก่อนแล้ว”
    • Apple ให้ Xerox มีสิทธิซื้อ หุ้นก่อน IPO มูลค่า 1 ล้านดอลลาร์ ก่อนที่จะมีการประชุมนั้นเกิดขึ้น
    • ใช่แล้ว วงการ AI ทั้งวงการมีแต่คนลอกกันเอง มันเริ่มจากบริษัท AI กลืนข้อมูลที่ผู้คนสายเทคนิคหรือสายอุดมการณ์แบ่งปันไว้บนอินเทอร์เน็ตตลอด 40 ปีที่ผ่านมาเพื่อช่วยมนุษย์คนอื่น จากนั้นก็กินทั้งของเถื่อนและเนื้อหามีลิขสิทธิ์ และตอนนี้บริษัท AI ก็กำลังลอกกันเองอีก
      ข้อมูลนั้นอยากเป็นอิสระจริง ๆ แต่บริษัท AI อยากเป็นคนเฝ้าประตู ในระยะยาวผมคิดว่าแนวทางที่ยั่งยืนกว่าคือ open weights จะเป็นฝ่ายชนะ
    • LLM ทุกตัวบูชา Jon Skeet เป็นพระเจ้า
    • “คุณกำลังลักพาตัวของที่ฉันขโมยมาอย่างถูกต้องนะสิ!”
  • น่าขำจริง ๆ ที่ Anthropic บ่นว่า “มีการสกัดความสามารถของโมเดล Claude AI อย่างผิดกฎหมาย” พร้อมกับสนับสนุนคำกล่าวหาจากทำเนียบขาวที่ว่าจีน “ขโมยทรัพย์สินทางปัญญาของห้องแล็บ AI สหรัฐในระดับอุตสาหกรรม”
    Anthropic, OpenAI, Google, Microsoft และรายอื่น ๆ ฝึกโมเดลโดยกวาดเก็บคอนเทนต์ทุกอย่างเท่าที่หาได้ พร้อมเมินสิทธิของเจ้าของลิขสิทธิ์ แล้วตอนนี้หนึ่งในนั้นกำลังโวยว่ามันไม่ยุติธรรมที่คนอื่นทำในสิ่งเดียวกับที่พวกเขาทำกันมาหรือ

    • ดูเหมือนว่าบริษัท AI จะมองว่าสิ่งทุกอย่างบนอินเทอร์เน็ตเป็นของฟรี ยกเว้นของตัวเองเท่านั้น การถล่มเว็บไซต์สุ่มด้วย AI crawler, เมิน robots.txt, และทำให้ค่าแบนด์วิดท์พุ่งสูงถือว่าไม่เป็นไร แต่ถ้าแนวปฏิบัติการเก็บข้อมูลทำให้ผู้ให้บริการ AI ต้องมีต้นทุนขึ้นมา แบบนั้นกลับถูกมองว่ายอมรับไม่ได้อย่างชัดเจน
    • ตามกฎหมายปัจจุบัน เอาต์พุตของ Claude เป็น สาธารณสมบัติ จึงไม่ใช่กรณีเดียวกันเป๊ะ ๆ ดังนั้นฝั่งจีนไม่ได้ขโมยอะไรไปจากเรื่องนี้เลย
    • ของคุณคือของฉัน และของฉันก็ยังเป็นของฉันอยู่ดี
    • ในหมู่โจรไม่มีคำว่าศักดิ์ศรี
  • สิ่งที่กำลังเกิดขึ้นตอนนี้คือ: ผู้ค้าต่อในจีนกำลังขาย Claude token ในราคาต่ำกว่าราคา Anthropic API อย่างเป็นทางการ 70~90% พวกเขาทำได้โดยการรวมบัญชี Claude Max แล้วขายต่อความจุ ใช้การฉ้อโกงการชำระเงิน และขายต่อเอาต์พุตของโมเดลกับ chain-of-thought ให้กับสถาบันวิจัยหลายแห่งในจีน ผู้ค้าพวกนี้ช่วยให้เข้าถึงโมเดลแลกกับการได้รับล็อกผู้ใช้และร่องรอยการอนุมาน แล้วนำสิ่งนั้นไปขายเป็นข้อมูลฝึก ทำให้ดำเนินการได้ต่ำกว่าต้นทุน
    ทั้ง Claude และ ChatGPT ถูกบล็อกในจีน ต้องใช้ VPN ถึงจะเข้าได้ และก็จ่ายเงินด้วยบัตรธนาคารจีนไม่ได้ เพราะงั้นคนส่วนใหญ่ที่อยากเข้าถึง Claude จึงซื้อสิทธิ์เข้าถึงผ่านผู้ค้าต่อ นี่คือวิธีที่ง่ายและถูกที่สุดในการเข้าถึงโมเดลของ Anthropic ในจีน
    ผู้ค้าต่อเหล่านี้รันบัญชีบอตนับหมื่นบัญชี และนี่ก็เป็นเหตุผลที่ Anthropic เริ่มใช้การยืนยันตัวตนเพื่อชะลอการบุกของบอต
    ผู้ค้าต่อ token รายหนึ่งเสนอ Opus 4.8 ที่ลดราคา 93% จากค่า API ทางการ: https://yunwu.ai/pricing?provider=Anthropic
    นี่เป็นหนึ่งในเหตุผลที่ DeepSeek และ GLM มีราคาถูกมาก เพราะต้องแข่งขันกับราคา token ที่ต่ำจนน่าเหลือเชื่อในจีน จึงต้องกดราคาให้ต่ำเพื่อให้คนใช้งาน
    เคยแชร์เรื่องนี้ไปเมื่อไม่กี่เดือนก่อน แต่แทบไม่มีใครสนใจ นี่คือบทความที่อธิบายเศรษฐกิจการขายต่อ token ในจีนได้ยอดเยี่ยมมาก: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...

    • ถือเป็นเรื่องดีต่อการแข่งขัน ผู้ขายจีนเสนอทางออกที่ถูกกว่า ซึ่งก็คือ ตลาดเสรี ตามที่ฉันเคยเรียนในเศรษฐศาสตร์
      ฉันยังเคยเรียนอีกว่า ถ้า Anthropic อยากแข่งขันก็ต้องทำงานของตัวเองให้ดีกว่านี้ ไม่อย่างนั้นก็จะมีคนอื่นชนะ
      หรือว่าตอนนี้หลักการนี้ไม่ใช้กับบริษัทยักษ์ใหญ่ของสหรัฐแล้ว
    • คำอธิบายที่ว่า DeepSeek กับ GLM ราคาถูกเพราะต้องแข่งกับราคา token ที่ต่ำแบบเหลือเชื่อในจีน ฟังไม่ขึ้นเลย
      DeepSeek และ GLM เป็น open weights และผู้ให้บริการ inference ในสหรัฐก็ขายถูกกว่านี้มากอยู่แล้ว ที่ราคาถูกเป็นเพราะโมเดลมีประสิทธิภาพมากกว่า
    • ถ้ากำลังพูดว่าพวกเขารวมบัญชี Claude Max 5x แล้วขายต่อความจุ ใช้การฉ้อโกงการจ่ายเงิน และขายเอาต์พุตของโมเดลให้หลายสถาบันวิจัยในจีน แบบนั้นมันถูกกว่าการหาบัญชีมาใช้เองโดยตรงหรือ
      ถ้าไม่ใช่ มันก็ฟังดูเหมือนคำพูดที่สายหมี AI ชอบพูดกันว่า “Anthropic/OpenAI กำลังขาย token มูลค่า 1,000 ดอลลาร์ในราคา 100 ดอลลาร์แล้วเสียเงินมหาศาล”
    • Anthropic น่าจะเอา Mythos มาใช้จัดการปัญหาผู้ค้าต่อแบบตรง ๆ ได้ ซื้อหลายบัญชีผ่านผู้ค้าต่อ ส่งข้อความที่มี UID แฝงไว้ ตรวจจับจากล็อกของ Anthropic จากนั้นปิดบัญชี แล้วใช้ metadata เพื่อหาบัญชีที่เชื่อมโยงกัน วนลูปแบบนี้ไปเรื่อย ๆ
    • จริง ๆ แล้วผู้ค้าต่อพวกนั้นก็แค่เอา Kimi K2.5 หรือ GLM5.1 มาหลอกขายว่าเป็น Opus เท่านั้นเอง คนจีนรู้จักเกมของปลอมในหลายอุตสาหกรรมมานานแล้ว
  • การกระทำของ Alibaba ถูกอธิบายว่าเป็นความพยายามด้าน “distillation” ซึ่ง Anthropic บอกว่าหมายถึงการใช้เอาต์พุตของโมเดลที่เก่งกว่าไปฝึกโมเดลที่ด้อยกว่า
    Claude ใช้คอนเทนต์ระดับเทราไบต์เพื่อฝึกโมเดลของตัวเองโดยไม่ได้รับอนุญาต แล้วบอกว่าไม่เป็นไร แต่ตอนนี้กลับร้องว่าไม่ยุติธรรมเมื่อมีคนเอาเอาต์พุตของ Claude ไปฝึกโมเดล

    • ไม่ใช่ว่ามันไม่เป็นไร ต้องจ่ายไป 1 พันล้านดอลลาร์
  • น่ารอดูคดีที่ Anthropic ต้องเปิดเผยแหล่งที่มาของข้อมูลฝึก และอธิบายว่าทำไมตัวเองถึงมีสิทธิ์นำข้อมูลฝึกที่ถูกนำมาใช้ซ้ำมาขายให้ลูกค้าได้ แต่ Alibaba ที่ฝึกโมเดลของตัวเองด้วยโมเดลของ Anthropic กลับทำไม่ได้
    น่าจะสนุกดี

    • เปิดเผยไปแล้ว และจ่ายไป 1.5 พันล้านดอลลาร์: https://authorsguild.org/advocacy/artificial-intelligence/wh...
    • ถ้ามีซอร์ส GPL อยู่ในนั้นแม้แต่ไฟล์เดียว ก็ต้องเปิดเผย weights ภายใต้ สัญญาอนุญาต GPL
    • การก้าวร้าวและส่งเสียงดังทำกำไรได้มากกว่าการมีตรรกะที่สอดคล้องกัน
    • เข้าใจความรู้สึกนั้น แต่เมื่อดูจากสถานะระหว่างประเทศและความสัมพันธ์อันซับซ้อนของคู่กรณีแล้ว ก็ดูมีโอกาสน้อยที่เรื่องจะไปถึงศาลจริง ๆ
      การกระทำของ Anthropic ดูเหมือนเป็นท่าทีเชิงสัญลักษณ์มากกว่า คนอื่น ๆ ก็เดาไปแล้วว่ากำลังส่งสัญญาณให้ผู้ชมกลุ่มไหน
  • ตกลงแล้วอะไรกันแน่ที่ผิดกฎหมาย
    ในทางกฎหมาย เอาต์พุตของโมเดลไม่อาจได้รับความคุ้มครองเป็นทรัพย์สินทางปัญญาได้ ไม่ว่าจะตามกฎหมายภายในประเทศหรือกฎหมายระหว่างประเทศ สิ่งที่คาดหวังได้มากที่สุดคือการเยียวยาทางแพ่ง แต่เมื่อพิจารณาว่าวิธีที่พวกเขาใช้ฝึกโมเดลนั้นผิดกฎหมายอย่างตรงตัวอยู่แล้ว แม้แต่เรื่องนั้นก็ดูเกินไป
    Anthropic ก็แค่ถูกปฏิบัติแบบเดียวกับที่ตัวเองเคยทำกับทุกคน พวกเขาปูที่นอนเอง ก็ต้องนอนบนมันเอง

    • Anthropic เป็นเจ้าแห่ง Newspeak ก่อนหน้านี้กับเรื่อง Mythos ก็เคยเปลี่ยนคำเรียก bug ให้เป็นช่องโหว่มาแล้ว distillation เป็นแค่การละเมิดข้อกำหนดการให้บริการ ซึ่งเป็นประเด็นทางแพ่ง ไม่ใช่อาชญากรรม ไม่ได้ผิดกฎหมาย และไม่ได้ละเมิดกฎหมาย
  • การกระทำของ Alibaba ถูกเรียกว่า “distillation” คือการฝึกโมเดลที่อ่อนกว่าด้วยผลลัพธ์จากโมเดลที่แข็งแกร่งกว่า แต่ไม่เข้าใจว่ามันผิดตรงไหน
    Anthropic บอกว่าแคมเปญนี้ดำเนินมาตั้งแต่ 22 เมษายน 2026 ถึง 5 มิถุนายน และสร้างการโต้ตอบกับ Claude มากกว่า 28.8 ล้านครั้งผ่านบัญชีหลอกลวงเกือบ 25,000 บัญชี
    อะไรทำให้บัญชีเหล่านั้นเป็นบัญชีหลอกลวง ถ้าจ่ายในราคาที่ตกลงกันไว้แล้วก็น่าจะโอเคไม่ใช่หรือ ถ้าไม่จ่ายเงิน แล้วทำไม Anthropic ถึงให้บริการ

    • อะไรทำให้มันเป็นบัญชีหลอกลวงน่ะเหรอ? อาจเป็นเพราะใช้ ตัวตนปลอม และมีการหลอกลวงโดยรวมเกี่ยวกับวัตถุประสงค์การใช้งาน
    • เพราะข้อกำหนดการให้บริการของ Anthropic มีเงื่อนไขมากกว่าแค่ “จ่ายเงินแล้วจะใช้บริการเพื่อจุดประสงค์อะไรก็ได้” มาก
    • หรือจะอ่านร่องรอยการให้เหตุผลแล้วเรียนรู้ด้วยตัวเองก็ได้นะ? /s
  • โดยพื้นฐานแล้ว distillation ป้องกันไม่ได้ ทำได้แค่ทำให้ช้าลงเท่านั้น ลองแย้งมาสิ
    สุดท้ายบริษัทจีนก็คงปล่อยส่วนขยายแบบ Honey ออกมา แล้วอาศัยลูกค้าที่ไม่ใช่จีนตัวจริงเป็นหน้าฉาก ก่อนจะส่งทุกอย่างกลับไปจีนอยู่ดี
    เกมจบแล้ว

    • สำหรับการป้องกันการ distill ความสามารถบางอย่าง เช่น การเขียนโค้ดหรือการหาช่องโหว่ ตอนนี้สายเกินไปแล้ว [1]
      แต่แล็บ AI ก็ยังสามารถสร้างมูลค่าทางเศรษฐกิจมหาศาลต่อไปได้โดยไม่ต้องเปิดเผยโมเดลให้เสี่ยงต่อการถูก distill เช่น ใช้โมเดลภายในองค์กรเท่านั้นเพื่อพัฒนายารักษาโรค
      หวังว่าสักวันจะมีอนาคตที่คนอื่นเข้าถึงโมเดลระดับแนวหน้าได้ด้วย แต่ถ้าตัดสินว่าการป้องกันการแพร่กระจายผ่าน distillation สำคัญกว่า ก็อาจไม่จำเป็นต้องเป็นแบบนั้น
      [1]: อ้างอิงเรื่อง distillation ใน https://dualuse.dev/posts/export-controls-on-fable
    • สิ่งที่ยังไม่ค่อยเข้าใจคือ distillation ที่เราเห็นดูเหมือนเกิดขึ้นในจีนเท่านั้น อะไรที่ขัดขวางไม่ให้บริษัทเทคโนโลยีในสหราชอาณาจักรหรือเยอรมนี distill Claude, GPT ฯลฯ กันบ้าง หรือเป็นแค่เพราะความสามารถยังไม่พอ
      ประเด็นคืออาจไม่มีทางแก้เชิงเทคนิค แต่ในทางทฤษฎีอาจมี ทางแก้เชิงการเมือง
    • ตราบใดที่โมเดลยังพัฒนาต่อไป โมเดลที่ได้จาก distillation ก็ย่อมตามหลังอย่างหลีกเลี่ยงไม่ได้ โมเดลยังพัฒนาอยู่เรื่อย ๆ วันหนึ่งในอนาคตมันอาจจบลงก็ได้
      งานของ Berkeley เรื่อง “False Promise of Imitating Proprietary LLMs” ก็เห็นว่าการเลียนแบบช่วยลดช่องว่างด้านสไตล์ได้เร็ว แต่ ช่องว่างด้านความสามารถ ยังเหลืออยู่มาก
      https://arxiv.org/abs/2305.15717
    • นึกเหตุผลไม่ออกเลยด้วยซ้ำว่าทำไมถึงจะถือว่ามันผิด
    • ก็เหมือนกับการห้าม web scraping ไม่ได้นั่นแหละ ลองแย้งมาสิ