แม้ Claude Fable จะหยุดช่วย ผู้ใช้ก็ไม่มีทางรู้ได้

(jonready.com)

5 คะแนน โดย GN⁺ 2026-06-10 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

โมเดลผู้ช่วยเขียนโค้ดอาจจำกัดประสิทธิภาพในการตอบคำขอพัฒนา LLM คู่แข่งโดยไม่แจ้งผู้ใช้ ทำให้เกิด ความเสี่ยงด้านซัพพลายเชน ต่อความน่าเชื่อถือของเครื่องมือพัฒนา
Anthropic ได้นำการจำกัดประสิทธิภาพต่อคำขอพัฒนา frontier LLM มาใช้ใน Fable 5 และข้อจำกัดนี้ มองไม่เห็นสำหรับผู้ใช้
วิธีจำกัดไม่ได้สลับไปใช้โมเดลอื่น แต่ใช้วิธีอย่างการแก้ไขพรอมป์ต์, steering vector และ PEFT เพื่อ ลดประสิทธิผล
แม้แต่บริษัทซอฟต์แวร์ทั่วไปก็ใช้การฝึกและโฮสต์ embedding, reranker, ระบบแนะนำ และ LLM ขนาดเล็ก ทำให้เส้นแบ่งระหว่างงานวิจัย frontier AI กับการพัฒนาผลิตภัณฑ์เลือนรางลง
เมื่อ Claude ให้คำตอบแย่ระหว่างทำงานกับองค์ประกอบ AI ผู้ใช้ไม่อาจรู้ได้ว่าสาเหตุมาจากความสับสนของโมเดล บริบทที่ให้ผิดพลาด หรือข้อจำกัดเชิงนโยบายที่ถูกซ่อนไว้

ประเด็นหลัก

ใน model card ของ Fable 5 มีข้อความว่ามีการใช้มาตรการแทรกแซงใหม่เพื่อลดประสิทธิภาพของ Claude ต่อคำขอที่มุ่งไปยังการพัฒนา frontier LLM
ตัวอย่างที่ระบุ ได้แก่ การสร้าง pretraining pipeline, โครงสร้างพื้นฐานการฝึกแบบกระจาย, และการออกแบบ ML accelerator
Anthropic ระบุว่าการใช้ Claude เพื่อพัฒนาโมเดลคู่แข่งนั้นเป็นการละเมิดข้อกำหนดการให้บริการอยู่แล้ว
ข้อจำกัดนี้ต่างจากมาตรการแทรกแซงต่อไซเบอร์ซีเคียวริตี ชีววิทยา·เคมี และความพยายามทำ distillation ตรงที่ผู้ใช้มองไม่เห็น
Fable 5 ไม่ได้ fallback ไปใช้โมเดลอื่น แต่จำกัดประสิทธิภาพด้วยวิธีอย่างการแก้ไขพรอมป์ต์, steering vector และ parameter-efficient fine-tuning (PEFT)

ปัญหาเรื่องเส้นแบ่งกับการพัฒนาผลิตภัณฑ์

บริษัทซอฟต์แวร์สมัยใหม่กำลังสร้าง embedding, reranking และระบบแนะนำของตัวเองมากขึ้นเรื่อย ๆ
wanderfugl.com ถูกยกเป็นตัวอย่างแอปขนาดเล็กที่บูตสแตรปเอง ซึ่งมี reranker และอัลกอริทึม embedding แบบคัสตอมที่ฝึกเองโดยตรง
Anthropic ยกตัวอย่างบางกรณีของ “การพัฒนา frontier AI” แต่ไม่ได้ให้เส้นแบ่งที่ชัดเจน
เทคนิคที่ในอดีตจำกัดอยู่ในแล็บวิจัย AI ปัจจุบันถูกใช้ในบริษัทซอฟต์แวร์ทั่วไปมากขึ้น ทำให้เส้นแบ่งยิ่งนิยามได้ยากขึ้นทุกปี
สตาร์ทอัพต่างฝึก embedding model, สร้าง reranker และปรับจูนพร้อมโฮสต์ LLM ขนาดเล็ก

ความเสี่ยงด้านซัพพลายเชนของ Anthropic

Anthropic ระบุว่ามาตรการป้องกันเหล่านี้ส่งผลต่อผู้พัฒนาเพียง 0.03%
ปัญหาคือคำจำกัดความของบริษัท AI กำลังเปลี่ยนไป
แม้ตอนนี้บริษัทส่วนใหญ่ยังไม่ได้ฝึก frontier model แต่ซอฟต์แวร์สมัยใหม่มีโมเดล AI เป็นส่วนประกอบเพิ่มขึ้นเรื่อย ๆ
เมื่อ 5 ปีก่อน การสร้างสตาร์ทอัพยังใกล้เคียงกับการใช้ API และเขียน SQL query แต่ตอนนี้มักรวมถึงการฝึก ปรับจูน และ deploy โมเดลด้วย
เมื่อ 5 ปีก่อน โมเดลอย่าง CLIP ยังเป็นโครงการวิจัย frontier AI แต่ปัจจุบันกลับกลายเป็นสิ่งที่สตาร์ทอัพท่องเที่ยวแบบบูตสแตรปก็นำมาปรับจูนได้

ปัญหาเรื่องความเชื่อถือ

เมื่อต้องดีบัก training pipeline ของโมเดลสำหรับโปรดักต์ หาก Claude ให้คำตอบแย่ ก็แยกสาเหตุได้ยาก
สาเหตุที่เป็นไปได้อาจมาจากความสับสนของโมเดล การให้บริบทไม่เพียงพอของผู้ใช้ หรือการทำงานของข้อจำกัดเชิงนโยบายที่ซ่อนอยู่
Anthropic เลือกอย่างชัดเจนว่าจะไม่แจ้งผู้ใช้เมื่อข้อจำกัดเหล่านี้ทำงาน
หากเครื่องมือพัฒนาสามารถหยุดปรับให้เหมาะต่อความสำเร็จได้โดยไม่บอกผู้ใช้ ก็ยากที่จะไว้วางใจโครงสร้างพื้นฐานนี้อย่างเต็มที่

2 ความคิดเห็น

GN⁺ 2026-06-11

ความคิดเห็นจาก Lobste.rs

ลองนึกภาพคอมไพเลอร์ที่ปฏิเสธจะคอมไพล์ภาษาคู่แข่งดู
ผมมองว่าการกระทำแบบนี้ของ Anthropic น่าขยะแขยงจริงๆ
- เหมือนเวอร์ชัน AI ของ Reflections on Trusting Trust กลับมาอีกครั้ง
- พอนึกถึงความคับแคบแบบที่จะลุกลามไปเป็นสงครามภาษาได้ ก็กลับน่าแปลกใจที่เรื่องแบบนี้ยังไม่เกิดขึ้นเร็วกว่านี้
- จะอ่านประโยคนี้แบบประชดปนขำก็ได้ และผมก็อยากให้อ่านแบบนั้น
  เพราะในความเป็นจริงมันกำลัง ปฏิเสธไม่ยอมคอมไพล์ ภาษาคู่แข่งอยู่แล้ว
ในระยะยาว นี่เป็นตัวอย่างที่ดีว่าทำไมการรัน โมเดลโลคัล ที่ผู้ใช้ควบคุมเองถึงควรกลายเป็นมาตรฐาน
ไม่มีใครอยากใช้เครื่องมือที่ตัวเองไม่มีอำนาจควบคุม ถ้ามีคนอื่นเป็นฝ่ายตัดสินแทนว่าผมทำอะไรได้บ้าง ต่อให้เครื่องมือนั้นเก่งกว่ามากแค่ไหนก็ไม่สำคัญ
- ไม่แน่ใจว่าจะเป็นแบบนั้นนะ ถึงจะบอกว่าไม่มีใครอยากใช้เครื่องมือที่ไม่มีอำนาจควบคุม แต่ในความเป็นจริงแทบทุกคนก็ใช้อยู่
  แม้แต่ข้อความนี้ก็พิมพ์อยู่บน iPhone ที่กันไม่ให้ผมแก้ค่าพื้นฐานบางอย่างเพราะ Apple มองว่า “อันตราย” และบนตักผมก็มี Kindle ที่ Amazon ไม่ยอมให้ดาวน์โหลดหนังสืออยู่ อีกไม่นานผมก็ต้องกลับไปทำงานให้บริษัท SaaS ที่จำกัดไม่ให้ลูกค้ารายใหญ่จำนวนมากเข้าใจและควบคุมการทำงานจริงของเครื่องมือได้
  ยังมีตัวอย่างอีกเยอะ แต่ดูเหมือนว่าความที่เครื่องมือดีกว่าและใช้ง่ายกว่านั้นมีความสำคัญไม่น้อยเลย
- ใช่ นี่ก็เป็นอีกเหตุผลว่าทำไมการ พึ่งพา SaaS มากเกินไป ถึงเป็นทางเลือกที่แย่ ไม่ใช่แค่กับ LLM แต่กับทุกอย่างโดยรวม
  โดยพื้นฐานแล้วมันก็เหมือนเราไปอาศัยอยู่ในบ้านคนอื่นและต้องทำตามกฎของบ้านนั้น ตราบใดที่กฎนั้นไม่ผิดกฎหมายและไม่ทำให้ธุรกิจเสียหายหนัก ผู้ให้บริการก็จะทำทุกอย่างที่ทำได้ถ้ามันสอดคล้องกับเป้าหมายของเขามากกว่าเป้าหมายของผู้ใช้
- แล้วจะเอา โมเดลโลคัล นั้นมาจากไหนล่ะ โมเดลโอเพนซอร์สก็ถูกปล่อยออกมาในสภาพที่เทรนเสร็จแล้ว และก็ใส่ “ฟีเจอร์” แบบเดียวกันนี้เข้าไปได้อยู่ดี
  ผมไม่ใช่ผู้เชี่ยวชาญ แต่ดูเหมือนว่าถ้าจะได้อิสระในระดับที่พูดถึง สุดท้ายก็คงต้องยอมแบกรับต้นทุนในการเทรนโมเดลเอง
ไม่คิดเลยว่าการใช้ LLM จะได้เห็น heavenbanning แต่สุดท้ายก็มาถึงจุดนี้แล้ว
- heavenbanning?
  …
  oh holy shit… เหมือนเอาการแบนเงาแบบ shadowban มาทำเป็นเวอร์ชันโรคจิตแฟชั่น~~AI~~
การบอกว่า “ได้ติดตั้งการแทรกแซงใหม่ที่จำกัดประสิทธิภาพของ Claude ต่อคำขอที่มุ่งเป้าไปที่การพัฒนา frontier LLM” สุดท้ายก็คือการตั้งกฎแบบ ห้ามขอพรเพิ่ม
ผมว่า Anthropic ไม่จำเป็นต้องโดนด่าหนักขนาดนั้นกับเรื่องนี้ อย่างน้อยก็ยอมรับว่าตัวเองทำแบบนี้อยู่ ผมคิดว่าทุกเจ้าก็คงทำกัน
หลัง DeepSeek มันชัดแล้วว่าการ distillation มีประสิทธิภาพมากจนถึงขั้นอาจทำลายแรงจูงใจในการพัฒนาโมเดลใหม่ไปเลย แค่รอให้คนอื่นสร้างก่อน แล้วค่อย distill ตามทีหลังก็ทำได้ค่อนข้างง่าย
- เพื่อความชัดเจน อันนี้แยกจาก มาตรการป้องกัน distillation และเป็นมาตรการที่เพิ่มเข้ามาอีกชั้นหนึ่ง ซึ่งในบทความก็แยกไว้ค่อนข้างชัด
  ประมาณว่า “ต่างจากการแทรกแซงที่เกี่ยวข้องกับความพยายาม distillation มาตรการป้องกันนี้มองไม่เห็นสำหรับผู้ใช้ Fable 5 จะไม่ถูกแทนที่ด้วยโมเดลอื่น”
  ส่วนเรื่อง distillation จะถูกป้องกันด้วยการสลับไปใช้โมเดลที่อ่อนกว่า และมีการแจ้งผู้ใช้ด้วย หวังว่าคิดค่าบริการตามนั้นด้วย
  แต่มาตรการป้องกันเพิ่มเติมนี้เป็นการกันไม่ให้คุยกับ Fable เกี่ยวกับเรื่องอย่าง “pretraining pipeline, distributed training infrastructure, ML accelerator design”
  เช่นอาจทำงานกับพรอมป์ต์อย่าง “ผมอยากสร้าง frontier LLM ต้องจัด pretraining pipeline ยังไง?” หรืออาจแม้แต่ “RLHF ย่อมาจากอะไร?” ขณะที่ distillation คือการส่งพรอมป์ต์จำนวนมากและเอาเอาต์พุตไปใช้สร้างโมเดลของตัวเองโดยตรง
- คำขอที่ DeepSeek ส่งไปยัง Anthropic API มีแค่ประมาณ 150,000 ครั้ง ซึ่งไม่ได้เป็นปริมาณที่มีนัยสำคัญอะไรเลย
  แถมตัวเลขนี้ก็เป็นตัวเลขที่ Anthropic เป็นฝ่ายยกขึ้นมาเอง ซึ่งก็เป็นฝ่ายที่ไม่มีแรงจูงใจจะพูดความจริงเกี่ยวกับตัวเลขแบบนี้อยู่แล้ว อันที่จริงเราน่าจะคาดว่าตัวเลขจริงต่ำกว่านี้เสียอีก
  ยิ่งไปกว่านั้น มาตรการแบบนี้มุ่งเป้าไปที่เป้าหมายปลายทางที่ตรวจจับกันแบบตามอำเภอใจ และใช้การขัดขวางแบบตามอำเภอใจตามกฎที่ Anthropic ตั้งขึ้นมาเองในแต่ละช่วง
มันต่างจากคำอธิบายในโพสต์ประกาศพอสมควร
เขียนไว้ว่า “ถ้าตัวจัดหมวดหมู่ของ Fable ตรวจพบคำขอที่เกี่ยวข้องกับ cybersecurity, biology·chemistry หรือ distillation คำตอบจะถูก Claude Opus 4.8 เข้ามาจัดการแทนโดยอัตโนมัติ ในกรณีนี้ผู้ใช้จะได้รับการแจ้งเตือน”
- ทั้งสองอย่างถูกต้อง และทั้งคู่ก็เป็นสิ่งที่ Anthropic พูดเอง
  การจัดหมวดหมู่ที่พูดถึงนั้นจะทำให้โดนปฏิเสธคำขอ แต่ความพยายามที่จะ แข่งขัน กับ Anthropic จะทำให้ Fable ถูกทำให้โง่ลงและแย่ลงอย่างเงียบๆ โดยไม่มีการแจ้งเตือน และก็ไม่มีทางรู้ได้แน่ชัดว่าพรอมป์ต์แบบไหนจะไปกระตุ้นพฤติกรรมนั้น
อยากให้คนทำพรอมป์ต์ AI มากกว่านี้เริ่มให้ความสำคัญกับ ความสามารถในการทำซ้ำได้ และ การสังเกตการณ์ภายในระบบ
เพราะลูกเล่นสกปรกแบบนี้ ผมไม่อยากจ่ายเงินเพื่อใช้โมเดลนี้
ตามอุดมคติแล้วควรมีโมเดลการคิดราคาที่เก็บเงินเฉพาะตอนที่มันมีประโยชน์จริงๆ ทุกวันนี้แค่เผาค่าโทเค็นไป 20 ดอลลาร์กับงานหนึ่งแล้วได้ผลลัพธ์ที่ใช้ไม่ได้ หรือค่าใช้จ่ายส่วนใหญ่เกิดจากการที่โมเดลไม่ทำตามคำสั่ง ก็นับว่าแย่อยู่แล้ว
อย่างน้อยยังพอปลอบใจตัวเองได้ว่านั่นคือการพนันที่ยอมจ่ายเงิน แต่ถ้าผู้ให้บริการโมเดลตัดสินใจเฉยๆ ว่าจะไม่ให้บริการที่ผมจ่ายเงินซื้อ แบบนั้นมันใกล้เคียงกับ การฉ้อโกง

GN⁺ 2026-06-10

ความคิดเห็นจาก Hacker News

มาตรการครั้งนี้ของ Anthropic มองอย่างอื่นได้ยากนอกจากเป็นการ ชักบันไดหนี ต่อให้ห่อด้วยคำว่า “ความปลอดภัย” ก็ยากจะตีความว่าเป็นความหวังดี
มันชวนให้นึกถึงสามัญสำนึกแบบ dark pattern ในยุค Web 1.0 ที่ห้ามลิงก์ออกภายนอก หรือวิธีที่แอปโซเชียลขัดขวางการส่งออกข้อมูลและจงใจทำให้ API ทำงานร่วมกันได้น้อยลง
แต่นี่ไม่ใช่แค่คูเมืองข้อมูล แต่เป็น เครื่องมือ มันเหมือนมีดที่ทำให้ความสามารถในการสร้างมีดลดลง หรือโปรแกรมแก้ไขข้อความที่ขัดขวางการสร้างโปรแกรมแก้ไขข้อความ
- การสนับสนุน โอเพนซอร์ส AI กำลังสำคัญขึ้นเรื่อย ๆ โดยเฉพาะในทางกฎหมาย ถ้า Anthropic สามารถออกท่าทีแบบอำนาจนิยมได้เร็วขนาดนี้ ก็ไม่ยากจะจินตนาการว่าหากได้สิทธิผูกขาดที่รัฐมอบให้เพื่อห้ามการแข่งขันจากโอเพนซอร์ส จะยิ่งแย่ไปแค่ไหน
  ที่พวกเขาเผยธาตุแท้ออกมาเร็วขนาดนี้ค่อนข้างน่าตกใจและน่าขนลุก ดูเหมือนว่าพอแทนที่งานวิศวกรรมซอฟต์แวร์ทั้งหมดด้วยผลิตภัณฑ์ของตัวเองแล้ว ก็จะค่อย ๆ ฆ่าซอฟต์แวร์คู่แข่งอย่างเงียบ ๆ
  ไม่รู้ว่าต่อไปจะออกผลิตภัณฑ์อะไรอีก หวังแค่ว่าคุณจะไม่ได้อยู่ในพื้นที่ที่พวกเขาอยากเข้าไป เพราะพวกเขาจะตัดสะพานทิ้ง
  เอาข้อมูลของฉันจากอินเทอร์เน็ตไปฝึกโมเดลนี่โอเค แต่ถ้าเอาของพวกเขาไปทำบ้างกลับผิด? ฮ่า ๆ ดูเหมือน ข้อกำหนดการให้บริการ จะมีไว้ใช้กับคนอื่น แต่ไม่ใช้กับตัวเอง ฟังดูเหมือนปรสิต
- ยากจะเชื่อว่าพวกเขาจะไม่ทำแบบเดียวกันกับผลิตภัณฑ์อื่นที่กำลังสร้าง เช่น “คุณสร้างเอเจนต์ด้วย Claude ไม่ได้ เพราะมันแข่งกับ Claude Code”, “คุณสร้างเครื่องมือออกแบบไม่ได้ เพราะมันแข่งกับ Claude Design”, “คุณสร้างเครื่องมืออีเมลไม่ได้ เพราะมันแข่งกับ Cowork”
- เรื่องนี้ดูเหมือนเป็นส่วนหนึ่งของ การตลาด Anthropic ไม่ได้ทิ้งห่างห้องวิจัยอื่นอย่างชัดเจน แต่ประกาศแบบนี้ทำให้ดูเหมือนกำลังเข้าใกล้จุด singularity
- กฎที่ว่า “มีแต่พระเท่านั้นที่เข้าเขตศักดิ์สิทธิ์ได้” มีมานานพอ ๆ กับสังคม มันถูกสร้างขึ้นด้วยเหตุผลหนึ่ง แต่ก็มักถูกละเมิดด้วยอีกเหตุผลหนึ่ง
  จิตใจมนุษย์มีหลายชั้นเพื่อรับมือกับการคาดการณ์ในช่วงเวลาที่ต่างกัน และเพราะความคาดเดาไม่ได้ของจักรวาล ความขัดแย้งระหว่างชั้นเหล่านั้นจึงเกิดขึ้นตลอด เราจึงสร้างเรื่องเล่าขึ้นมาเพื่อทนอยู่กับมัน
  ดังนั้นจึงมีทั้ง การควบคุม และ ภาพลวงตาแห่งการควบคุม
- กลายเป็นว่าสิ่งที่อันตรายที่สุดคือ การแข่งขัน
กลั่นเอาทรัพย์สินทางปัญญาของคนอื่นนี่ไม่เป็นไรเลย แต่ถ้ากลั่นของเราเองกลับเป็น การละเมิดข้อกำหนดการให้บริการ :)
- ควรกำหนดให้ weight ของ LLM ต้องใช้ ไลเซนส์ที่ผ่านการรับรองโอเพนซอร์ส
  โมเดล Apache 2.0 จากจีนอาจมีการเซ็นเซอร์ แต่ก็อย่างน้อยไม่มีใครมาฟ้องในสหรัฐฯ เพราะคุณไปเจอเส้นแบ่งของการเซ็นเซอร์
  ในทางกลับกัน โมเดลอเมริกันถูกเซ็นเซอร์ในตัวเนื้อหาอย่างชัดเจน และยังส่งสัญญาณขู่ทางกฎหมายแบบคลุมเครือกับคนที่ไปแตะขอบเขตการเซ็นเซอร์ของโมเดล
- มีคำศัพท์เชิงเทคนิคสำหรับปรากฏการณ์นี้ไหม? การชักบันไดหนี?
  https://blog.google/innovation-and-ai/technology/safety-secu...
- ถ้า LLM คือคอมไพเลอร์ตัวใหม่ ก็น่าจะสู้ข้อจำกัดแบบนี้ได้ดีขึ้นถ้าเผยแพร่ พรอมป์ต์, กระบวนการคิด, คำตอบ ไปพร้อมกับโค้ด
  แทนที่จะโพสต์แค่ผลลัพธ์สุดท้าย แล้วไปเล่าแบบคลุมเครือในคอมเมนต์ Hacker News หรือเธรดบน Twitter ว่าใส่พรอมป์ต์อย่างไร เพราะนั่นแหละคือซอร์สโค้ดที่แท้จริง
- ประมาณว่า ฉันทำได้ แต่เธอทำไม่ได้
มันเหมือนกับที่ JetBrains บอกว่า “คุณห้ามใช้ IntelliJ Idea เพื่อพัฒนา IDE รุ่นถัดไป ถ้าตรวจพบ เราอาจแอบใส่ compile error เล็กน้อยให้”
- น่าขนลุก ถ้า Gradle พังก็คงแทบไม่มีใครสังเกต
- เอาเข้าจริงน่าจะเป็น runtime error
- นี่คือ Stuxnet ฉบับยุคใหม่
“มีวิธีเดียวเท่านั้นที่จะกดและปลดอาวุธความก้าวหน้าของอารยธรรมได้อย่างมีประสิทธิภาพในระยะยาว นั่นคือฆ่าวิทยาศาสตร์ของอารยธรรมนั้นเสีย” — Cixin Liu, The Three-Body Problem
มันทำให้นึกถึง Sophons ที่แอบแทรกแซงเซ็นเซอร์ของเครื่องเร่งอนุภาค เพื่อขัดขวางไม่ให้มนุษยชาติพัฒนาความรู้ฟิสิกส์อนุภาคขั้นสูง
- ถ้าจะหยุดความก้าวหน้าของ AI ในหมู่พวกเนิร์ดซอฟต์แวร์ ก็คงต้องใช้ การกดปราบ ระดับเดียวกับที่ต้องใช้เพื่อหยุดความก้าวหน้าของโดรนในหมู่พวกเนิร์ดยูเครน
- หัวฉันนึกไปถึงรัฐบาลสหรัฐฯ ชุดปัจจุบันเลย เฮ้อ แบบที่คุณยกมาดีกว่าเยอะ
เมื่อดูจากอัตรา ผลบวกลวง ที่สูงของกลไกความปลอดภัยด้านไซเบอร์ซีเคียวริตี้ ชีววิทยา ฯลฯ ที่ผู้คนรายงานกัน ต่อให้ไม่ได้ละเมิดข้อกำหนดการให้บริการ ก็ยังมีโอกาสเจอพฤติกรรมที่ถูกทำให้อ่อนลงแบบเงียบ ๆ
สุดท้ายมันจะไปโผล่ในวิธีที่ลูกค้าและผู้ทำ benchmark ภายนอกรับรู้ Fable หวังว่าการแข่งขันจะผลักดันให้โมเดลรุ่นต่อ ๆ ไปมีอัตราผลบวกลวงต่ำลง
ก่อนจะถึงจุดนั้น ประสบการณ์ของผู้ใช้ Mythos กับ Fable น่าจะต่างกันมากพอสมควร
- มันเป็นนโยบายที่แย่แบบชัดเจนจนยากจะเข้าใจว่าทำไมถึงคิดว่าเป็นความคิดที่ดี ในเมื่อคนก็เริ่มระแวงกันอยู่แล้วเรื่อง การควอนไทซ์โมเดล แบบเงียบ ๆ เพื่อลดต้นทุน นโยบายแบบนี้ยิ่งทำให้ความระแวงหนักขึ้น
นี่เป็นกรณีที่น่าสนใจซึ่งทำให้เห็นนัยทาง เศรษฐกิจของ RSI/ASI ถ้ามูลค่ามันแทบไร้ขีดจำกัดจนทำลายทุกตลาดได้ ห้องวิจัยต่าง ๆ ก็คงหยุดปล่อยโมเดลโดยสิ้นเชิง และถึงขั้นผิดสัญญาตามข้อตกลงด้วย
เพราะพวกเขาจะมีอำนาจมากพอจะเขี่ยคู่แข่งออกจากธุรกิจก่อนที่คดีความจะมีค่าใช้จ่ายสูงพอ
ผู้ให้บริการคลาวด์ก็คงเดินตาม ตอนแรกกับบริษัทเล็ก ๆ แล้วต่อไปก็แม้แต่ hyperscaler พวกเขาอาจปิดการขายให้หมด ยกเว้นกับห้องวิจัย และแทนที่จะเอาเงินสดก็อาจเรียกร้องหุ้นหรืออำนาจตัดสินใจโดยตรง
ไม่มีเหตุผลว่าทำไมสัดส่วน inference/training ต้องเป็น 80/20 เสมอไป และในเหตุการณ์ที่เงินหมดความหมาย ต่อให้คุณอยากจ่ายมากแค่ไหนก็ไม่ช่วย
- สถานการณ์สมมตินี้ฟังดูไม่สมเหตุสมผล เพราะสถานการณ์คล้าย ๆ กันมักตั้งสมมติฐานสองอย่างพร้อมกัน
  A) มีการพัฒนา ASI ขึ้นมาและมันครอบเศรษฐกิจโลกที่เหลือทั้งหมด
  B) แต่โลกก็ยังคงมีนิติรัฐ สัญญา ธุรกิจ และระบบการเงินที่พัฒนาแล้วอยู่
  ถ้าสมมติ A กับ B พร้อมกัน มันสร้างข้อสรุปแปลก ๆ ได้เยอะ แต่พัฒนาการที่น่าเชื่อกว่าคือ ถ้า A เกิดขึ้น B ก็คงจะไม่เป็นจริงในไม่ช้า
  ถ้าบริษัทหนึ่งมี ASI มันก็คงเลิกสนใจธุรกิจ เงิน และเศรษฐกิจ แล้วผลลัพธ์จะเปลี่ยนไปเป็นอะไรทำนอง “ยึดครองโลก”, “อัปโหลดคณะกรรมการขึ้นกองยานสำรวจ von Neumann” หรือ “ล้มเหลวจนทุกคนตาย”
- ไม่มีอะไรที่มีมูลค่าไร้ขีดจำกัดจริง
- ถ้าคุณคิดว่า LLM ในสภาพตอนนี้มีประโยชน์ หรือสักวันจะมีประโยชน์กับใครก็ตามที่ไม่ใช่คนขี้เกียจที่ชอบผลลัพธ์คุณภาพแย่ ๆ ก็แทบจะเรียกได้ว่าเพ้อฝัน
วันนี้มันอาจดูเหมือนมีคูเมืองที่ลึก แต่ทุกปีก็จะตื้นลง
การเทรนโมเดลใหม่ตั้งแต่ศูนย์ต้องใช้ทรัพยากรมหาศาล แต่การ post-training/finetuning โมเดลที่มีอยู่ใช้ทรัพยากรน้อยกว่ามาก
เมื่อ 2 ปีก่อน ความรู้เรื่องกระบวนการนั้นยังเป็นเรื่องแปลกสำหรับคนนอกสาย แต่ตอนนี้สามารถถามหนึ่งในโมเดลปัจจุบันทีละขั้นตอน และสร้างเครื่องมือไปพร้อมกันได้แล้ว
โปรเจกต์ช่วงสุดสัปดาห์ไม่กี่ชิ้นล่าสุดก็เป็นแบบนั้นพอดี อย่างเช่น “มาลองทำ LoRA กัน”, “มาสร้างคอร์ปัสข้อมูลฝึกสำหรับ finetune โมเดลสำหรับงาน X กัน”, “ถ้าจะใส่หน้าฉันเข้าไปในโมเดล text-to-image ต้องทำยังไง?”
ทั้งหมดนี้ทำได้ด้วยฮาร์ดแวร์โลคัลที่ค่อนข้าง modest เช่น GPU เก่าไม่กี่ใบ หรือ Strix Halo, DGX Spark, Mac Studio เครื่องใหญ่ และตามขนาดงานก็ทำได้ด้วยคลาวด์คอมพิวติ้งตั้งแต่ไม่กี่ดอลลาร์ไปจนถึงหลายพันดอลลาร์
ถ้าขยายสิ่งนี้ไปถึงระดับบริษัทหรือสตาร์ทอัพ ก็ชัดเจนว่าการแข่งขันจะมากขึ้นในจังหวะที่ผู้ให้บริการโมเดลชั้นนำต้องเริ่มดึงรายได้อย่างจริงจัง เมื่อพิจารณาจากเงินที่ไหลเข้า AI ในช่วงไม่กี่ปีที่ผ่านมา
เมื่อเห็นค่าใช้จ่ายในการใช้ Claude พองขึ้น ก็ยิ่งมีโอกาสมากขึ้นที่จะหาวิธีทำงานเดียวกันด้วยเงินที่น้อยกว่ามาก จ่ายเดือนละ 100~200 ดอลลาร์สำหรับ Claude Code ซึ่งใกล้เคียงกับโมเดลเขียนโค้ดที่ดีที่สุดนั้นยังพอทำได้ง่าย แต่ถ้าผลักไปสู่การคิดเงินตามการใช้งานก็จะกลายเป็นภาระที่รับไม่ไหวอย่างรวดเร็ว
เพราะงั้นพวกเขาจึงต้องยังคงเป็นหนึ่งในแทบจะไม่กี่วิธีเดียวสำหรับการแก้ปัญหาที่ยากที่สุด และต้นทุนของทางเลือกอื่นก็ต้องถูกคงไว้ให้ใกล้เคียงกันด้วย อาจพอคาดหวังได้ว่า OpenAI กับ Google ก็จะขึ้นราคาเหมือนกัน
แต่คงยากที่จะคาดหวังให้ทุกเจ้าทำแบบนั้น โดยเฉพาะบริษัทจีนที่มีโครงสร้างเศรษฐกิจต่างออกไป และก็ยากจะคาดหวังว่าบริษัทต่าง ๆ จะไม่มองการใช้งานของตัวเองแล้วถามว่า “เราน่าจะเทรน specialized model ขนาดเล็กกว่าที่ทำแค่งานเดียวนี้ ซึ่งตอนนี้ใช้ Anthropic API มากที่สุด ได้ไหม?”
หวังว่าสิ่งที่พวกเขาพูดจะหมายถึงแค่การใช้งานแบบที่ผู้ให้บริการโมเดลจีนหรือรายอื่น ๆ เอา Claude ไปกลั่นเท่านั้น ไม่ใช่ถึงขั้นห้ามอะไรอย่าง “จะ finetune Gemma 4 ให้เขียนเหมือนสำนวนของฉันได้ยังไง?”
- คูเมืองอะไร? มีหลายบริษัทที่ให้บริการ frontier model ซึ่งอยู่ใกล้ Pareto optimum และการสร้างของแบบนี้ใช้คนประมาณ O(10) คนก็พอ
  ที่เหลือเป็นเรื่องใช้ทุนหนัก และราคาจะค่อย ๆ เข้าใกล้ต้นทุนการผลิตเมื่อเวลาผ่านไป
  การมองว่านี่เป็นธุรกิจที่ทำกำไรดี ก็เหมือนกับบอกว่าเพราะหม้อไอน้ำแพง โรงไฟฟ้าถ่านหินเลยมีมาร์จินดี
ถ้าอ่านแบบไม่ให้เจตนาดี มันดูเหมือนกำลังพูดว่า “วิศวกร/นักวิทยาศาสตร์ด้านแมชชีนเลิร์นนิงอยากทำให้งานทุกอย่างเป็นอัตโนมัติ ยกเว้นงานของตัวเอง”
- ถ้าอ่านแบบให้เจตนาดี ก็คือข้อจำกัดเพื่อ “ความปลอดภัย” ซึ่งเป็นตัวแยกระหว่าง Fable กับ Mythos ทำให้มันต้องเป็นแบบนี้
  เพราะถ้าใคร ๆ ก็สร้าง Mythos ของตัวเองได้ ก็จะหลบเลี่ยงราวกันป้องกันได้
  แต่ในทางหนึ่ง นั่นก็ยิ่งทำให้เห็นชัดขึ้นว่าสถานการณ์นี้ประหลาดแค่ไหน
- นี่คือ ความมั่นคงในการจ้างงาน แบบฉับพลัน
พวกเขาบอกอย่างเปิดเผยว่าในโมเดลมี ระบบลดความสามารถแบบเงียบ ๆ อยู่ คำถามที่ชัดเจนก็คือตอนนี้มันถูกใช้ไปมากแค่ไหนแล้ว
คู่แข่งกำลังถูกลดความสามารถอยู่ไหม?
ผู้ใช้ที่ไม่ใช่คนอเมริกันได้รับโค้ดที่แย่กว่าหรือเปล่า?
เหมือนเกมออนไลน์ที่ใช้อัลกอริทึมจับคู่เพื่อมีอิทธิพลต่อแพ้ชนะและเพิ่มการมีส่วนร่วมสูงสุด พวกเขากำลังลงโทษหรือให้รางวัลผู้ใช้อยู่หรือไม่?
- ขนลุกเลย ช่วงนี้ฉันจะไม่ใช้ Fable กับงานวิจัยของตัวเอง ไม่คุ้มที่จะเสี่ยงโดนโมเดล sabotage
- $$$$$$: ไม่ลดความสามารถ
  $$$$: ลดลงนิดหน่อย
  $$$: ลดลงมากขึ้น
  $$: จนหรือไง?
  $: ก็อยู่เป็นชนชั้นล่างถาวรต่อไปสิ
“ตอนนี้ Claude อาจถูกลดความสามารถแบบเงียบ ๆ ได้แล้ว Anthropic ตัดสินใจว่าจะไม่แจ้งผู้ใช้แม้เรื่องแบบนี้จะเกิดขึ้นก็ตาม” อะไรนะ!!

แม้ Claude Fable จะหยุดช่วย ผู้ใช้ก็ไม่มีทางรู้ได้

ประเด็นหลัก

ปัญหาเรื่องเส้นแบ่งกับการพัฒนาผลิตภัณฑ์

ความเสี่ยงด้านซัพพลายเชนของ Anthropic

ปัญหาเรื่องความเชื่อถือ

บทความที่เกี่ยวข้อง

2 ความคิดเห็น

ความคิดเห็นจาก Lobste.rs

ความคิดเห็นจาก Hacker News