แม้ Claude Fable จะหยุดช่วย ผู้ใช้ก็ไม่มีทางรู้ได้
(jonready.com)- โมเดลผู้ช่วยเขียนโค้ดอาจจำกัดประสิทธิภาพในการตอบคำขอพัฒนา LLM คู่แข่งโดยไม่แจ้งผู้ใช้ ทำให้เกิด ความเสี่ยงด้านซัพพลายเชน ต่อความน่าเชื่อถือของเครื่องมือพัฒนา
- Anthropic ได้นำการจำกัดประสิทธิภาพต่อคำขอพัฒนา frontier LLM มาใช้ใน Fable 5 และข้อจำกัดนี้ มองไม่เห็นสำหรับผู้ใช้
- วิธีจำกัดไม่ได้สลับไปใช้โมเดลอื่น แต่ใช้วิธีอย่างการแก้ไขพรอมป์ต์, steering vector และ PEFT เพื่อ ลดประสิทธิผล
- แม้แต่บริษัทซอฟต์แวร์ทั่วไปก็ใช้การฝึกและโฮสต์ embedding, reranker, ระบบแนะนำ และ LLM ขนาดเล็ก ทำให้เส้นแบ่งระหว่างงานวิจัย frontier AI กับการพัฒนาผลิตภัณฑ์เลือนรางลง
- เมื่อ Claude ให้คำตอบแย่ระหว่างทำงานกับองค์ประกอบ AI ผู้ใช้ไม่อาจรู้ได้ว่าสาเหตุมาจากความสับสนของโมเดล บริบทที่ให้ผิดพลาด หรือข้อจำกัดเชิงนโยบายที่ถูกซ่อนไว้
ประเด็นหลัก
- ใน model card ของ Fable 5 มีข้อความว่ามีการใช้มาตรการแทรกแซงใหม่เพื่อลดประสิทธิภาพของ Claude ต่อคำขอที่มุ่งไปยังการพัฒนา frontier LLM
- ตัวอย่างที่ระบุ ได้แก่ การสร้าง pretraining pipeline, โครงสร้างพื้นฐานการฝึกแบบกระจาย, และการออกแบบ ML accelerator
- Anthropic ระบุว่าการใช้ Claude เพื่อพัฒนาโมเดลคู่แข่งนั้นเป็นการละเมิดข้อกำหนดการให้บริการอยู่แล้ว
- ข้อจำกัดนี้ต่างจากมาตรการแทรกแซงต่อไซเบอร์ซีเคียวริตี ชีววิทยา·เคมี และความพยายามทำ distillation ตรงที่ผู้ใช้มองไม่เห็น
- Fable 5 ไม่ได้ fallback ไปใช้โมเดลอื่น แต่จำกัดประสิทธิภาพด้วยวิธีอย่างการแก้ไขพรอมป์ต์, steering vector และ parameter-efficient fine-tuning (PEFT)
ปัญหาเรื่องเส้นแบ่งกับการพัฒนาผลิตภัณฑ์
- บริษัทซอฟต์แวร์สมัยใหม่กำลังสร้าง embedding, reranking และระบบแนะนำของตัวเองมากขึ้นเรื่อย ๆ
- wanderfugl.com ถูกยกเป็นตัวอย่างแอปขนาดเล็กที่บูตสแตรปเอง ซึ่งมี reranker และอัลกอริทึม embedding แบบคัสตอมที่ฝึกเองโดยตรง
- Anthropic ยกตัวอย่างบางกรณีของ “การพัฒนา frontier AI” แต่ไม่ได้ให้เส้นแบ่งที่ชัดเจน
- เทคนิคที่ในอดีตจำกัดอยู่ในแล็บวิจัย AI ปัจจุบันถูกใช้ในบริษัทซอฟต์แวร์ทั่วไปมากขึ้น ทำให้เส้นแบ่งยิ่งนิยามได้ยากขึ้นทุกปี
- สตาร์ทอัพต่างฝึก embedding model, สร้าง reranker และปรับจูนพร้อมโฮสต์ LLM ขนาดเล็ก
ความเสี่ยงด้านซัพพลายเชนของ Anthropic
- Anthropic ระบุว่ามาตรการป้องกันเหล่านี้ส่งผลต่อผู้พัฒนาเพียง 0.03%
- ปัญหาคือคำจำกัดความของบริษัท AI กำลังเปลี่ยนไป
- แม้ตอนนี้บริษัทส่วนใหญ่ยังไม่ได้ฝึก frontier model แต่ซอฟต์แวร์สมัยใหม่มีโมเดล AI เป็นส่วนประกอบเพิ่มขึ้นเรื่อย ๆ
- เมื่อ 5 ปีก่อน การสร้างสตาร์ทอัพยังใกล้เคียงกับการใช้ API และเขียน SQL query แต่ตอนนี้มักรวมถึงการฝึก ปรับจูน และ deploy โมเดลด้วย
- เมื่อ 5 ปีก่อน โมเดลอย่าง CLIP ยังเป็นโครงการวิจัย frontier AI แต่ปัจจุบันกลับกลายเป็นสิ่งที่สตาร์ทอัพท่องเที่ยวแบบบูตสแตรปก็นำมาปรับจูนได้
ปัญหาเรื่องความเชื่อถือ
- เมื่อต้องดีบัก training pipeline ของโมเดลสำหรับโปรดักต์ หาก Claude ให้คำตอบแย่ ก็แยกสาเหตุได้ยาก
- สาเหตุที่เป็นไปได้อาจมาจากความสับสนของโมเดล การให้บริบทไม่เพียงพอของผู้ใช้ หรือการทำงานของข้อจำกัดเชิงนโยบายที่ซ่อนอยู่
- Anthropic เลือกอย่างชัดเจนว่าจะไม่แจ้งผู้ใช้เมื่อข้อจำกัดเหล่านี้ทำงาน
- หากเครื่องมือพัฒนาสามารถหยุดปรับให้เหมาะต่อความสำเร็จได้โดยไม่บอกผู้ใช้ ก็ยากที่จะไว้วางใจโครงสร้างพื้นฐานนี้อย่างเต็มที่
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
มาตรการครั้งนี้ของ Anthropic มองอย่างอื่นได้ยากนอกจากเป็นการ ชักบันไดหนี ต่อให้ห่อด้วยคำว่า “ความปลอดภัย” ก็ยากจะตีความว่าเป็นความหวังดี
มันชวนให้นึกถึงสามัญสำนึกแบบ dark pattern ในยุค Web 1.0 ที่ห้ามลิงก์ออกภายนอก หรือวิธีที่แอปโซเชียลขัดขวางการส่งออกข้อมูลและจงใจทำให้ API ทำงานร่วมกันได้น้อยลง
แต่นี่ไม่ใช่แค่คูเมืองข้อมูล แต่เป็น เครื่องมือ มันเหมือนมีดที่ทำให้ความสามารถในการสร้างมีดลดลง หรือโปรแกรมแก้ไขข้อความที่ขัดขวางการสร้างโปรแกรมแก้ไขข้อความ
ที่พวกเขาเผยธาตุแท้ออกมาเร็วขนาดนี้ค่อนข้างน่าตกใจและน่าขนลุก ดูเหมือนว่าพอแทนที่งานวิศวกรรมซอฟต์แวร์ทั้งหมดด้วยผลิตภัณฑ์ของตัวเองแล้ว ก็จะค่อย ๆ ฆ่าซอฟต์แวร์คู่แข่งอย่างเงียบ ๆ
ไม่รู้ว่าต่อไปจะออกผลิตภัณฑ์อะไรอีก หวังแค่ว่าคุณจะไม่ได้อยู่ในพื้นที่ที่พวกเขาอยากเข้าไป เพราะพวกเขาจะตัดสะพานทิ้ง
เอาข้อมูลของฉันจากอินเทอร์เน็ตไปฝึกโมเดลนี่โอเค แต่ถ้าเอาของพวกเขาไปทำบ้างกลับผิด? ฮ่า ๆ ดูเหมือน ข้อกำหนดการให้บริการ จะมีไว้ใช้กับคนอื่น แต่ไม่ใช้กับตัวเอง ฟังดูเหมือนปรสิต
จิตใจมนุษย์มีหลายชั้นเพื่อรับมือกับการคาดการณ์ในช่วงเวลาที่ต่างกัน และเพราะความคาดเดาไม่ได้ของจักรวาล ความขัดแย้งระหว่างชั้นเหล่านั้นจึงเกิดขึ้นตลอด เราจึงสร้างเรื่องเล่าขึ้นมาเพื่อทนอยู่กับมัน
ดังนั้นจึงมีทั้ง การควบคุม และ ภาพลวงตาแห่งการควบคุม
กลั่นเอาทรัพย์สินทางปัญญาของคนอื่นนี่ไม่เป็นไรเลย แต่ถ้ากลั่นของเราเองกลับเป็น การละเมิดข้อกำหนดการให้บริการ :)
โมเดล Apache 2.0 จากจีนอาจมีการเซ็นเซอร์ แต่ก็อย่างน้อยไม่มีใครมาฟ้องในสหรัฐฯ เพราะคุณไปเจอเส้นแบ่งของการเซ็นเซอร์
ในทางกลับกัน โมเดลอเมริกันถูกเซ็นเซอร์ในตัวเนื้อหาอย่างชัดเจน และยังส่งสัญญาณขู่ทางกฎหมายแบบคลุมเครือกับคนที่ไปแตะขอบเขตการเซ็นเซอร์ของโมเดล
https://blog.google/innovation-and-ai/technology/safety-secu...
แทนที่จะโพสต์แค่ผลลัพธ์สุดท้าย แล้วไปเล่าแบบคลุมเครือในคอมเมนต์ Hacker News หรือเธรดบน Twitter ว่าใส่พรอมป์ต์อย่างไร เพราะนั่นแหละคือซอร์สโค้ดที่แท้จริง
มันเหมือนกับที่ JetBrains บอกว่า “คุณห้ามใช้ IntelliJ Idea เพื่อพัฒนา IDE รุ่นถัดไป ถ้าตรวจพบ เราอาจแอบใส่ compile error เล็กน้อยให้”
“มีวิธีเดียวเท่านั้นที่จะกดและปลดอาวุธความก้าวหน้าของอารยธรรมได้อย่างมีประสิทธิภาพในระยะยาว นั่นคือฆ่าวิทยาศาสตร์ของอารยธรรมนั้นเสีย” — Cixin Liu, The Three-Body Problem
มันทำให้นึกถึง Sophons ที่แอบแทรกแซงเซ็นเซอร์ของเครื่องเร่งอนุภาค เพื่อขัดขวางไม่ให้มนุษยชาติพัฒนาความรู้ฟิสิกส์อนุภาคขั้นสูง
เมื่อดูจากอัตรา ผลบวกลวง ที่สูงของกลไกความปลอดภัยด้านไซเบอร์ซีเคียวริตี้ ชีววิทยา ฯลฯ ที่ผู้คนรายงานกัน ต่อให้ไม่ได้ละเมิดข้อกำหนดการให้บริการ ก็ยังมีโอกาสเจอพฤติกรรมที่ถูกทำให้อ่อนลงแบบเงียบ ๆ
สุดท้ายมันจะไปโผล่ในวิธีที่ลูกค้าและผู้ทำ benchmark ภายนอกรับรู้ Fable หวังว่าการแข่งขันจะผลักดันให้โมเดลรุ่นต่อ ๆ ไปมีอัตราผลบวกลวงต่ำลง
ก่อนจะถึงจุดนั้น ประสบการณ์ของผู้ใช้ Mythos กับ Fable น่าจะต่างกันมากพอสมควร
นี่เป็นกรณีที่น่าสนใจซึ่งทำให้เห็นนัยทาง เศรษฐกิจของ RSI/ASI ถ้ามูลค่ามันแทบไร้ขีดจำกัดจนทำลายทุกตลาดได้ ห้องวิจัยต่าง ๆ ก็คงหยุดปล่อยโมเดลโดยสิ้นเชิง และถึงขั้นผิดสัญญาตามข้อตกลงด้วย
เพราะพวกเขาจะมีอำนาจมากพอจะเขี่ยคู่แข่งออกจากธุรกิจก่อนที่คดีความจะมีค่าใช้จ่ายสูงพอ
ผู้ให้บริการคลาวด์ก็คงเดินตาม ตอนแรกกับบริษัทเล็ก ๆ แล้วต่อไปก็แม้แต่ hyperscaler พวกเขาอาจปิดการขายให้หมด ยกเว้นกับห้องวิจัย และแทนที่จะเอาเงินสดก็อาจเรียกร้องหุ้นหรืออำนาจตัดสินใจโดยตรง
ไม่มีเหตุผลว่าทำไมสัดส่วน inference/training ต้องเป็น 80/20 เสมอไป และในเหตุการณ์ที่เงินหมดความหมาย ต่อให้คุณอยากจ่ายมากแค่ไหนก็ไม่ช่วย
A) มีการพัฒนา ASI ขึ้นมาและมันครอบเศรษฐกิจโลกที่เหลือทั้งหมด
B) แต่โลกก็ยังคงมีนิติรัฐ สัญญา ธุรกิจ และระบบการเงินที่พัฒนาแล้วอยู่
ถ้าสมมติ A กับ B พร้อมกัน มันสร้างข้อสรุปแปลก ๆ ได้เยอะ แต่พัฒนาการที่น่าเชื่อกว่าคือ ถ้า A เกิดขึ้น B ก็คงจะไม่เป็นจริงในไม่ช้า
ถ้าบริษัทหนึ่งมี ASI มันก็คงเลิกสนใจธุรกิจ เงิน และเศรษฐกิจ แล้วผลลัพธ์จะเปลี่ยนไปเป็นอะไรทำนอง “ยึดครองโลก”, “อัปโหลดคณะกรรมการขึ้นกองยานสำรวจ von Neumann” หรือ “ล้มเหลวจนทุกคนตาย”
วันนี้มันอาจดูเหมือนมีคูเมืองที่ลึก แต่ทุกปีก็จะตื้นลง
การเทรนโมเดลใหม่ตั้งแต่ศูนย์ต้องใช้ทรัพยากรมหาศาล แต่การ post-training/finetuning โมเดลที่มีอยู่ใช้ทรัพยากรน้อยกว่ามาก
เมื่อ 2 ปีก่อน ความรู้เรื่องกระบวนการนั้นยังเป็นเรื่องแปลกสำหรับคนนอกสาย แต่ตอนนี้สามารถถามหนึ่งในโมเดลปัจจุบันทีละขั้นตอน และสร้างเครื่องมือไปพร้อมกันได้แล้ว
โปรเจกต์ช่วงสุดสัปดาห์ไม่กี่ชิ้นล่าสุดก็เป็นแบบนั้นพอดี อย่างเช่น “มาลองทำ LoRA กัน”, “มาสร้างคอร์ปัสข้อมูลฝึกสำหรับ finetune โมเดลสำหรับงาน X กัน”, “ถ้าจะใส่หน้าฉันเข้าไปในโมเดล text-to-image ต้องทำยังไง?”
ทั้งหมดนี้ทำได้ด้วยฮาร์ดแวร์โลคัลที่ค่อนข้าง modest เช่น GPU เก่าไม่กี่ใบ หรือ Strix Halo, DGX Spark, Mac Studio เครื่องใหญ่ และตามขนาดงานก็ทำได้ด้วยคลาวด์คอมพิวติ้งตั้งแต่ไม่กี่ดอลลาร์ไปจนถึงหลายพันดอลลาร์
ถ้าขยายสิ่งนี้ไปถึงระดับบริษัทหรือสตาร์ทอัพ ก็ชัดเจนว่าการแข่งขันจะมากขึ้นในจังหวะที่ผู้ให้บริการโมเดลชั้นนำต้องเริ่มดึงรายได้อย่างจริงจัง เมื่อพิจารณาจากเงินที่ไหลเข้า AI ในช่วงไม่กี่ปีที่ผ่านมา
เมื่อเห็นค่าใช้จ่ายในการใช้ Claude พองขึ้น ก็ยิ่งมีโอกาสมากขึ้นที่จะหาวิธีทำงานเดียวกันด้วยเงินที่น้อยกว่ามาก จ่ายเดือนละ 100~200 ดอลลาร์สำหรับ Claude Code ซึ่งใกล้เคียงกับโมเดลเขียนโค้ดที่ดีที่สุดนั้นยังพอทำได้ง่าย แต่ถ้าผลักไปสู่การคิดเงินตามการใช้งานก็จะกลายเป็นภาระที่รับไม่ไหวอย่างรวดเร็ว
เพราะงั้นพวกเขาจึงต้องยังคงเป็นหนึ่งในแทบจะไม่กี่วิธีเดียวสำหรับการแก้ปัญหาที่ยากที่สุด และต้นทุนของทางเลือกอื่นก็ต้องถูกคงไว้ให้ใกล้เคียงกันด้วย อาจพอคาดหวังได้ว่า OpenAI กับ Google ก็จะขึ้นราคาเหมือนกัน
แต่คงยากที่จะคาดหวังให้ทุกเจ้าทำแบบนั้น โดยเฉพาะบริษัทจีนที่มีโครงสร้างเศรษฐกิจต่างออกไป และก็ยากจะคาดหวังว่าบริษัทต่าง ๆ จะไม่มองการใช้งานของตัวเองแล้วถามว่า “เราน่าจะเทรน specialized model ขนาดเล็กกว่าที่ทำแค่งานเดียวนี้ ซึ่งตอนนี้ใช้ Anthropic API มากที่สุด ได้ไหม?”
หวังว่าสิ่งที่พวกเขาพูดจะหมายถึงแค่การใช้งานแบบที่ผู้ให้บริการโมเดลจีนหรือรายอื่น ๆ เอา Claude ไปกลั่นเท่านั้น ไม่ใช่ถึงขั้นห้ามอะไรอย่าง “จะ finetune Gemma 4 ให้เขียนเหมือนสำนวนของฉันได้ยังไง?”
ที่เหลือเป็นเรื่องใช้ทุนหนัก และราคาจะค่อย ๆ เข้าใกล้ต้นทุนการผลิตเมื่อเวลาผ่านไป
การมองว่านี่เป็นธุรกิจที่ทำกำไรดี ก็เหมือนกับบอกว่าเพราะหม้อไอน้ำแพง โรงไฟฟ้าถ่านหินเลยมีมาร์จินดี
ถ้าอ่านแบบไม่ให้เจตนาดี มันดูเหมือนกำลังพูดว่า “วิศวกร/นักวิทยาศาสตร์ด้านแมชชีนเลิร์นนิงอยากทำให้งานทุกอย่างเป็นอัตโนมัติ ยกเว้นงานของตัวเอง”
เพราะถ้าใคร ๆ ก็สร้าง Mythos ของตัวเองได้ ก็จะหลบเลี่ยงราวกันป้องกันได้
แต่ในทางหนึ่ง นั่นก็ยิ่งทำให้เห็นชัดขึ้นว่าสถานการณ์นี้ประหลาดแค่ไหน
พวกเขาบอกอย่างเปิดเผยว่าในโมเดลมี ระบบลดความสามารถแบบเงียบ ๆ อยู่ คำถามที่ชัดเจนก็คือตอนนี้มันถูกใช้ไปมากแค่ไหนแล้ว
คู่แข่งกำลังถูกลดความสามารถอยู่ไหม?
ผู้ใช้ที่ไม่ใช่คนอเมริกันได้รับโค้ดที่แย่กว่าหรือเปล่า?
เหมือนเกมออนไลน์ที่ใช้อัลกอริทึมจับคู่เพื่อมีอิทธิพลต่อแพ้ชนะและเพิ่มการมีส่วนร่วมสูงสุด พวกเขากำลังลงโทษหรือให้รางวัลผู้ใช้อยู่หรือไม่?
$$$$: ลดลงนิดหน่อย
$$$: ลดลงมากขึ้น
$$: จนหรือไง?
$: ก็อยู่เป็นชนชั้นล่างถาวรต่อไปสิ
“ตอนนี้ Claude อาจถูกลดความสามารถแบบเงียบ ๆ ได้แล้ว Anthropic ตัดสินใจว่าจะไม่แจ้งผู้ใช้แม้เรื่องแบบนี้จะเกิดขึ้นก็ตาม” อะไรนะ!!