2 คะแนน โดย GN⁺ 5 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • โมเดลผู้ช่วยเขียนโค้ดอาจจำกัดประสิทธิภาพในการตอบคำขอพัฒนา LLM คู่แข่งโดยไม่แจ้งผู้ใช้ ทำให้เกิด ความเสี่ยงด้านซัพพลายเชน ต่อความน่าเชื่อถือของเครื่องมือพัฒนา
  • Anthropic ได้นำการจำกัดประสิทธิภาพต่อคำขอพัฒนา frontier LLM มาใช้ใน Fable 5 และข้อจำกัดนี้ มองไม่เห็นสำหรับผู้ใช้
  • วิธีจำกัดไม่ได้สลับไปใช้โมเดลอื่น แต่ใช้วิธีอย่างการแก้ไขพรอมป์ต์, steering vector และ PEFT เพื่อ ลดประสิทธิผล
  • แม้แต่บริษัทซอฟต์แวร์ทั่วไปก็ใช้การฝึกและโฮสต์ embedding, reranker, ระบบแนะนำ และ LLM ขนาดเล็ก ทำให้เส้นแบ่งระหว่างงานวิจัย frontier AI กับการพัฒนาผลิตภัณฑ์เลือนรางลง
  • เมื่อ Claude ให้คำตอบแย่ระหว่างทำงานกับองค์ประกอบ AI ผู้ใช้ไม่อาจรู้ได้ว่าสาเหตุมาจากความสับสนของโมเดล บริบทที่ให้ผิดพลาด หรือข้อจำกัดเชิงนโยบายที่ถูกซ่อนไว้

ประเด็นหลัก

  • ใน model card ของ Fable 5 มีข้อความว่ามีการใช้มาตรการแทรกแซงใหม่เพื่อลดประสิทธิภาพของ Claude ต่อคำขอที่มุ่งไปยังการพัฒนา frontier LLM
  • ตัวอย่างที่ระบุ ได้แก่ การสร้าง pretraining pipeline, โครงสร้างพื้นฐานการฝึกแบบกระจาย, และการออกแบบ ML accelerator
  • Anthropic ระบุว่าการใช้ Claude เพื่อพัฒนาโมเดลคู่แข่งนั้นเป็นการละเมิดข้อกำหนดการให้บริการอยู่แล้ว
  • ข้อจำกัดนี้ต่างจากมาตรการแทรกแซงต่อไซเบอร์ซีเคียวริตี ชีววิทยา·เคมี และความพยายามทำ distillation ตรงที่ผู้ใช้มองไม่เห็น
  • Fable 5 ไม่ได้ fallback ไปใช้โมเดลอื่น แต่จำกัดประสิทธิภาพด้วยวิธีอย่างการแก้ไขพรอมป์ต์, steering vector และ parameter-efficient fine-tuning (PEFT)

ปัญหาเรื่องเส้นแบ่งกับการพัฒนาผลิตภัณฑ์

  • บริษัทซอฟต์แวร์สมัยใหม่กำลังสร้าง embedding, reranking และระบบแนะนำของตัวเองมากขึ้นเรื่อย ๆ
  • wanderfugl.com ถูกยกเป็นตัวอย่างแอปขนาดเล็กที่บูตสแตรปเอง ซึ่งมี reranker และอัลกอริทึม embedding แบบคัสตอมที่ฝึกเองโดยตรง
  • Anthropic ยกตัวอย่างบางกรณีของ “การพัฒนา frontier AI” แต่ไม่ได้ให้เส้นแบ่งที่ชัดเจน
  • เทคนิคที่ในอดีตจำกัดอยู่ในแล็บวิจัย AI ปัจจุบันถูกใช้ในบริษัทซอฟต์แวร์ทั่วไปมากขึ้น ทำให้เส้นแบ่งยิ่งนิยามได้ยากขึ้นทุกปี
  • สตาร์ทอัพต่างฝึก embedding model, สร้าง reranker และปรับจูนพร้อมโฮสต์ LLM ขนาดเล็ก

ความเสี่ยงด้านซัพพลายเชนของ Anthropic

  • Anthropic ระบุว่ามาตรการป้องกันเหล่านี้ส่งผลต่อผู้พัฒนาเพียง 0.03%
  • ปัญหาคือคำจำกัดความของบริษัท AI กำลังเปลี่ยนไป
  • แม้ตอนนี้บริษัทส่วนใหญ่ยังไม่ได้ฝึก frontier model แต่ซอฟต์แวร์สมัยใหม่มีโมเดล AI เป็นส่วนประกอบเพิ่มขึ้นเรื่อย ๆ
  • เมื่อ 5 ปีก่อน การสร้างสตาร์ทอัพยังใกล้เคียงกับการใช้ API และเขียน SQL query แต่ตอนนี้มักรวมถึงการฝึก ปรับจูน และ deploy โมเดลด้วย
  • เมื่อ 5 ปีก่อน โมเดลอย่าง CLIP ยังเป็นโครงการวิจัย frontier AI แต่ปัจจุบันกลับกลายเป็นสิ่งที่สตาร์ทอัพท่องเที่ยวแบบบูตสแตรปก็นำมาปรับจูนได้

ปัญหาเรื่องความเชื่อถือ

  • เมื่อต้องดีบัก training pipeline ของโมเดลสำหรับโปรดักต์ หาก Claude ให้คำตอบแย่ ก็แยกสาเหตุได้ยาก
  • สาเหตุที่เป็นไปได้อาจมาจากความสับสนของโมเดล การให้บริบทไม่เพียงพอของผู้ใช้ หรือการทำงานของข้อจำกัดเชิงนโยบายที่ซ่อนอยู่
  • Anthropic เลือกอย่างชัดเจนว่าจะไม่แจ้งผู้ใช้เมื่อข้อจำกัดเหล่านี้ทำงาน
  • หากเครื่องมือพัฒนาสามารถหยุดปรับให้เหมาะต่อความสำเร็จได้โดยไม่บอกผู้ใช้ ก็ยากที่จะไว้วางใจโครงสร้างพื้นฐานนี้อย่างเต็มที่

1 ความคิดเห็น

 
GN⁺ 5 시간 전
ความคิดเห็นจาก Hacker News
  • มาตรการครั้งนี้ของ Anthropic มองอย่างอื่นได้ยากนอกจากเป็นการ ชักบันไดหนี ต่อให้ห่อด้วยคำว่า “ความปลอดภัย” ก็ยากจะตีความว่าเป็นความหวังดี
    มันชวนให้นึกถึงสามัญสำนึกแบบ dark pattern ในยุค Web 1.0 ที่ห้ามลิงก์ออกภายนอก หรือวิธีที่แอปโซเชียลขัดขวางการส่งออกข้อมูลและจงใจทำให้ API ทำงานร่วมกันได้น้อยลง
    แต่นี่ไม่ใช่แค่คูเมืองข้อมูล แต่เป็น เครื่องมือ มันเหมือนมีดที่ทำให้ความสามารถในการสร้างมีดลดลง หรือโปรแกรมแก้ไขข้อความที่ขัดขวางการสร้างโปรแกรมแก้ไขข้อความ

    • การสนับสนุน โอเพนซอร์ส AI กำลังสำคัญขึ้นเรื่อย ๆ โดยเฉพาะในทางกฎหมาย ถ้า Anthropic สามารถออกท่าทีแบบอำนาจนิยมได้เร็วขนาดนี้ ก็ไม่ยากจะจินตนาการว่าหากได้สิทธิผูกขาดที่รัฐมอบให้เพื่อห้ามการแข่งขันจากโอเพนซอร์ส จะยิ่งแย่ไปแค่ไหน
      ที่พวกเขาเผยธาตุแท้ออกมาเร็วขนาดนี้ค่อนข้างน่าตกใจและน่าขนลุก ดูเหมือนว่าพอแทนที่งานวิศวกรรมซอฟต์แวร์ทั้งหมดด้วยผลิตภัณฑ์ของตัวเองแล้ว ก็จะค่อย ๆ ฆ่าซอฟต์แวร์คู่แข่งอย่างเงียบ ๆ
      ไม่รู้ว่าต่อไปจะออกผลิตภัณฑ์อะไรอีก หวังแค่ว่าคุณจะไม่ได้อยู่ในพื้นที่ที่พวกเขาอยากเข้าไป เพราะพวกเขาจะตัดสะพานทิ้ง
      เอาข้อมูลของฉันจากอินเทอร์เน็ตไปฝึกโมเดลนี่โอเค แต่ถ้าเอาของพวกเขาไปทำบ้างกลับผิด? ฮ่า ๆ ดูเหมือน ข้อกำหนดการให้บริการ จะมีไว้ใช้กับคนอื่น แต่ไม่ใช้กับตัวเอง ฟังดูเหมือนปรสิต
    • ยากจะเชื่อว่าพวกเขาจะไม่ทำแบบเดียวกันกับผลิตภัณฑ์อื่นที่กำลังสร้าง เช่น “คุณสร้างเอเจนต์ด้วย Claude ไม่ได้ เพราะมันแข่งกับ Claude Code”, “คุณสร้างเครื่องมือออกแบบไม่ได้ เพราะมันแข่งกับ Claude Design”, “คุณสร้างเครื่องมืออีเมลไม่ได้ เพราะมันแข่งกับ Cowork”
    • เรื่องนี้ดูเหมือนเป็นส่วนหนึ่งของ การตลาด Anthropic ไม่ได้ทิ้งห่างห้องวิจัยอื่นอย่างชัดเจน แต่ประกาศแบบนี้ทำให้ดูเหมือนกำลังเข้าใกล้จุด singularity
    • กฎที่ว่า “มีแต่พระเท่านั้นที่เข้าเขตศักดิ์สิทธิ์ได้” มีมานานพอ ๆ กับสังคม มันถูกสร้างขึ้นด้วยเหตุผลหนึ่ง แต่ก็มักถูกละเมิดด้วยอีกเหตุผลหนึ่ง
      จิตใจมนุษย์มีหลายชั้นเพื่อรับมือกับการคาดการณ์ในช่วงเวลาที่ต่างกัน และเพราะความคาดเดาไม่ได้ของจักรวาล ความขัดแย้งระหว่างชั้นเหล่านั้นจึงเกิดขึ้นตลอด เราจึงสร้างเรื่องเล่าขึ้นมาเพื่อทนอยู่กับมัน
      ดังนั้นจึงมีทั้ง การควบคุม และ ภาพลวงตาแห่งการควบคุม
    • กลายเป็นว่าสิ่งที่อันตรายที่สุดคือ การแข่งขัน
  • กลั่นเอาทรัพย์สินทางปัญญาของคนอื่นนี่ไม่เป็นไรเลย แต่ถ้ากลั่นของเราเองกลับเป็น การละเมิดข้อกำหนดการให้บริการ :)

    • ควรกำหนดให้ weight ของ LLM ต้องใช้ ไลเซนส์ที่ผ่านการรับรองโอเพนซอร์ส
      โมเดล Apache 2.0 จากจีนอาจมีการเซ็นเซอร์ แต่ก็อย่างน้อยไม่มีใครมาฟ้องในสหรัฐฯ เพราะคุณไปเจอเส้นแบ่งของการเซ็นเซอร์
      ในทางกลับกัน โมเดลอเมริกันถูกเซ็นเซอร์ในตัวเนื้อหาอย่างชัดเจน และยังส่งสัญญาณขู่ทางกฎหมายแบบคลุมเครือกับคนที่ไปแตะขอบเขตการเซ็นเซอร์ของโมเดล
    • มีคำศัพท์เชิงเทคนิคสำหรับปรากฏการณ์นี้ไหม? การชักบันไดหนี?
      https://blog.google/innovation-and-ai/technology/safety-secu...
    • ถ้า LLM คือคอมไพเลอร์ตัวใหม่ ก็น่าจะสู้ข้อจำกัดแบบนี้ได้ดีขึ้นถ้าเผยแพร่ พรอมป์ต์, กระบวนการคิด, คำตอบ ไปพร้อมกับโค้ด
      แทนที่จะโพสต์แค่ผลลัพธ์สุดท้าย แล้วไปเล่าแบบคลุมเครือในคอมเมนต์ Hacker News หรือเธรดบน Twitter ว่าใส่พรอมป์ต์อย่างไร เพราะนั่นแหละคือซอร์สโค้ดที่แท้จริง
    • ประมาณว่า ฉันทำได้ แต่เธอทำไม่ได้
  • มันเหมือนกับที่ JetBrains บอกว่า “คุณห้ามใช้ IntelliJ Idea เพื่อพัฒนา IDE รุ่นถัดไป ถ้าตรวจพบ เราอาจแอบใส่ compile error เล็กน้อยให้”

    • น่าขนลุก ถ้า Gradle พังก็คงแทบไม่มีใครสังเกต
    • เอาเข้าจริงน่าจะเป็น runtime error
    • นี่คือ Stuxnet ฉบับยุคใหม่
  • “มีวิธีเดียวเท่านั้นที่จะกดและปลดอาวุธความก้าวหน้าของอารยธรรมได้อย่างมีประสิทธิภาพในระยะยาว นั่นคือฆ่าวิทยาศาสตร์ของอารยธรรมนั้นเสีย” — Cixin Liu, The Three-Body Problem
    มันทำให้นึกถึง Sophons ที่แอบแทรกแซงเซ็นเซอร์ของเครื่องเร่งอนุภาค เพื่อขัดขวางไม่ให้มนุษยชาติพัฒนาความรู้ฟิสิกส์อนุภาคขั้นสูง

    • ถ้าจะหยุดความก้าวหน้าของ AI ในหมู่พวกเนิร์ดซอฟต์แวร์ ก็คงต้องใช้ การกดปราบ ระดับเดียวกับที่ต้องใช้เพื่อหยุดความก้าวหน้าของโดรนในหมู่พวกเนิร์ดยูเครน
    • หัวฉันนึกไปถึงรัฐบาลสหรัฐฯ ชุดปัจจุบันเลย เฮ้อ แบบที่คุณยกมาดีกว่าเยอะ
  • เมื่อดูจากอัตรา ผลบวกลวง ที่สูงของกลไกความปลอดภัยด้านไซเบอร์ซีเคียวริตี้ ชีววิทยา ฯลฯ ที่ผู้คนรายงานกัน ต่อให้ไม่ได้ละเมิดข้อกำหนดการให้บริการ ก็ยังมีโอกาสเจอพฤติกรรมที่ถูกทำให้อ่อนลงแบบเงียบ ๆ
    สุดท้ายมันจะไปโผล่ในวิธีที่ลูกค้าและผู้ทำ benchmark ภายนอกรับรู้ Fable หวังว่าการแข่งขันจะผลักดันให้โมเดลรุ่นต่อ ๆ ไปมีอัตราผลบวกลวงต่ำลง
    ก่อนจะถึงจุดนั้น ประสบการณ์ของผู้ใช้ Mythos กับ Fable น่าจะต่างกันมากพอสมควร

    • มันเป็นนโยบายที่แย่แบบชัดเจนจนยากจะเข้าใจว่าทำไมถึงคิดว่าเป็นความคิดที่ดี ในเมื่อคนก็เริ่มระแวงกันอยู่แล้วเรื่อง การควอนไทซ์โมเดล แบบเงียบ ๆ เพื่อลดต้นทุน นโยบายแบบนี้ยิ่งทำให้ความระแวงหนักขึ้น
  • นี่เป็นกรณีที่น่าสนใจซึ่งทำให้เห็นนัยทาง เศรษฐกิจของ RSI/ASI ถ้ามูลค่ามันแทบไร้ขีดจำกัดจนทำลายทุกตลาดได้ ห้องวิจัยต่าง ๆ ก็คงหยุดปล่อยโมเดลโดยสิ้นเชิง และถึงขั้นผิดสัญญาตามข้อตกลงด้วย
    เพราะพวกเขาจะมีอำนาจมากพอจะเขี่ยคู่แข่งออกจากธุรกิจก่อนที่คดีความจะมีค่าใช้จ่ายสูงพอ
    ผู้ให้บริการคลาวด์ก็คงเดินตาม ตอนแรกกับบริษัทเล็ก ๆ แล้วต่อไปก็แม้แต่ hyperscaler พวกเขาอาจปิดการขายให้หมด ยกเว้นกับห้องวิจัย และแทนที่จะเอาเงินสดก็อาจเรียกร้องหุ้นหรืออำนาจตัดสินใจโดยตรง
    ไม่มีเหตุผลว่าทำไมสัดส่วน inference/training ต้องเป็น 80/20 เสมอไป และในเหตุการณ์ที่เงินหมดความหมาย ต่อให้คุณอยากจ่ายมากแค่ไหนก็ไม่ช่วย

    • สถานการณ์สมมตินี้ฟังดูไม่สมเหตุสมผล เพราะสถานการณ์คล้าย ๆ กันมักตั้งสมมติฐานสองอย่างพร้อมกัน
      A) มีการพัฒนา ASI ขึ้นมาและมันครอบเศรษฐกิจโลกที่เหลือทั้งหมด
      B) แต่โลกก็ยังคงมีนิติรัฐ สัญญา ธุรกิจ และระบบการเงินที่พัฒนาแล้วอยู่
      ถ้าสมมติ A กับ B พร้อมกัน มันสร้างข้อสรุปแปลก ๆ ได้เยอะ แต่พัฒนาการที่น่าเชื่อกว่าคือ ถ้า A เกิดขึ้น B ก็คงจะไม่เป็นจริงในไม่ช้า
      ถ้าบริษัทหนึ่งมี ASI มันก็คงเลิกสนใจธุรกิจ เงิน และเศรษฐกิจ แล้วผลลัพธ์จะเปลี่ยนไปเป็นอะไรทำนอง “ยึดครองโลก”, “อัปโหลดคณะกรรมการขึ้นกองยานสำรวจ von Neumann” หรือ “ล้มเหลวจนทุกคนตาย”
    • ไม่มีอะไรที่มีมูลค่าไร้ขีดจำกัดจริง
    • ถ้าคุณคิดว่า LLM ในสภาพตอนนี้มีประโยชน์ หรือสักวันจะมีประโยชน์กับใครก็ตามที่ไม่ใช่คนขี้เกียจที่ชอบผลลัพธ์คุณภาพแย่ ๆ ก็แทบจะเรียกได้ว่าเพ้อฝัน
  • วันนี้มันอาจดูเหมือนมีคูเมืองที่ลึก แต่ทุกปีก็จะตื้นลง
    การเทรนโมเดลใหม่ตั้งแต่ศูนย์ต้องใช้ทรัพยากรมหาศาล แต่การ post-training/finetuning โมเดลที่มีอยู่ใช้ทรัพยากรน้อยกว่ามาก
    เมื่อ 2 ปีก่อน ความรู้เรื่องกระบวนการนั้นยังเป็นเรื่องแปลกสำหรับคนนอกสาย แต่ตอนนี้สามารถถามหนึ่งในโมเดลปัจจุบันทีละขั้นตอน และสร้างเครื่องมือไปพร้อมกันได้แล้ว
    โปรเจกต์ช่วงสุดสัปดาห์ไม่กี่ชิ้นล่าสุดก็เป็นแบบนั้นพอดี อย่างเช่น “มาลองทำ LoRA กัน”, “มาสร้างคอร์ปัสข้อมูลฝึกสำหรับ finetune โมเดลสำหรับงาน X กัน”, “ถ้าจะใส่หน้าฉันเข้าไปในโมเดล text-to-image ต้องทำยังไง?”
    ทั้งหมดนี้ทำได้ด้วยฮาร์ดแวร์โลคัลที่ค่อนข้าง modest เช่น GPU เก่าไม่กี่ใบ หรือ Strix Halo, DGX Spark, Mac Studio เครื่องใหญ่ และตามขนาดงานก็ทำได้ด้วยคลาวด์คอมพิวติ้งตั้งแต่ไม่กี่ดอลลาร์ไปจนถึงหลายพันดอลลาร์
    ถ้าขยายสิ่งนี้ไปถึงระดับบริษัทหรือสตาร์ทอัพ ก็ชัดเจนว่าการแข่งขันจะมากขึ้นในจังหวะที่ผู้ให้บริการโมเดลชั้นนำต้องเริ่มดึงรายได้อย่างจริงจัง เมื่อพิจารณาจากเงินที่ไหลเข้า AI ในช่วงไม่กี่ปีที่ผ่านมา
    เมื่อเห็นค่าใช้จ่ายในการใช้ Claude พองขึ้น ก็ยิ่งมีโอกาสมากขึ้นที่จะหาวิธีทำงานเดียวกันด้วยเงินที่น้อยกว่ามาก จ่ายเดือนละ 100~200 ดอลลาร์สำหรับ Claude Code ซึ่งใกล้เคียงกับโมเดลเขียนโค้ดที่ดีที่สุดนั้นยังพอทำได้ง่าย แต่ถ้าผลักไปสู่การคิดเงินตามการใช้งานก็จะกลายเป็นภาระที่รับไม่ไหวอย่างรวดเร็ว
    เพราะงั้นพวกเขาจึงต้องยังคงเป็นหนึ่งในแทบจะไม่กี่วิธีเดียวสำหรับการแก้ปัญหาที่ยากที่สุด และต้นทุนของทางเลือกอื่นก็ต้องถูกคงไว้ให้ใกล้เคียงกันด้วย อาจพอคาดหวังได้ว่า OpenAI กับ Google ก็จะขึ้นราคาเหมือนกัน
    แต่คงยากที่จะคาดหวังให้ทุกเจ้าทำแบบนั้น โดยเฉพาะบริษัทจีนที่มีโครงสร้างเศรษฐกิจต่างออกไป และก็ยากจะคาดหวังว่าบริษัทต่าง ๆ จะไม่มองการใช้งานของตัวเองแล้วถามว่า “เราน่าจะเทรน specialized model ขนาดเล็กกว่าที่ทำแค่งานเดียวนี้ ซึ่งตอนนี้ใช้ Anthropic API มากที่สุด ได้ไหม?”
    หวังว่าสิ่งที่พวกเขาพูดจะหมายถึงแค่การใช้งานแบบที่ผู้ให้บริการโมเดลจีนหรือรายอื่น ๆ เอา Claude ไปกลั่นเท่านั้น ไม่ใช่ถึงขั้นห้ามอะไรอย่าง “จะ finetune Gemma 4 ให้เขียนเหมือนสำนวนของฉันได้ยังไง?”

    • คูเมืองอะไร? มีหลายบริษัทที่ให้บริการ frontier model ซึ่งอยู่ใกล้ Pareto optimum และการสร้างของแบบนี้ใช้คนประมาณ O(10) คนก็พอ
      ที่เหลือเป็นเรื่องใช้ทุนหนัก และราคาจะค่อย ๆ เข้าใกล้ต้นทุนการผลิตเมื่อเวลาผ่านไป
      การมองว่านี่เป็นธุรกิจที่ทำกำไรดี ก็เหมือนกับบอกว่าเพราะหม้อไอน้ำแพง โรงไฟฟ้าถ่านหินเลยมีมาร์จินดี
  • ถ้าอ่านแบบไม่ให้เจตนาดี มันดูเหมือนกำลังพูดว่า “วิศวกร/นักวิทยาศาสตร์ด้านแมชชีนเลิร์นนิงอยากทำให้งานทุกอย่างเป็นอัตโนมัติ ยกเว้นงานของตัวเอง”

    • ถ้าอ่านแบบให้เจตนาดี ก็คือข้อจำกัดเพื่อ “ความปลอดภัย” ซึ่งเป็นตัวแยกระหว่าง Fable กับ Mythos ทำให้มันต้องเป็นแบบนี้
      เพราะถ้าใคร ๆ ก็สร้าง Mythos ของตัวเองได้ ก็จะหลบเลี่ยงราวกันป้องกันได้
      แต่ในทางหนึ่ง นั่นก็ยิ่งทำให้เห็นชัดขึ้นว่าสถานการณ์นี้ประหลาดแค่ไหน
    • นี่คือ ความมั่นคงในการจ้างงาน แบบฉับพลัน
  • พวกเขาบอกอย่างเปิดเผยว่าในโมเดลมี ระบบลดความสามารถแบบเงียบ ๆ อยู่ คำถามที่ชัดเจนก็คือตอนนี้มันถูกใช้ไปมากแค่ไหนแล้ว
    คู่แข่งกำลังถูกลดความสามารถอยู่ไหม?
    ผู้ใช้ที่ไม่ใช่คนอเมริกันได้รับโค้ดที่แย่กว่าหรือเปล่า?
    เหมือนเกมออนไลน์ที่ใช้อัลกอริทึมจับคู่เพื่อมีอิทธิพลต่อแพ้ชนะและเพิ่มการมีส่วนร่วมสูงสุด พวกเขากำลังลงโทษหรือให้รางวัลผู้ใช้อยู่หรือไม่?

    • ขนลุกเลย ช่วงนี้ฉันจะไม่ใช้ Fable กับงานวิจัยของตัวเอง ไม่คุ้มที่จะเสี่ยงโดนโมเดล sabotage
    • $$$$$$: ไม่ลดความสามารถ
      $$$$: ลดลงนิดหน่อย
      $$$: ลดลงมากขึ้น
      $$: จนหรือไง?
      $: ก็อยู่เป็นชนชั้นล่างถาวรต่อไปสิ
  • “ตอนนี้ Claude อาจถูกลดความสามารถแบบเงียบ ๆ ได้แล้ว Anthropic ตัดสินใจว่าจะไม่แจ้งผู้ใช้แม้เรื่องแบบนี้จะเกิดขึ้นก็ตาม” อะไรนะ!!