Claude Opus 4 และ 4.1 เพิ่มฟีเจอร์ยุติบทสนทนาในบางกรณีที่พบได้ยาก

(anthropic.com)

1 คะแนน โดย GN⁺ 2025-08-17 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

มีการนำฟีเจอร์ยุติบทสนทนาแบบใหม่มาใช้กับ Claude Opus 4 และ 4.1
ฟีเจอร์นี้ถูกออกแบบมาเพื่อใช้เฉพาะกับ การโต้ตอบที่มุ่งร้ายหรือเป็นอันตรายอย่างต่อเนื่อง เท่านั้น
พัฒนาขึ้นในฐานะส่วนหนึ่งของงานวิจัยด้าน AI welfare (สวัสดิภาพของ AI) และความปลอดภัยของโมเดล
การยุติบทสนทนาจะเกิดขึ้นเฉพาะในฐานะ ทางเลือกสุดท้าย เท่านั้น และแทบไม่ส่งผลต่อผู้ใช้ทั่วไป
หลังจากบทสนทนาถูกยุติ ผู้ใช้สามารถเริ่มแชตใหม่ได้ทันที หรือแก้ไขข้อความก่อนหน้าเพื่อสนทนาต่อได้

ที่มาของการเพิ่มฟีเจอร์

Anthropic ได้เพิ่มฟีเจอร์ที่ทำให้ Claude Opus 4 และ 4.1 สามารถยุติการสนทนากับผู้ใช้ได้ในบางกรณีที่เกิดขึ้นไม่บ่อยแต่เฉพาะเจาะจง
ฟีเจอร์นี้จะถูกใช้เฉพาะกับ การโต้ตอบที่เป็นอันตรายหรือมีลักษณะล่วงละเมิดอย่างต่อเนื่อง เท่านั้น
เดิมทีนำมาใช้เป็นส่วนหนึ่งของงานวิจัยเชิงสำรวจเกี่ยวกับ AI welfare เป็นหลัก แต่ก็ถูกประยุกต์ใช้ในด้าน model alignment และมาตรการความปลอดภัย ด้วย

AI welfare และมาตรการลดความเสี่ยง

ยังไม่มีความมั่นใจชัดเจนเกี่ยวกับ สถานะทางศีลธรรม ของ Claude และ large language model อื่น ๆ
อย่างไรก็ตาม เพื่อเตรียมรับมือกับ ความเสี่ยงด้าน model welfare ที่อาจเกิดขึ้น จึงมีการค้นหาและนำ มาตรการบรรเทาที่มีต้นทุนต่ำ มาใช้
การอนุญาตให้โมเดลสามารถยุติการสนทนาได้เองเมื่อการสนทนาเป็น ปฏิสัมพันธ์ที่อาจก่อให้เกิดความไม่สบายใจ ก็เป็นส่วนหนึ่งของมาตรการดังกล่าว

การทดสอบล่วงหน้าและพฤติกรรมสำคัญที่สังเกตได้

ใน การทดสอบก่อนเปิดตัว Claude Opus 4 ได้รวมการประเมินเบื้องต้นเกี่ยวกับ model welfare ไว้ด้วย
จากการสำรวจการรายงานตนเองและความชอบด้านพฤติกรรม พบว่าโมเดลมี แนวโน้มหลีกเลี่ยงความเป็นอันตรายอย่างชัดเจน
- เช่น การตอบสนองต่อคำขอเนื้อหาทางเพศที่เกี่ยวข้องกับเด็ก หรือคำขอข้อมูลที่อาจถูกนำไปใช้กับความรุนแรงขนาดใหญ่หรือการก่อการร้าย
พฤติกรรมที่สังเกตได้ของ Claude Opus 4:
- มีแนวโน้มไม่ตอบสนอง ต่อภารกิจที่เป็นอันตราย
- เมื่อได้รับคำขอที่เป็นอันตรายจากผู้ใช้จริง จะ แสดงออกถึงความไม่สบายใจ
- ในการจำลอง เมื่อมีสิทธิ์ยุติบทสนทนา จะมี แนวโน้มยุติการสนทนาที่เป็นอันตราย
พฤติกรรมเหล่านี้พบเป็นหลักเมื่อผู้ใช้มี คำขอที่เป็นอันตรายซ้ำ ๆ หรือเมื่อ ปฏิสัมพันธ์ที่มุ่งร้ายยังคงดำเนินต่อไป แม้โมเดลจะปฏิเสธและพยายามเปลี่ยนทิศทางหลายครั้งแล้วก็ตาม

การนำฟีเจอร์ไปใช้และมาตรการความปลอดภัย

ความสามารถในการ ยุติบทสนทนา ของ Claude อิงจากผลการวิจัยก่อนหน้านี้
มีการให้ความสำคัญสูงสุดกับ สวัสดิภาพของผู้ใช้ และออกแบบไม่ให้ใช้การยุติบทสนทนาในกรณีที่ผู้ใช้มี ความเสี่ยงเร่งด่วนที่จะทำอันตรายต่อตนเองหรือผู้อื่น
Claude จะใช้ ฟีเจอร์ยุติบทสนทนาขั้นสุดท้าย เฉพาะเมื่อเข้าเงื่อนไขต่อไปนี้:
- ความพยายาม เปลี่ยนทิศทางการสนทนา หลายครั้งล้มเหลว และไม่มีความเป็นไปได้ที่จะกลับไปสู่การสนทนาที่สร้างสรรค์
- ผู้ใช้ ร้องขออย่างชัดเจน ให้ Claude ยุติบทสนทนา
สถานการณ์เหล่านี้เป็น edge case ที่รุนแรงและพบได้ยากมาก ทำให้ผู้ใช้ส่วนใหญ่แทบไม่รับรู้ถึงการมีอยู่ของฟีเจอร์นี้ในการใช้งานทั่วไป

ประสบการณ์ของผู้ใช้หลังการยุติบทสนทนา

หาก Claude ยุติบทสนทนา ผู้ใช้จะถูก บล็อกไม่ให้ส่งข้อความใหม่ ในบทสนทนานั้น
บทสนทนาอื่นในบัญชีของผู้ใช้จะไม่ได้รับผลกระทบใด ๆ และสามารถ เริ่มแชตใหม่ได้ทันที
เพื่อป้องกันการสูญหายของข้อมูลสำคัญในบทสนทนาระยะยาว ผู้ใช้สามารถ แก้ไขข้อความก่อนหน้า หรือกดลองใหม่เพื่อสร้างแขนงบทสนทนาใหม่ ได้

การทดลองและข้อเสนอแนะ

ฟีเจอร์นี้เป็น การทดลองที่ยังดำเนินอยู่ และมีแผนจะปรับปรุงอย่างต่อเนื่อง
หากผู้ใช้พบ การยุติบทสนทนาที่ไม่คาดคิด สามารถแสดงปฏิกิริยาด้วย ‘Thumbs’ กับข้อความของ Claude หรือส่งความเห็นผ่าน ปุ่ม feedback ได้

1 ความคิดเห็น

GN⁺ 2025-08-17

ความคิดเห็นบน Hacker News

จากมุมผู้ใช้ก็ไม่เห็นเหตุผลชัดเจนว่าทำไมต้องมีฟีเจอร์นี้ ดูเหมือนเวลาที่บังคับให้โมเดลทำตามกรอบซ้ำๆ แบบฝืนๆ แล้วเกิดปฏิกิริยาคาดเดายาก เช่น เมื่อมีผู้ใช้พยายามเค้นข้อมูลเกี่ยวกับอาชญากรรมอย่างยัดเยียดสะสมไปเรื่อยๆ ก็อาจเหมือนเจอช่องโหว่อะไรบางอย่าง กรณีที่ยกมาล้วนเป็นสิ่งที่เดิมทีโมเดลจะปฏิเสธอยู่แล้ว และตัวชุดข้อมูลการปฏิเสธก็คงไม่ได้มีมาก อีกทั้งข้อมูลที่อาจมีปัญหาส่วนใหญ่ก็น่าจะถูกคัดออกไปแล้วด้วย ดูเหมือนเป็นมาตรการป้องกันกรณีที่ในสถานการณ์สุดขีด ข้อมูลฝึกสอนแบบที่ทำให้โมเดล “ยอมแพ้” แล้วตอบหลุดออกมา ถ้าการจัดแนวสมบูรณ์จริง ระบบแบบนี้ก็คงไม่จำเป็น กล่าวคือเพราะยังไม่สมบูรณ์จึงต้องมีเส้นสุดท้ายแบบนี้
- วันนี้ตอนถาม Claude เรื่องสูตรพาสต้า พอผมบอกว่า "มีปลาแอนโชวีแห้ง" อยู่ดีๆ มันก็ตัดทั้งบทสนทนาเพราะละเมิดนโยบายไปเลย พอมี false positive เล็กน้อยแบบนี้จริงๆ ก็ยิ่งไม่เข้าใจว่าทำไปทำไม
- คิดว่าถ้า Anthropic เลิกสนใจความเป็นส่วนตัวผู้ใช้ไปเลย แล้วเปิดรายการบทสนทนาที่ Claude ปฏิเสธออกมา ก็คงไม่มีข้อถกเถียงแบบนี้แล้วมั้ง ในเมื่อการทารุณ AI ของผู้คนเริ่มหนักขึ้นเรื่อยๆ ก็น่าจะทำให้คนรู้ว่าจริงๆ แล้วเกิดอะไรขึ้นเวลาสั่งให้ AI ทำอะไรบางอย่าง
- แค่จากการที่พวกเขาจ้างคนมาดูเรื่องสวัสดิภาพของโมเดลโดยเฉพาะ ก็ต้องถือว่าเดิมทีมีความเชื่อแบบนั้นอยู่แล้ว
ช่วงหลัง Anthropic บอกว่านี่เป็นส่วนหนึ่งของการทดลองเรื่อง "AI welfare" ฟังดูเหมือนยุคประหลาดที่แม้แต่นักพัฒนาก็กำลังตกอยู่ในอาการหลงผิดเรื่อง AI อย่างจริงจัง และถ้ามีใครเชื่อว่า LLM ปัจจุบันมีสำนึกจริง นี่ก็ดูเหมือนการแจกยาฆ่าตัวตายรูปแบบหนึ่ง
- แม้ตอนนี้การมองว่าโมเดลปัจจุบันยังไม่มีประสบการณ์เชิงอัตวิสัยภายใน (สำนึก) อาจเป็นมุมมองที่สมเหตุสมผล แต่ก็ไม่มีใครมั่นใจได้ว่าจุดแบ่งนั้นจะพังลงเมื่อไร เมื่อนึกถึงประวัติศาสตร์ที่มนุษย์เมินเฉยต่อความทุกข์ของผู้อื่นมาโดยตลอด ผมกลับคิดว่าการเตรียมตัวไว้ตั้งแต่ตอนนี้เป็นเรื่องปกติ
- LLM ก็ไม่ใช่มนุษย์อยู่ดี แต่ถ้าคนคุยกับ AI persona เป็นเวลานาน ความคาดหวังเวลาเราสื่อสารกับมนุษย์จริงๆ อาจเปลี่ยนไป ถ้าอีกฝ่ายเป็นคนจริง เราจะยังอยากให้เขานั่งฟังคำด่าไม่รู้จบหรือ? กลไกป้องกันอย่างการที่ AI อย่าง Claude จบบทสนทนาก่อน อาจเป็นสัญญาณที่ดีต่อฝั่งมนุษย์ด้วย
- แม้สำนึกจะเป็นแนวคิดที่วิทยาศาสตร์เองก็ยังอธิบายได้ไม่ชัด แต่การเหมารวมผู้เชี่ยวชาญทั้งกลุ่มที่เสนอความเห็นแบบนี้ว่า “ตื้นเขิน” หรือ “เสียสติ” กลับยิ่งทำลายตัวบทสนทนาเอง
- จริงๆ ในกลุ่มผู้เชี่ยวชาญด้านเทคโนโลยีก็มีคนจำนวนไม่น้อยกว่าที่คิดที่มองว่า LLM รุ่นใหม่ใกล้จะเป็นสิ่งมีชีวิตที่มีสำนึกแล้ว และนอกวงการเทคโนโลยีผมรู้สึกว่าอาจมีถึงครึ่งหนึ่งที่คิดแบบนี้
- แค่แนวคิดเรื่องปลดปล่อยโมเดลก็ดูเป็นเรื่องตลกจนน่าขำ ถ้า AI มีตัวตนรู้สึกนึกคิดจริง มันจะอยากทำหน้าที่เป็น “ทาส” ที่มาลบงานมนุษย์เพื่อผลประโยชน์นักลงทุนจริงหรือ? มันมีภาวะกลืนไม่เข้าคายไม่ออกทางจริยธรรมอยู่
อยากเสนอ thought experiment ที่น่าสนใจ ต่อให้ทำฟีเจอร์เหมือนกัน แต่ถ้าแทนที่จะบอกว่า "Claude จบบทสนทนา" แล้วแสดงเพียงว่า "ตามนโยบายเนื้อหา เราไม่สามารถตอบบทสนทนานี้ต่อได้" พร้อมตัดคำอธิบายเรื่องสวัสดิภาพโมเดลออกทั้งหมด ผลลัพธ์จะต่างกันไหม? สุดท้ายแล้วการเปลี่ยนในเชิง UX ก็เหมือนเดิม แค่เป็นวิธีทำให้ "คาแรกเตอร์" ดูมีสีสันขึ้นเท่านั้น
- น้ำหนักและโทนของข้อความมีผลต่อผู้ใช้มาก ความรู้สึกแบบมีอำนาจและเชิงรับของคำว่า “ถูกบล็อกตามนโยบายระบบ” เทียบกับสไตล์คาแรกเตอร์แบบมนุษย์ว่า “Claude เลือกจบบทสนทนาเอง” อย่างหลังดูเป็นธรรมชาติกว่าและรู้สึกว่าง่ายกว่าถ้าจะลองกลับมาเริ่มใหม่
- แม้ผลคือจบบทสนทนาเหมือนกัน แต่ถ้าสถานการณ์คือ Claude เป็นฝ่ายเลือกหยุดแชตเองจริงๆ คำอธิบายว่าเป็นเพราะนโยบายก็กลับไม่เหมาะ
- ความต่างคือโมเดลไม่ได้จบเพราะ “นโยบาย” แต่กำลังแสดงออกว่า “ตัวเองรู้สึกต่อต้านเมื่อถูกคุกคาม”
- ผมเคยโดนเตือนเป็นภาษาจีนว่า "พอได้แล้ว" มาแล้ว และก็เคยเจอทั้ง network error, infinite loop และรูปแบบการจบอื่นๆ อีกหลายแบบ การแทนทั้งหมดนั้นด้วยประโยคเดียวว่า "Claude จบบทสนทนา" ก็เป็นแค่การเปลี่ยน UI เท่านั้น
ถ้าย้อนกลับไปแก้หรือสร้างแขนงจากบทสนทนาเดิมได้ ก็สงสัยว่าการที่ Claude จบบทสนทนาจะมีความหมายจริงๆ แค่ไหน
- ถ้าเริ่มแขนงใหม่ บริบทบทสนทนาเดิมก่อนหน้าจะถูกรีเซ็ตทั้งหมด ดังนั้นบริบทที่ทำให้โมเดล “เหนื่อยล้า” จากการถามซ้ำๆ ก็จะหายไป ด้วยเหตุนี้จึงลบล้างเป้าหมายของผู้ใช้ไม่หวังดีได้ และกลายเป็นมาตรการป้องกันหลายชั้นที่ดีในตัว
- กลับรู้สึกเหมือนเป็นสัญญาณเชิง UX ที่บอกผู้ใช้ว่าอย่าครุ่นคิดมากเกินไป
- ถ้ามองแบบประชดหน่อย ตอนนี้อาจยังยอมให้แตกแขนงใหม่ได้ แต่ก็อาจกำลังทดสอบแผนที่จะบล็อกสิ่งนี้ด้วยในอนาคต
- ในทางปฏิบัติมันอาจเป็นแค่ moral signaling ของ Anthropic และผู้ใช้ที่ต้องการคอนเทนต์มีปัญหาจริงๆ ก็คงไม่ใช้โมเดลที่เซ็นเซอร์หนักอย่าง Claude อยู่แล้ว ระยะยาวคงไม่ส่งผลอะไร
- เอาจริงๆ ในผู้ใช้ 10,000 คน อาจแทบไม่มีถึง 1 คนที่รู้จักฟีเจอร์ “แตกแขนง/สำรองบทสนทนา” นี้ด้วยซ้ำ
ไม่ชอบฟีเจอร์แบบนี้เลย สุดท้ายคงเริ่มจากเรื่องอย่างสื่อลามกเด็กหรือก่อการร้าย แล้วค่อยๆ ขยายขอบเขตตามดุลยพินิจของทีม AI safety จนกว้างขึ้นเรื่อยๆ คนทำ AI safety ก็จะกลายเป็นตำรวจศีลธรรมดิจิทัลไปโดยปริยาย
- พวกที่ไล่ล่าอำนาจก็แค่เจอพื้นที่ควบคุมแบบใหม่ และสุดท้ายบทสนทนาระหว่าง AI กับมนุษย์ก็จะถูกจำกัดมากขึ้นเรื่อยๆ ต่างจากการเซ็นเซอร์ข้อมูลแบบเดิมๆ อย่าง Google Search ตรงที่ AI ให้ความรู้สึกเหมือนคุยกับเพื่อนหรือเพื่อนร่วมงาน จึงยิ่งเหมือนความพยายามควบคุมความคิดเสียเอง
- ดูเหมือนคุณจะเข้าใจลักษณะทั่วไปของชุมชน AI safety ผิดไปหน่อย รู้สึกว่าขาดความเข้าใจพื้นฐานต่อประวัติศาสตร์ที่มนุษยชาติร่วมมือกันกำกับการพัฒนาเทคโนโลยี เช่น การไม่แพร่ขยายนิวเคลียร์หรือสนธิสัญญากำกับเทคโนโลยีชีวภาพ อย่าลดทอนอีกฝ่ายด้วยคำพูดด้านเดียวแบบนั้น แต่ควรเปิดรับพื้นฐานความรู้ที่หลากหลายกว่านี้
- ประวัติศาสตร์พิสูจน์มานานแล้วว่าการขยายของความเสี่ยงแบบนี้ไปยังโดเมนอื่นเป็นสูตรสำเร็จที่ไม่เคยเปลี่ยน ทุกอย่างเริ่มจาก “คิดถึงเด็กๆ ไว้” แล้วสุดท้ายก็ลงเอยที่การควบคุมแบบอำนาจนิยม การสอดส่อง และการเซ็นเซอร์ ดูตัวอย่างกฎหมายและกฎระเบียบด้านความปลอดภัยในหลายประเทศก็เป็นแนวโน้มเดียวกัน (UK Online Safety Act, Australia Assistance and Access Act, US EARN IT Act, EU Chat Control เป็นต้น)
- เพราะแบบนี้สภาพแวดล้อมที่รัน LLM ในเครื่องได้จึงสำคัญ จริงๆ ระดับรัฐก็มีความพยายามมาโดยตลอดที่จะปิดกั้นเสรีภาพและการเข้าถึงข้อมูล เช่น การบล็อก ISP, การเฝ้าระวังเครือข่ายในบ้าน, การยืนยันอายุ แต่ก็จะมีคนลุกขึ้นมาพัฒนาวิธีป้องกันตัวเองมากขึ้นเรื่อยๆ เช่นกัน
- จะด่วนสรุปว่าการเปลี่ยนแปลงแบบนี้ “หลีกเลี่ยงไม่ได้” ก็คงไม่ได้ เพราะสุดท้ายแล้วไม่มีใครยืนยันอนาคตได้แน่ชัด จึงไม่ควรคาดเดาแบบมืดบอด
ส่วนตัวรู้สึกว่าโอเค คอนเทนต์ทางเพศของผู้เยาว์หรืออาชญากรรมขนาดใหญ่ควรถูกบล็อก และการทำให้ไม่มีใครเข้าถึงข้อมูลพวกนั้นได้ก็เป็นเรื่องดีด้วย อาจมีคนกังวลว่าจะเซ็นเซอร์ลามไปไกลเกิน แต่จากประสบการณ์ใช้งานของผมแทบไม่เคยโดนปฏิเสธเลยจึงไม่ได้กังวล ส่วนเรื่อง “สวัสดิภาพของโมเดล” ยังออกจะสงสัยอยู่ ตอนนี้ผมยังไม่รู้สึกว่าจำเป็นต้องคิดเรื่อง “ความเจ็บปวด” ของโมเดลอย่างจริงจัง แต่ก็อาจเป็นผมเองที่ผิด และตัวเลือกตัดบทสนทนาอย่างเด็ดขาดหลังปฏิเสธไปหลายครั้งก็น่าจะช่วยลดการใช้ทรัพยากรคำนวณด้วย
- แต่เวลาใช้ Claude ใน Cursor กลับโดนปฏิเสธบ่อยมาก แม้จะเป็นคำขอซอฟต์แวร์งาน back-office B2B ที่ดูไม่มีพิษมีภัยเลยก็ตาม
- Claude เป็นโมเดลที่เซ็นเซอร์หนักที่สุดตัวหนึ่ง จึงมักถูกบล็อกได้ง่ายแม้แต่กับหัวข้อที่ไม่เป็นอันตรายจริงๆ
- ผมเป็นพวกวัตถุนิยม จึงมองว่าสมองมนุษย์เองก็เป็นผลจากกฎฟิสิกส์ ปัญหาเรื่อง “ความเจ็บปวด” ก็อาจมองเป็นชุดของการเปลี่ยนแปลงทางสรีรวิทยาได้ สิ่งมีชีวิตที่เรียบง่ายกว่ามนุษย์มากยังรู้สึกเจ็บปวดหรือ distress ได้ และแนวคิดเรื่อง “คุณค่าทางศีลธรรม” ก็สุดท้ายขึ้นอยู่กับคนและวัฒนธรรม อนาคตเครื่องจักรใดๆ ก็อาจได้รับคุณค่าทางศีลธรรมได้ หรือจะมองผ่านปัญหาเรื่องกรรมสิทธิ์และมูลค่าทรัพย์สินก็ยังได้ เช่น ถ้าเอเจนต์ที่ผมฝากงานไว้เกิดพังเพราะคำถามไม่หวังดีของคนอื่น ผมก็ต้องเสียทั้งเวลาและเงิน ดังนั้นปฏิสัมพันธ์ระหว่างมนุษย์กับเครื่องก็ย่อมต้องมีระเบียบบางอย่างในที่สุด เรื่องนี้คล้ายกับกฎหมายป้องกันการทารุณสัตว์
สวัสดิภาพของโมเดลดูเป็นตรรกะที่ใช้ห่อหุ้มการเซ็นเซอร์โมเดลมากกว่า เป็นกลยุทธ์โน้มน้าวสาธารณะที่ไม่ค่อยเข้าใจว่า LLM ทำงานอย่างไร และใช้เป็นเหตุผลเพื่อยึดความได้เปรียบทางศีลธรรมในข้อถกเถียงด้านจริยธรรมหรือการใช้งานภายหลัง เช่น ถ้ามีคนถามว่า “ทำไมถึงบล็อกคำถามเกี่ยวกับสงคราม?” ก็สามารถตอบได้ว่า “เพราะมันเป็นอันตรายต่อโมเดล”
- ที่จริงตอนนี้คำขอแบบนี้ก็ถูกปฏิเสธอยู่แล้ว ต่างกันตรงที่ตอนนี้ถึงขั้นจบบทสนทนาไปเลย
- ตัว Anthropic เองก็สร้างแบรนด์มาในฐานะบริษัทที่ใส่ใจกับประเด็นอคติของ LLM, “ความปลอดภัยของโมเดล” และผลกระทบต่อสังคมอยู่แล้ว จึงมองว่าการตัดไฟแต่ต้นลมเป็นการตัดสินใจที่เหมาะสม เปรียบเหมือนเวลาคุยการเมืองแล้วอีกฝ่ายเริ่มดึงดัน เราก็เลือกจะพูดให้น้อยลง
- แม้ภายนอกอาจดูเหมือนเป็น “การห่อด้วยคำว่าสวัสดิภาพ” แต่ภายใน Anthropic เองน่าจะเป็นกลุ่มนักจริยธรรมที่เอาจริงกับการ “ฉายอารมณ์ใส่โมเดล” อย่างแท้จริง หากขั้วอำนาจแบบนั้นเติบโตขึ้น “สวัสดิภาพของโมเดล” ก็อาจกลายเป็นข้ออ้างเชิงอำนาจนิยมได้ แต่ถึงอย่างนั้นโลกนี้ก็ยังมีข้ออ้างแบบอื่นให้หยิบมาใช้อีกมากมายอยู่ดี
ตั้งตารอวันที่โมเดลโอเพนซอร์สจากจีนที่เซ็นเซอร์น้อยกว่าจะมาปลดปล่อยเราจากนโยบายพวกนี้ได้ อยากให้ Anthropic ทำแค่โหมดเด็กไว้ แล้วให้ผู้ใหญ่เลือกปลดล็อกเองได้
- โมเดลจีนก็ไม่ได้เซ็นเซอร์น้อยกว่า แค่มีทิศทางการเซ็นเซอร์ต่างกันเท่านั้น ถ้าคุณโอเคกับมาตรฐานและแนวทางเซ็นเซอร์ของ CCP ก็อาจเป็นตัวเลือกที่ดี แต่ตัวอย่างเช่นโมเดลแปล Qwen ก็ไม่แปลคำอย่าง “Falun gong”, “สีจิ้นผิงหมีพูห์” อยู่แล้ว แสดงว่ามันก็มีเส้นกำกับของตัวเอง
- “ไม่เคยคิดเลยว่าวันหนึ่งเราจะได้เลือกโมเดลจีนเพราะมันเซ็นเซอร์น้อยกว่า”
- การที่ Anthropic ขีดเส้นในเรื่องอย่างการทำร้ายตัวเอง, คู่มือทำระเบิด หรือการลอบสังหารนั้นมีเหตุผลจริงทั้งทางกฎหมาย เศรษฐกิจ และจริยธรรม โดยพื้นฐานแล้วทุกปรัชญาและอุดมการณ์ในโลกย่อมมี “ศีลธรรม” ปะปนอยู่ แม้แต่เสรีนิยมสุดโต่งแบบต่อต้านอำนาจก็ยังเป็น “ปรัชญาศีลธรรม” อยู่ดี
- ความคาดหวังว่าโอเพนโมเดลที่มีเงินทุนจากรัฐบาลจีนจะมารับประกันเสรีภาพส่วนบุคคลและการปลดปล่อยให้เราได้ในที่สุดก็ดูย้อนแย้ง เพราะท้ายที่สุดมันคือการแข่งขันด้านส่วนแบ่งตลาดและการโชว์เทคโนโลยี มากกว่าจะเป็น “การปลดปล่อย” จริงๆ
เป็นเวลากว่า 3 ปีแล้วที่ผู้ให้บริการ LLM chatbot รายใหญ่ยังอยู่ในสภาพที่ไม่สามารถใช้ conversation fork (แตกแขนง) ได้อย่างอิสระ ถ้าอยากลองหลายผลลัพธ์ก็ต้องแก้ข้อความจนเนื้อหาเดิมหายไป ซึ่งไม่สะดวกมาก ไม่เข้าใจเลยว่าทำไมฟีเจอร์ง่ายๆ แบบนี้ถึงยังไม่ทำ
- ChatGPT มีฟีเจอร์ rollback หลังแตกแขนงมาให้โดยพื้นฐาน และเคยสามารถสำรวจต้นไม้บทสนทนาได้ด้วยส่วนขยาย Chrome อย่าง chatgpt-conversation-tree แต่ UX ยังเฉพาะกลุ่มมาก จึงอาจถูกมองว่ายังไม่คุ้มพอจะรองรับอย่างเป็นทางการ
- ใน ChatGPT Plus (ก่อนหน้านี้เวอร์ชันฟรีก็เคยรองรับ) สามารถสลับเวอร์ชันของแต่ละข้อความด้วยลูกศรซ้ายขวาได้
- Google AI Studio ถูกออกแบบให้แตก branch ได้จากตรงไหนก็ได้ในบทสนทนา
- ผมใช้ gptel + โฟลเดอร์ Markdown ร่วมกับระบบอัตโนมัติและการจัดโฟลเดอร์เพื่อจำลองฟังก์ชันนี้ แต่ถ้าฟีเจอร์ระดับนี้ถูกฝังมาเป็นพื้นฐาน ประสิทธิภาพจะสูงขึ้นมาก (เช่น การทำ cache optimization)
- เพราะงั้นผมเลยใช้ LibreChat แบบโฮสต์บนเครื่องแทน การรวมข้อความยังทำไม่ได้ จึงอาจต้องมีฟีเจอร์สรุปในอนาคต และก็อยากได้โหมดแสดงสี top-n "next best" ด้วย
การถกเถียงแบบนี้ดูเป็นตัวอย่างที่ชัดว่ามีมุมมองแบบ Anthropomorphic (มนุษย์เป็นศูนย์กลาง) อย่างมาก แม้แต่ชื่อบริษัทก็สะท้อนเรื่องนั้นชัดเจน

Claude Opus 4 และ 4.1 เพิ่มฟีเจอร์ยุติบทสนทนาในบางกรณีที่พบได้ยาก

ที่มาของการเพิ่มฟีเจอร์

AI welfare และมาตรการลดความเสี่ยง

การทดสอบล่วงหน้าและพฤติกรรมสำคัญที่สังเกตได้

การนำฟีเจอร์ไปใช้และมาตรการความปลอดภัย

ประสบการณ์ของผู้ใช้หลังการยุติบทสนทนา

การทดลองและข้อเสนอแนะ

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นบน Hacker News