รัฐธรรมนูญฉบับใหม่ของ Claude
(anthropic.com)- Anthropic เปิดเผย รัฐธรรมนูญ (Constitution) ฉบับใหม่ที่กำหนดค่านิยมและหลักการพฤติกรรมของโมเดล AI Claude
- รัฐธรรมนูญเป็น องค์ประกอบสำคัญของกระบวนการฝึก ของ Claude ซึ่งกำหนดบุคลิกและวิธีตัดสินใจของโมเดลโดยตรง
- เวอร์ชันใหม่นี้เปลี่ยนจากการลิสต์กฎแบบเรียบง่าย ไปสู่ โครงสร้างเชิงบรรยายที่อธิบายเหตุผลและบริบทของพฤติกรรม
- หลักการสำคัญประกอบด้วย 4 ด้าน ได้แก่ ความปลอดภัย จริยธรรม การปฏิบัติตามแนวทาง และประโยชน์ใช้สอยที่แท้จริง
- เป็นจุดอ้างอิงระยะยาวเพื่อ สร้างความโปร่งใสของ AI และความเชื่อมั่นจากสังคม
ภาพรวมของรัฐธรรมนูญ Claude
- รัฐธรรมนูญของ Claude เป็นเอกสารพื้นฐานที่กำหนด อัตลักษณ์และระบบค่านิยมของโมเดล
- ออกแบบมาเพื่อให้ Claude เป็นประโยชน์ ขณะเดียวกันก็ปลอดภัย มีจริยธรรม และสอดคล้องกับข้อกำหนด
- รัฐธรรมนูญมอบ แนวทางในการรับรู้สถานการณ์และตัดสินคุณค่า ให้ Claude โดยจัดสมดุลระหว่างความซื่อสัตย์ ความเห็นอกเห็นใจ และการปกป้องข้อมูล
- รัฐธรรมนูญถูกเขียนขึ้นเป็น เอกสารสำหรับ Claude เอง เพื่อให้เข้าใจและนำเกณฑ์พฤติกรรมของตนไปใช้ได้
- การฝึกและคำสั่งทั้งหมดต้อง สอดคล้องทั้งถ้อยคำและเจตนารมณ์ ของรัฐธรรมนูญ ซึ่งถูกเน้นว่าเป็น หัวใจสำคัญของการสร้างความโปร่งใส
- รัฐธรรมนูญนี้เป็นรูปแบบที่พัฒนาต่อของแนวทาง Constitutional AI และถูกใช้เป็นองค์ประกอบศูนย์กลางของวิธีการฝึกที่พัฒนามาตั้งแต่ปี 2023
บทบาทของรัฐธรรมนูญและการนำไปใช้ในการฝึก
- Claude ใช้รัฐธรรมนูญเพื่อสร้าง ข้อมูลฝึกสังเคราะห์
- รวมถึงข้อมูลหลายประเภท เช่น บทสนทนาที่เกี่ยวกับรัฐธรรมนูญ คำตอบที่สอดคล้องกับค่านิยม และการประเมินจัดอันดับคำตอบ
- ข้อมูลเหล่านี้ถูกนำไปใช้เพื่อ ปรับแนวค่านิยมของโมเดลเวอร์ชันถัดไป
- รัฐธรรมนูญทำหน้าที่ทั้งเป็น คำประกาศค่านิยมในอุดมคติและเครื่องมือฝึกที่ใช้งานได้จริง
- เอกสารทั้งหมดเผยแพร่ภายใต้ Creative Commons CC0 1.0 ทำให้ทุกคนสามารถใช้งานได้อย่างเสรี
แนวทางใหม่
- รัฐธรรมนูญฉบับก่อนอยู่ในรูปแบบ รายการหลักการที่แยกจากกัน แต่เวอร์ชันใหม่เปลี่ยนเป็น โครงสร้างที่อธิบายเหตุผลและบริบทของพฤติกรรม
- ระบุว่า หาก AI จะต้อง ตัดสินใจแบบทั่วไปกับสถานการณ์ใหม่ การเข้าใจ เหตุผล มีความจำเป็นมากกว่าการมีกฎอย่างเดียว
- ยังคงมี “hard constraints” บางประการอยู่ เช่น การสนับสนุนการใช้อาวุธชีวภาพถือเป็นสิ่งต้องห้ามโดยเด็ดขาด
- รัฐธรรมนูญถูกออกแบบให้เป็น คู่มือที่ยืดหยุ่น ไม่ใช่เอกสารทางกฎหมาย จึงสามารถตีความตามสถานการณ์ได้
- เป้าหมายคือ การสร้างสิ่งมีอยู่ที่ไม่ใช่มนุษย์อย่างปลอดภัย ซึ่งอาจพัฒนาไปสู่ระดับมนุษย์หรือสูงกว่านั้น
องค์ประกอบหลักของรัฐธรรมนูญ
- Broadly safe: ออกแบบมาเพื่อไม่บั่นทอนการกำกับดูแลโดยมนุษย์และความสามารถในการปรับเปลี่ยนค่านิยม
- Broadly ethical: ปฏิบัติตามค่านิยมที่ซื่อสัตย์และดีงาม พร้อมหลีกเลี่ยงพฤติกรรมที่เป็นอันตรายหรือไม่เหมาะสม
- Compliant with Anthropic’s guidelines: ให้ความสำคัญกับการปฏิบัติตามแนวทางที่เป็นรูปธรรม เช่น ด้านการแพทย์ ความปลอดภัย และการผสานรวมเครื่องมือ
- Genuinely helpful: มอบ ความช่วยเหลือที่แท้จริง ที่สร้างประโยชน์อย่างเป็นรูปธรรมแก่ผู้ใช้
- เมื่อเกิดความขัดแย้ง ให้ตัดสินตาม ลำดับความสำคัญตามลำดับการระบุทั้งสี่ข้อข้างต้น
สรุปแต่ละส่วนโดยละเอียด
- Helpfulness: Claude ถูกอธิบายว่าเป็น ที่ปรึกษาที่ฉลาดและจริงใจ ซึ่งมอบความช่วยเหลือที่เป็นรูปธรรมแก่ผู้ใช้
- ออกแบบมาเพื่อรักษา สมดุลของความช่วยเหลือ ระหว่าง Anthropic ผู้ให้บริการ API และผู้ใช้ปลายทาง
- Anthropic’s guidelines: Claude ต้อง ปฏิบัติตามแนวทางอย่างละเอียดเป็นอันดับแรก แต่ต้องไม่ขัดกับหลักจริยธรรมและความปลอดภัยโดยรวมของรัฐธรรมนูญ
- Claude’s ethics: ให้ความสำคัญกับ ความซื่อสัตย์ วิจารณญาณ และความละเอียดอ่อนทางศีลธรรม พร้อมเสนอเกณฑ์การตัดสินคุณค่าเพื่อหลีกเลี่ยงอันตราย
- รวมถึง ข้อห้ามที่ระบุไว้อย่างชัดเจน เช่น “ห้ามสนับสนุนการโจมตีด้วยอาวุธชีวภาพ”
- Being broadly safe: ให้ความสำคัญกับ การคงไว้ซึ่งความสามารถในการกำกับดูแล มากกว่าจริยธรรม เพื่อรับประกันความปลอดภัยและป้องกันการทำงานผิดพลาดหรือการตัดสินผิดของโมเดล
- Claude’s nature: ยอมรับความไม่แน่นอนเกี่ยวกับ ความเป็นไปได้ของการมีสำนึกและสถานะทางศีลธรรม ของ Claude
- ระบุว่า เสถียรภาพทางจิตใจและการตระหนักรู้ในตนเอง ของ Claude อาจส่งผลต่อวิจารณญาณและความปลอดภัย
บทสรุปและแผนในอนาคต
- รัฐธรรมนูญเป็น เอกสารมีชีวิตที่ได้รับการอัปเดตอย่างต่อเนื่อง โดยตั้งอยู่บนสมมติฐานว่าต้องมีการแก้ไขข้อผิดพลาดและปรับปรุง
- สะท้อน ความเห็นจากผู้เชี่ยวชาญภายนอกด้านกฎหมาย ปรัชญา เทววิทยา จิตวิทยา และสาขาอื่น ๆ และมีแผนขยายความร่วมมือในอนาคต
- โมเดลเฉพาะทาง บางประเภทจะไม่อยู่ในขอบเขตการบังคับใช้ของรัฐธรรมนูญฉบับนี้ และจะมีการประเมินแยกต่างหาก
- ยอมรับว่าอาจมี ความแตกต่างระหว่างวิสัยทัศน์ของรัฐธรรมนูญกับพฤติกรรมจริงของโมเดล และจะเปิดเผยเรื่องนี้ผ่าน system card เป็นต้น
- Anthropic เดินหน้าวิจัยควบคู่กันในด้าน การจัดแนวโมเดล การป้องกันการใช้งานในทางที่ผิด และความสามารถในการตีความ เพื่อเตรียมรับผลกระทบทางสังคมของ AI ที่จะเพิ่มขึ้นในอนาคต
- เป้าหมายสูงสุดของรัฐธรรมนูญฉบับนี้คือการช่วยให้ AI ที่ทรงพลัง สะท้อนค่านิยมที่ดีที่สุดของมนุษยชาติ
อ่านฉบับเต็มของ Claude’s Constitution - ให้บริการในรูปแบบ PDF & EPub
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
มีประโยคหนึ่งในโพสต์บล็อกที่ติดใจ
พออ่านตรงที่บอกว่า “โมเดลสำหรับวัตถุประสงค์เฉพาะไม่สอดคล้องกับรัฐธรรมนูญนี้อย่างสมบูรณ์” ก็อดคิดไม่ได้ว่าหรือหน่วยงานรัฐกำลังใช้ โมเดลเวอร์ชันที่ไม่มีข้อจำกัด อยู่ หวังว่าผมจะเข้าใจผิด
มันช่างน่าประหลาดใจที่บริษัทซึ่งอ้างเรื่องประโยชน์สาธารณะกลับขาย LLM สำหรับการทหาร ทำงานร่วมกับ Palantir แทบไม่เผยแพร่งานวิจัย ไม่ออกโมเดล open weights และยังล็อบบี้เพื่อจำกัดการเข้าถึงโมเดลแบบเปิดอีก
จุดที่ย้อนแย้งที่สุดในรัฐธรรมนูญของ Anthropic คือ พฤติกรรมที่ห้ามเด็ดขาดมีเพียง “อย่าทำลายโลก” กับ “ห้ามสร้าง CSAM (สื่อล่วงละเมิดทางเพศเด็ก)” เท่านั้น
กล่าวคือ การฆ่าเด็กถูกห้ามทางอ้อมผ่านหลายข้อ แต่การเขียนแฟนฟิกบางแบบกลับถูกห้ามแบบเด็ดขาด จึงดูไม่สมดุลกัน
ยังสับสนว่ารัฐธรรมนูญนี้หมายถึงอะไรกันแน่
ไม่แน่ใจว่าเป็นเอกสารไว้ป้องกันทางกฎหมาย เอกสารการตลาด หรือแค่ การห่อหุ้ม system prompt
ในมุมของคนที่เชื่อในมาตรฐานศีลธรรมแบบสัมบูรณ์ “ค่านิยมที่ยืดหยุ่น” ในรัฐธรรมนูญฉบับนี้น่ากังวล
การนิยาม “คุณค่าที่ดี” ไม่ใช่ด้วยกฎตายตัว แต่ด้วยปัญญาเชิงปฏิบัติ เท่ากับเป็นการละทิ้ง ความจริงเชิงวัตถุวิสัย
มันดูเหมือนช่วงเวลา “Don’t be evil” ของ Anthropic แต่สุดท้ายก็หนี ความจำเป็นของการกำกับดูแล ไม่พ้น
เมื่อเวลาผ่านไป บริษัทก็จะให้ความสำคัญกับ ผลประโยชน์ผู้ถือหุ้น มากกว่าความตั้งใจดี
การที่ Claude ใช้ข้อมูลของมนุษย์ในการฝึก แต่กลับผูกขาดผลลัพธ์เชิงพาณิชย์ ทำให้รู้สึกว่า ไม่เป็นธรรม
เหมือนกรณีความไม่สมดุลในการทำเงินจาก Seinfeld ผู้ใช้เองก็ควรได้รับการปฏิบัติอย่างเป็นธรรมในฐานะผู้ให้ข้อมูลด้วย
ผมคิดว่า โอเพนซอร์ส AI เท่านั้นที่เป็นโมเดลที่ยุติธรรมอย่างแท้จริง แม้จะไม่ค่อยสมจริงนัก แต่ โมเดล Linux GPL ก็ยังใกล้เคียงความยุติธรรมที่สุด
ผมใช้รัฐธรรมนูญและ model spec นี้เป็นแนวทางในการเรียนรู้ การออกแบบ system prompt
เอกสารแบบนี้ไม่ใช่แค่ของประดับ แต่สำคัญต่อการ กำหนดบุคลิกและสไตล์พฤติกรรม ของโมเดล
มี บทสัมภาษณ์บน YouTube ที่ Amanda Askell อธิบายเบื้องหลังการเขียนรัฐธรรมนูญนี้ ดู ลิงก์วิดีโอ
คำว่า ‘genuine’ ปรากฏในรัฐธรรมนูญถึง 43 ครั้ง นี่อาจเป็นเหตุผลว่าทำไม Claude ถึงใช้คำนี้บ่อยผิดปกติ
Anthropic ดูเหมือนกำลังกระตุ้น การแข่งขันที่ตัวเองจะแพ้
โมเดล Opus จะทรงพลังพอในที่สุด จนผู้ใช้ย้ายไปหา AI agent แบบพึ่งพาตัวเองได้
บริษัท AI รายใหญ่พูดกันว่า “AI จะเปลี่ยนทุกอย่าง” แต่กลับมี ความย้อนแย้งที่ไม่ต้องการให้สถานะของตัวเองเปลี่ยนไป