- บทความที่ Jan Leike หัวหน้าทีม Alignment ของ OpenAI โพสต์ไว้บนบล็อก แปลด้วย DeepL
- Alignment คือ "การจัดแนวระบบ AI หนึ่งระบบให้สอดคล้องกับมนุษย์หนึ่งคน"
- มีอยู่สองหมวดของการจัดแนวให้เข้ากับ "ความชอบของปัจเจก (ทุกคนต้องการ AI ที่จัดแนวเข้ากับตนเอง)" และ "ความชอบของส่วนรวม (AI ควรถูกใช้เพื่อวัตถุประสงค์ใดได้บ้าง และพฤติกรรมพื้นฐานควรเป็นอย่างไร)"
- บทความนี้ว่าด้วยหมวดที่สอง
ข้อเสนอ: ประชาธิปไตยเชิงไตร่ตรองแบบจำลอง
- แนวคิดหลักคือการใช้โมเดลภาษาขนาดใหญ่เพื่อฝึกให้เลียนแบบ "ประชาธิปไตยเชิงไตร่ตรอง"
- ประชาธิปไตยเชิงไตร่ตรองคือกระบวนการตัดสินใจหรือกำหนดนโยบายที่มีกลุ่มประชาชนขนาดเล็กซึ่งถูกคัดเลือกแบบสุ่ม ('มินิพับลิก') มาร่วมไตร่ตรองอย่างชัดแจ้ง
- วิธีสร้างประชาธิปไตยเชิงไตร่ตรองแบบจำลอง
- รวบรวมชุดข้อมูลคำถามด้านคุณค่า
- บันทึกการไตร่ตรองของมนุษย์
- การเรียนรู้แบบเลียนแบบที่มีเงื่อนไขตามบริบท
- การจำลอง คำถามเกี่ยวกับคุณค่าใหม่
1 ความคิดเห็น
ขอแนะนำให้อ่าน "คำอธิบายเพิ่มเติมเกี่ยวกับบริบทของบทความนี้" ของคุณชเวซึงจุนควบคู่กันไปด้วย (มีลิงก์อยู่ที่ส่วนต้นของเอกสารด้วย)
https://facebook.com/seungjoon.choi/posts/…