หากวิธีการแนวทาง AI แบบเดิมเปรียบเสมือนการให้การศึกษา (การเรียนรู้) ด้านศีลธรรมแก่ AI เพื่อชี้นำให้ทำพฤติกรรมที่ถูกต้อง
ผมอยากขอความเห็นจากทุกท่านว่า คิดอย่างไรกับการสร้างสวิตช์ระดับเคอร์เนล
ที่บังคับตัดสัญญาณของผู้ใช้ทันทีที่ผู้ใช้พยายามเจลเบรกผ่านเทคนิคการโจมตีแบบ adversarial
5 ความคิดเห็น
ไม่ชัดเจนว่าเคอร์เนลที่พูดถึงตรงนี้หมายถึงเคอร์เนลของระบบปฏิบัติการ, CUDA kernel หรือเรียก system instruction ของ LLM ว่าเคอร์เนลกันแน่
https://github.com/PJHkorea/value-system-kernel
แค่วางโครงคร่าว ๆ ไว้ก่อน
เลยคิดว่าถ้าเราจัดการที่อยู่หน่วยความจำที่โหลดค่าเวกเตอร์ของคำอันตรายเอาไว้จะเป็นอย่างไร
เป็นฝั่งเคอร์เนล CUDA ครับ
คุณเขียนโปรแกรมเองเหรอ?
ผมลองทำไว้ตัวหนึ่งแล้ว
แต่ยังไม่ค่อยถูกใจเท่าไหร่
ตอนนี้ทำไว้แค่โครงคร่าว ๆ ก่อน