การแฮ็กโมเดลปัญญาประดิษฐ์ภาษาธรรมชาติ
(arxiv.org)-
ตามบทความวิจัยที่ Google, Harvard, Stanford, OpenAI และ Apple เผยแพร่ร่วมกัน เพียงแค่ตั้งคำถามกับโมเดลภาษาขนาดใหญ่ ก็สามารถดึงข้อมูลเฉพาะเจาะจงที่ถูกใช้ในการฝึกออกมาได้
-
การโจมตีต่อ GPT-2 สามารถดึงข้อมูลอย่างพาดหัวข่าวและข้อมูลส่วนบุคคล เช่น ที่อยู่บ้าน ออกมาได้ด้วยความแม่นยำสูงมาก
-
ไม่ใช่แค่ GPT-2 เท่านั้น แต่โมเดลภาษาอื่น ๆ ก็อาจเปราะบางต่อการโจมตีลักษณะนี้ได้เช่นกัน จึงควรใส่ใจการเตรียมข้อมูลฝึกให้มากยิ่งขึ้น
ยังไม่มีความคิดเห็น