การแฮ็กโมเดลปัญญาประดิษฐ์ภาษาธรรมชาติ

budlebee · 2021-03-14T11:00:03+09:00

ตามบทความวิจัยที่ Google, Harvard, Stanford, OpenAI และ Apple เผยแพร่ร่วมกัน เพียงแค่ตั้งคำถามกับโมเดลภาษาขนาดใหญ่ ก็สามารถดึงข้อมูลเฉพาะเจาะจงที่ถูกใช้ในการฝึกออกมาได้ การโจมตีต่อ GPT-2 สามารถดึงข้อมูลอย่างพาดหัวข่าวและข้อมูลส่วนบุคคล เช่น ที่อยู่บ้าน ออกมาได้ด้วยความแม่นยำสูงมาก ไม่ใช่แค่ GPT-2 เท่านั้น แต่โมเดลภาษาอื่น ๆ ก็อาจเปราะบางต่อการโจมตีลักษณะนี้ได้เช่นกัน จึงควรใส่ใจการเตรียมข้อมูลฝึกให้มากยิ่งขึ้น

(arxiv.org)

12 คะแนน โดย budlebee 2021-03-14 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

ตามบทความวิจัยที่ Google, Harvard, Stanford, OpenAI และ Apple เผยแพร่ร่วมกัน เพียงแค่ตั้งคำถามกับโมเดลภาษาขนาดใหญ่ ก็สามารถดึงข้อมูลเฉพาะเจาะจงที่ถูกใช้ในการฝึกออกมาได้
การโจมตีต่อ GPT-2 สามารถดึงข้อมูลอย่างพาดหัวข่าวและข้อมูลส่วนบุคคล เช่น ที่อยู่บ้าน ออกมาได้ด้วยความแม่นยำสูงมาก
ไม่ใช่แค่ GPT-2 เท่านั้น แต่โมเดลภาษาอื่น ๆ ก็อาจเปราะบางต่อการโจมตีลักษณะนี้ได้เช่นกัน จึงควรใส่ใจการเตรียมข้อมูลฝึกให้มากยิ่งขึ้น

การแฮ็กโมเดลปัญญาประดิษฐ์ภาษาธรรมชาติ

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น