ดูเหมือนว่าโมเดล ChatGPT รุ่นใหม่จะทิ้งลายน้ำไว้ในข้อความ
(rumidocs.com)- จากการทดสอบ โมเดล GPT-o3 และ o4-mini โดย Rumi พบว่า
ในคำตอบยาว ๆ (เช่น การเขียนเรียงความ) มีการแทรก ลายน้ำด้วยอักขระพิเศษ - ลายน้ำนี้สร้างขึ้นด้วยอักขระช่องว่างพิเศษแบบยูนิโค้ด เช่น "Narrow No-Break Space (U+202F)"
- มองด้วยตาเปล่าทั่วไปไม่เห็นเลย แต่จะเห็นได้เมื่อเปิดดูด้วยโค้ดเอดิเตอร์อย่าง Sublime Text, VS Code หรือเครื่องมือดูอักขระพิเศษ
- แม้จะคัดลอกและวาง ลายน้ำนี้ก็ยังคงอยู่ (เช่น คัดลอกไปวางใน Google Docs ก็ยังติดไปด้วย)
- อย่างไรก็ตาม ลายน้ำนี้ ลบออกได้ด้วยการ find-and-replace แบบง่าย ๆ จึงไม่ใช่มาตรการป้องกันที่สมบูรณ์
- OpenAI ยังไม่ได้ประกาศฟีเจอร์ลายน้ำนี้อย่างเป็นทางการ (คาดว่าอาจกำลังทดสอบแบบเงียบ ๆ)
- มีรายงานว่า ในโมเดล GPT-4o ไม่พบลายน้ำลักษณะนี้
เพิ่มเติม
- ลายน้ำมีแนวโน้มจะถูกแทรกเฉพาะใน ข้อความยาว (โดยเฉพาะงานลักษณะการบ้านหรือรายงาน) และ
- แทบไม่ถูกแทรกในบทสนทนาสั้น ๆ หรือคำถาม-คำตอบทั่วไป
สรุปสั้น ๆ หนึ่งบรรทัด
"โมเดลรุ่นใหม่บางตัวเริ่มใส่ลายน้ำด้วยอักขระพิเศษแล้ว แต่ตรวจจับและลบได้ง่าย จึงยังไม่สมบูรณ์"
6 ความคิดเห็น
[อัปเดต] OpenAI ตอบกลับ Lumi อย่างเป็นทางการ
OpenAI ได้ติดต่อเรามาเกี่ยวกับโพสต์นี้และแจ้งว่าอักขระพิเศษดังกล่าวไม่ใช่วอเตอร์มาร์ก ตามคำอธิบายของ OpenAI มันเป็นเพียง “ความผิดปกติของการเรียนรู้แบบเสริมกำลังขนาดใหญ่” เท่านั้น อย่างไรก็ตาม เรายังคงเก็บโพสต์นี้ไว้ เพื่อให้ผู้อ่านในอนาคตยังคงเห็นปัญหาของอักขระพิเศษเหล่านี้ (และอาจไม่เป็นที่ต้องการ) ในคำตอบของ ChatGPT o3/o4 ได้
ครั้งนี้มีปัญหาว่า o3 หลอนหนักมากอยู่แล้ว
เลยคิดว่าอาจจะเป็นหนึ่งในนั้น แต่ที่ติดต่อไปเองนี่ก็น่าสนใจดีนะ
คงเป็นไปได้ว่าเขาไม่อยากให้ข้อมูลที่ AI สร้างขึ้นถูกนำไปใช้เป็นข้อมูลฝึกอีกใช่ไหมครับ/คะ (model collapse)
มันไม่น่าใช่วอเตอร์มาร์ก แต่เป็นบั๊กหรือเปล่า? ต่อให้มองว่าเป็นการทดสอบ มันก็ดูเรียบง่ายเกินเหตุเมื่อเทียบกับเทคโนโลยีวอเตอร์มาร์กสำหรับ LLM ที่กำลังถูกพูดถึงกันอยู่ตอนนี้..
นึกว่าจะพูดถึงแนวโน้มความเอนเอียงที่แปลกประหลาดของข้ออ้างนั้นเสียอีก แต่ไม่ใช่แฮะ มันเป็นวิธีแก้ที่เรียบง่ายเกินไปหน่อยหรือเปล่า
อืม... เป็นเพราะลายน้ำแบบนี้หรือเปล่า? ช่วงหลังมานี้ผม/ฉันเจออยู่บ่อยพอสมควรว่าบน ChatGPT ภาษาเกาหลีดูปกติดี แต่พอคัดลอกแล้ววางกลับกลายเป็นตัวอักษรเพี้ยน