11 คะแนน โดย baeba 2025-04-22 | 6 ความคิดเห็น | แชร์ทาง WhatsApp
  • จากการทดสอบ โมเดล GPT-o3 และ o4-mini โดย Rumi พบว่า
    ในคำตอบยาว ๆ (เช่น การเขียนเรียงความ) มีการแทรก ลายน้ำด้วยอักขระพิเศษ
  • ลายน้ำนี้สร้างขึ้นด้วยอักขระช่องว่างพิเศษแบบยูนิโค้ด เช่น "Narrow No-Break Space (U+202F)"
  • มองด้วยตาเปล่าทั่วไปไม่เห็นเลย แต่จะเห็นได้เมื่อเปิดดูด้วยโค้ดเอดิเตอร์อย่าง Sublime Text, VS Code หรือเครื่องมือดูอักขระพิเศษ
  • แม้จะคัดลอกและวาง ลายน้ำนี้ก็ยังคงอยู่ (เช่น คัดลอกไปวางใน Google Docs ก็ยังติดไปด้วย)
  • อย่างไรก็ตาม ลายน้ำนี้ ลบออกได้ด้วยการ find-and-replace แบบง่าย ๆ จึงไม่ใช่มาตรการป้องกันที่สมบูรณ์
  • OpenAI ยังไม่ได้ประกาศฟีเจอร์ลายน้ำนี้อย่างเป็นทางการ (คาดว่าอาจกำลังทดสอบแบบเงียบ ๆ)
  • มีรายงานว่า ในโมเดล GPT-4o ไม่พบลายน้ำลักษณะนี้

เพิ่มเติม

  • ลายน้ำมีแนวโน้มจะถูกแทรกเฉพาะใน ข้อความยาว (โดยเฉพาะงานลักษณะการบ้านหรือรายงาน) และ
  • แทบไม่ถูกแทรกในบทสนทนาสั้น ๆ หรือคำถาม-คำตอบทั่วไป

สรุปสั้น ๆ หนึ่งบรรทัด
"โมเดลรุ่นใหม่บางตัวเริ่มใส่ลายน้ำด้วยอักขระพิเศษแล้ว แต่ตรวจจับและลบได้ง่าย จึงยังไม่สมบูรณ์"

6 ความคิดเห็น

 
holywork 2025-04-23

[อัปเดต] OpenAI ตอบกลับ Lumi อย่างเป็นทางการ
OpenAI ได้ติดต่อเรามาเกี่ยวกับโพสต์นี้และแจ้งว่าอักขระพิเศษดังกล่าวไม่ใช่วอเตอร์มาร์ก ตามคำอธิบายของ OpenAI มันเป็นเพียง “ความผิดปกติของการเรียนรู้แบบเสริมกำลังขนาดใหญ่” เท่านั้น อย่างไรก็ตาม เรายังคงเก็บโพสต์นี้ไว้ เพื่อให้ผู้อ่านในอนาคตยังคงเห็นปัญหาของอักขระพิเศษเหล่านี้ (และอาจไม่เป็นที่ต้องการ) ในคำตอบของ ChatGPT o3/o4 ได้

 
crawler 2025-04-23

ครั้งนี้มีปัญหาว่า o3 หลอนหนักมากอยู่แล้ว
เลยคิดว่าอาจจะเป็นหนึ่งในนั้น แต่ที่ติดต่อไปเองนี่ก็น่าสนใจดีนะ

 
rrockp 2025-04-22

คงเป็นไปได้ว่าเขาไม่อยากให้ข้อมูลที่ AI สร้างขึ้นถูกนำไปใช้เป็นข้อมูลฝึกอีกใช่ไหมครับ/คะ (model collapse)

 
cgl00 2025-04-22

มันไม่น่าใช่วอเตอร์มาร์ก แต่เป็นบั๊กหรือเปล่า? ต่อให้มองว่าเป็นการทดสอบ มันก็ดูเรียบง่ายเกินเหตุเมื่อเทียบกับเทคโนโลยีวอเตอร์มาร์กสำหรับ LLM ที่กำลังถูกพูดถึงกันอยู่ตอนนี้..

 
ndrgrd 2025-04-22

นึกว่าจะพูดถึงแนวโน้มความเอนเอียงที่แปลกประหลาดของข้ออ้างนั้นเสียอีก แต่ไม่ใช่แฮะ มันเป็นวิธีแก้ที่เรียบง่ายเกินไปหน่อยหรือเปล่า

 
galadbran 2025-04-22

อืม... เป็นเพราะลายน้ำแบบนี้หรือเปล่า? ช่วงหลังมานี้ผม/ฉันเจออยู่บ่อยพอสมควรว่าบน ChatGPT ภาษาเกาหลีดูปกติดี แต่พอคัดลอกแล้ววางกลับกลายเป็นตัวอักษรเพี้ยน