- OpenAI เสริมความแข็งแกร่งให้โมเดลแหล่งที่มาแบบหลายชั้น โดยผสานความสอดคล้องกับ C2PA, ลายน้ำ SynthID และเครื่องมือตรวจสอบแบบสาธารณะ เพื่อระบุคอนเทนต์ที่สร้างโดย AI
- C2PA ใช้เมตาดาตาและลายเซ็นเชิงเข้ารหัสเพื่อพกพาบริบทการสร้างและการแก้ไขของคอนเทนต์ไปด้วยกัน แต่ข้อมูลอาจเสียหายได้ระหว่างกระบวนการแปลง
- SynthID ของ Google DeepMind เพิ่มลายน้ำที่มองไม่เห็นให้กับภาพที่สร้างผ่าน ChatGPT, Codex และ OpenAI API เพื่อชดเชยข้อจำกัดของเมตาดาตา
- พรีวิวเครื่องมือตรวจสอบแบบสาธารณะจะตรวจหา Content Credentials และ SynthID ในภาพที่อัปโหลด เพื่อช่วยประเมินว่าภาพนั้นสร้างโดย OpenAI หรือไม่
- เทคโนโลยีเพียงอย่างเดียวไม่เพียงพอ และระบบนิเวศด้านแหล่งที่มาจะแข็งแกร่งขึ้นได้เมื่อผสาน มาตรฐานร่วม, การทำลายน้ำที่คงอยู่ยาวนาน และการตรวจสอบแบบสาธารณะ
ยกระดับแนวทางด้านแหล่งที่มาของคอนเทนต์
- OpenAI กำลังเสริมความแข็งแกร่งให้ โมเดลแหล่งที่มาแบบหลายชั้น เพื่อสร้างความน่าเชื่อถือบนโลกออนไลน์ และเพิ่มความสามารถในการระบุคอนเทนต์ที่สร้างโดย AI โดยอาศัยมาตรฐานแบบเปิดและความร่วมมือข้ามแพลตฟอร์ม
- การเปลี่ยนแปลงหลักมีอยู่ 3 อย่าง
- รองรับ ความสอดคล้องกับ C2PA เพื่อให้เครื่องมือและแพลตฟอร์มอื่นสามารถรับรู้สัญญาณแหล่งที่มาได้ง่ายขึ้น
- ร่วมมือกับ Google เพื่อเพิ่ม ลายน้ำ SynthID ลงในภาพ
- เปิดพรีวิวเครื่องมือตรวจสอบแบบสาธารณะ เพื่อให้ผู้คนตรวจสอบได้ว่าภาพถูกสร้างจาก OpenAI หรือไม่
- สัญญาณแหล่งที่มาช่วยให้บริบทที่จำเป็นต่อการตัดสินได้ว่าคอนเทนต์มาจากไหน ถูกสร้างหรือแก้ไขอย่างไร และสอดคล้องกับสิ่งที่อ้างหรือไม่
ระบบนิเวศแห่งความน่าเชื่อถือผ่านความสอดคล้องกับ C2PA
- OpenAI มีส่วนร่วมในการพัฒนาและนำมาตรฐานแหล่งที่มาไปใช้มาตั้งแต่ปี 2024 และเริ่มเพิ่ม Content Credentials ให้กับภาพที่สร้างด้วย DALL·E 3
- หลังจากนั้น ImageGen และ Sora ก็ได้รับการใช้ Content Credentials เช่นกัน
- OpenAI เข้าร่วมคณะกรรมการกำกับของ Coalition for Content Provenance and Authenticity(C2PA) ซึ่งเป็นองค์กรข้ามอุตสาหกรรมที่ผลักดันมาตรฐานเทคโนโลยีแบบเปิดสำหรับแหล่งที่มาของคอนเทนต์
- C2PA เป็นแนวทางที่ใช้ เมตาดาตาและลายเซ็นเชิงเข้ารหัส เพื่อช่วยให้ข้อมูลที่เกี่ยวข้องกับสื่อเดินทางไปพร้อมกับตัวคอนเทนต์อย่างปลอดภัย
- ข้อมูลนี้ให้บริบทแก่ผู้สื่อข่าวที่ต้องประเมินแหล่งที่มา แพลตฟอร์มที่ต้องตัดสินใจด้านความสมบูรณ์ และผู้คนที่ต้องการเข้าใจคอนเทนต์ออนไลน์
- ล่าสุด OpenAI ได้กลายเป็น ผลิตภัณฑ์สร้างคอนเทนต์ที่สอดคล้องกับ C2PA
- ความสอดคล้องกับ C2PA เป็นรากฐานที่ช่วยให้แพลตฟอร์มสามารถอ่าน เก็บรักษา และส่งต่อข้อมูลแหล่งที่มาที่แนบมากับคอนเทนต์ได้อย่างน่าเชื่อถือ
- ข้อมูลแหล่งที่มาจะมีความหมายมากขึ้นเมื่อยังคงอยู่ต่อไปนอกเหนือจากแพลตฟอร์มที่สร้างคอนเทนต์ขึ้นมาแต่แรก และ การปฏิบัติตามข้อกำหนดด้านความสอดคล้อง คือสิ่งที่ทำให้เกิดสิ่งนั้นได้
แหล่งที่มาของภาพแบบหลายชั้นด้วย SynthID
- เมตาดาตา C2PA เป็นรากฐานที่ช่วยพกพาข้อมูลว่าคอนเทนต์มาจากไหน ถูกสร้างหรือแก้ไขอย่างไร และใครเป็นผู้ลงนามรับรองข้อมูลนั้น
- เมตาดาตาอาจถูกลบ สูญหายระหว่างการอัปโหลดหรือดาวน์โหลด หรือเสียหายจากการแปลง เช่น การเปลี่ยนรูปแบบไฟล์ การปรับขนาด หรือการจับภาพหน้าจอ
- เพื่อทำให้ข้อมูลแหล่งที่มามีความทนทานมากขึ้น OpenAI จึงนำ ลายน้ำที่มองไม่เห็น ผ่าน SynthID ของ Google DeepMind มาใช้
- การใช้งานจะเริ่มจากภาพที่สร้างผ่าน ChatGPT, Codex และ OpenAI API ก่อน
- SynthID ทำงานเป็นชั้นลายน้ำเพิ่มเติมที่ช่วยเสริมแนวทางที่อิงเมตาดาตาของ C2PA
- ก่อนหน้านี้ OpenAI ก็ได้ทดลองใช้แนวทางด้านแหล่งที่มาและการทำลายน้ำในสภาพแวดล้อมการใช้งานจริงมาแล้ว
- Sora ใช้ ลายน้ำแบบมองเห็นได้
- Voice Engine ใช้ ลายน้ำเสียง
- และยังคงทดสอบและวิจัยต่อเนื่องว่าความแม่นยำและความน่าเชื่อถือจะคงอยู่เมื่อเวลาผ่านไปหรือไม่
- C2PA และ SynthID ชดเชยจุดอ่อนของกันและกัน
- C2PA ช่วยใส่บริบทอย่างละเอียดลงในคอนเทนต์ แต่เมตาดาตาอาจถูกลบหรือเสียหายได้
- SynthID ช่วยรักษาสัญญาณไว้ได้แม้เมตาดาตาจะไม่คงอยู่ และอาจทนต่อการแปลงอย่างการจับภาพหน้าจอได้ยาวนานกว่า
- เมตาดาตาให้ข้อมูลได้มากกว่าที่ลายน้ำเพียงอย่างเดียวจะให้ได้
- เมื่อใช้สองแนวทางร่วมกัน ความทนทานของข้อมูลแหล่งที่มาของคอนเทนต์จะดีกว่าการใช้วิธีใดวิธีหนึ่งเพียงลำพัง
พรีวิวเครื่องมือตรวจสอบแบบสาธารณะ
- OpenAI เปิดให้ใช้งานเครื่องมือตรวจสอบแบบสาธารณะในเวอร์ชันพรีวิว เพื่อช่วยตรวจว่าภาพถูกสร้างจาก ChatGPT, OpenAI API หรือ Codex หรือไม่
- เครื่องมือนี้จะตรวจว่าภาพที่อัปโหลดมีสัญญาณแหล่งที่มา เช่น Content Credentials และ SynthID อยู่หรือไม่
- เป้าหมายคือการรวมหลายสัญญาณเข้าด้วยกัน เพื่อช่วยให้ผู้ใช้ตรวจสอบและตีความข้อมูลแหล่งที่มาของคอนเทนต์ได้ง่ายขึ้น
- เครื่องมือตรวจสอบแบบสาธารณะสามารถตรวจจับลายน้ำ SynthID ที่มาจาก OpenAI ได้อย่างเสถียร และหากพบเมตาดาตา C2PA ก็สามารถแสดงผลร่วมกันได้
- เนื่องจากไม่มีวิธีตรวจจับใดที่สมบูรณ์แบบ เมื่อการตรวจจับล้มเหลวจึงจะไม่สรุปแบบเด็ดขาด
- แม้จะไม่พบเมตาดาตาหรือลายน้ำ ก็จะไม่สรุปว่าภาพนั้นไม่ได้สร้างด้วยเครื่องมือของ OpenAI
- ในบางกรณี สัญญาณแหล่งที่มาอาจถูกลบออกได้
- เครื่องมือตรวจสอบ ณ เวลาที่เปิดตัวจะจำกัดอยู่ที่ คอนเทนต์ที่ OpenAI สร้างขึ้น
- ในอีกไม่กี่เดือนข้างหน้า เป้าหมายคือการสนับสนุนความพยายามระดับอุตสาหกรรมที่ช่วยให้สามารถตรวจสอบได้ครอบคลุมหลายแพลตฟอร์ม
- คาดว่าเมื่อเวลาผ่านไป จะรองรับคอนเทนต์ออนไลน์ได้หลากหลายประเภทมากขึ้น
ความท้าทายในอนาคต
- เทคโนโลยีด้านแหล่งที่มาเพียงอย่างเดียวไม่เพียงพอ
- แนวทางด้านแหล่งที่มาที่แข็งแกร่งต้องผสาน มาตรฐานร่วม, สัญญาณลายน้ำที่คงอยู่ยาวนาน และการตรวจสอบแบบสาธารณะ
- OpenAI ต้องการมีส่วนช่วยสร้างระบบนิเวศแหล่งที่มาที่ทำงานร่วมกันได้มากขึ้น ผ่านการรองรับ Content Credentials ที่มีอยู่เดิม ความสอดคล้องกับ C2PA การนำ SynthID มาใช้ และพรีวิวเครื่องมือตรวจสอบแบบสาธารณะ
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ถ้าทำภาพ AI ให้มีพื้นหลังสีดำ บนจอที่ดีพอจะมองเห็น SynthID ได้ด้วยตาเปล่า มันก็แค่ลายเบลอซ้ำๆ ไม่มีอะไรพิเศษ
ผมลบมันออกได้ค่อนข้างดีด้วยการมาสก์ทุกพิกเซลที่ 2 แล้วสร้างพิกเซลที่หายไปใหม่ จากนั้นเลื่อนออฟเซ็ต 1 พิกเซลแล้วมาสก์ทุกพิกเซลที่ 2 อีกครั้ง
ผมใช้โมเดลสำเร็จรูปสำหรับการเติมพิกเซล แต่ก่อนแก้ไขจะส่งออก depth map ก่อน แล้วลดนอยส์เพื่อให้พิกเซลที่สร้างขึ้นมาใหม่ในส่วนที่มาสก์สอดคล้องกับเนื้อหาต้นฉบับ ผลลัพธ์ยังไม่สมบูรณ์ 100% แต่ถ้าใช้เวลาเพิ่มอีกหน่อยและใช้โมเดลที่ปรับจูนละเอียดสำหรับงานนี้โดยเฉพาะ ก็น่าจะลบลายน้ำ AI แบบไหนก็ได้โดยไม่มีปัญหาใหญ่
https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
เมตาดาต้าหรือ SynthID ใส่ข้อมูลอะไรไว้บ้าง? SynthID เข้ารหัสได้กี่บิต?
จะทำฉลากโภชนาการสำหรับคอนเทนต์สังเคราะห์ได้ไหม? เช่น ข้อความสังเคราะห์ 10%, ภาพสังเคราะห์ 30%
วันนี้ความเป็นจริงของคุณถูกสังเคราะห์ไป 15% แล้ว (75% บรรษัทขนาดใหญ่, 25% neocloud แบบ open weights)
เวอร์ชันที่ใช้งานจริงน่าจะต่างออกไปพอสมควร
[0]:https://arxiv.org/html/2510.09263v1
น่าสนใจที่ SynthID ดูเหมือนถูกเจาะหมดแล้ว แต่ลายน้ำใหม่ของ OpenAI ยังไม่เป็นแบบนั้น [1]
[1] https://github.com/wiltodelta/remove-ai-watermarks
นี่มันก็แค่การทำอะไรโชว์ๆ ไร้สาระ
ในฐานะคนที่ใช้เครื่องมือสร้างอะไรบางอย่างให้หลายสื่อ ผมก็จะเลี่ยงเครื่องมือแบบนี้ที่ยัดเมตาดาต้าแบบสุ่มซึ่งผมไม่ได้เลือกลงไป
ถ้ากำลังสร้าง texture สำหรับวิดีโอเกม ทำไมต้องใส่ เศษซาก DRM แปลกๆ แบบนี้ด้วย? แล้ว Photoshop มีมานานแค่ไหนแล้ว ทำไมถึงเป็นข้อยกเว้น?
Photoshop ไม่ได้ถูกสร้างโดย Google หรือ OpenAI และการใช้ Photoshop ทำภาพหลอกลวงที่สมจริงก็มีอุปสรรคในการเข้าถึงสูงกว่า AI มาก ทุกวันนี้ก็มีเทคนิคที่ตรวจจับการใช้การแต่งภาพแบบดั้งเดิมได้บ้างแม้จะไม่สมบูรณ์
SynthID จะเป็น DRM ก็ต่อเมื่อ Google หรือ OpenAI อ้าง สิทธิ์ในทรัพย์สินทางปัญญา เหนือภาพของตัวเอง ซึ่งผมก็ไม่รู้ว่านั่นถูกกฎหมายไหม
ดีเลย ทุกคนบอกว่ามันจะถูกลบออกได้ แต่ผมยังไม่เห็น repository ที่สาธิตเรื่องนี้ได้แบบทำซ้ำได้
ผมทดสอบกับ Nano Banana Pro ตั้งแต่วันแรกที่ออกและมันใช้ได้ ตอนนี้ก็ยังใช้ได้กับ Nano Banana 2
ผมไม่โพสต์ไว้ที่ไหนเพราะคิดแบบหยิ่งๆ ว่าการพูดเรื่องนี้ต่อสาธารณะจะทำให้อินเทอร์เน็ตแย่ลง แต่ถ้าผมนึกออกได้ตั้งแต่วันแรก โปรแกรมเมอร์คนอื่นอีกหลายล้านคนก็น่าจะนึกออกเหมือนกัน ดังนั้นมันก็เป็นแค่ความหยิ่งล้วนๆ
แต่จะมีอาร์ติแฟกต์เฉพาะของโมเดล SD โผล่มา ซึ่งอาจถูกตรวจจับด้วยวิธีอื่นได้ หรือถ้าขยายใหญ่แล้วเพ่งดีๆ ก็อาจมองเห็นได้
จังหวะที่โพสต์นี้ไปอยู่ติดกับโพสต์นี้พอดีนี่ช่างลงตัวจริงๆ: https://news.ycombinator.com/item?id=48200569
คล้ายเมตาดาต้าของ mp3 เหรอ?
ถ้าแคปหน้าจอภาพ AI มา มันยังจะถูกมองว่าเป็นภาพ AI อยู่ไหม? ผมสงสัยว่ามันซ่อนอยู่ในภาพเลย หรือเป็นแค่เมตาดาต้า
ตอนแรกก็ตรวจสอบว่าภาพมาจาก OpenAI หรือเปล่า จากนั้นก็คงใส่ ข้อมูลสมาชิก กับข้อมูลตำแหน่งที่ตั้งลงไป
สุดท้ายพวกเขาจะค้นพบว่าไม่มีใครอยากดูรูปถ่ายหรือข้อความที่สร้างด้วย AI เลย พอถึงจุดนั้นเครื่องมือนี้ก็คงล้มเหลวสำหรับสาธารณะ และใช้ได้แค่กับรัฐบาล
ลายน้ำแบบนี้ไม่ใช่ว่าลบหรือบิดเบือนได้ง่ายหรอกเหรอ? มันดูมีประโยชน์แค่ตราบใดที่คนยังพึ่งพามันน้อยและยังไม่คุ้มจะหลบเลี่ยง
ถ้าแพลตฟอร์มโซเชียลมีเดียเริ่มแบนภาพที่มีลายน้ำแบบนี้ ทุกคนคงแห่กันลบมันทิ้งในชั่วข้ามคืน
วิธีที่ผมเห็นจนถึงตอนนี้มีแค่ทริกแปลกๆ อย่างใช้ความโปร่งใสหรือเอาภาพต้นฉบับมาซ้อนตอนใช้ฟีเจอร์แก้ไข หรือไม่ก็ใช้ diffusion model สร้างภาพ NB ใหม่ที่ระดับนอยส์ต่ำ ซึ่งในกรณีนั้นภาพต้นฉบับก็เปลี่ยนไปด้วย
https://github.com/aloshdenny/reverse-SynthID
มันดูด้อยกว่ามาตรฐานสาธารณะจริงอย่าง C2PA: https://contentauthenticity.org/