2 คะแนน โดย GN⁺ 2 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • OpenAI เสริมความแข็งแกร่งให้โมเดลแหล่งที่มาแบบหลายชั้น โดยผสานความสอดคล้องกับ C2PA, ลายน้ำ SynthID และเครื่องมือตรวจสอบแบบสาธารณะ เพื่อระบุคอนเทนต์ที่สร้างโดย AI
  • C2PA ใช้เมตาดาตาและลายเซ็นเชิงเข้ารหัสเพื่อพกพาบริบทการสร้างและการแก้ไขของคอนเทนต์ไปด้วยกัน แต่ข้อมูลอาจเสียหายได้ระหว่างกระบวนการแปลง
  • SynthID ของ Google DeepMind เพิ่มลายน้ำที่มองไม่เห็นให้กับภาพที่สร้างผ่าน ChatGPT, Codex และ OpenAI API เพื่อชดเชยข้อจำกัดของเมตาดาตา
  • พรีวิวเครื่องมือตรวจสอบแบบสาธารณะจะตรวจหา Content Credentials และ SynthID ในภาพที่อัปโหลด เพื่อช่วยประเมินว่าภาพนั้นสร้างโดย OpenAI หรือไม่
  • เทคโนโลยีเพียงอย่างเดียวไม่เพียงพอ และระบบนิเวศด้านแหล่งที่มาจะแข็งแกร่งขึ้นได้เมื่อผสาน มาตรฐานร่วม, การทำลายน้ำที่คงอยู่ยาวนาน และการตรวจสอบแบบสาธารณะ

ยกระดับแนวทางด้านแหล่งที่มาของคอนเทนต์

  • OpenAI กำลังเสริมความแข็งแกร่งให้ โมเดลแหล่งที่มาแบบหลายชั้น เพื่อสร้างความน่าเชื่อถือบนโลกออนไลน์ และเพิ่มความสามารถในการระบุคอนเทนต์ที่สร้างโดย AI โดยอาศัยมาตรฐานแบบเปิดและความร่วมมือข้ามแพลตฟอร์ม
  • การเปลี่ยนแปลงหลักมีอยู่ 3 อย่าง
    • รองรับ ความสอดคล้องกับ C2PA เพื่อให้เครื่องมือและแพลตฟอร์มอื่นสามารถรับรู้สัญญาณแหล่งที่มาได้ง่ายขึ้น
    • ร่วมมือกับ Google เพื่อเพิ่ม ลายน้ำ SynthID ลงในภาพ
    • เปิดพรีวิวเครื่องมือตรวจสอบแบบสาธารณะ เพื่อให้ผู้คนตรวจสอบได้ว่าภาพถูกสร้างจาก OpenAI หรือไม่
  • สัญญาณแหล่งที่มาช่วยให้บริบทที่จำเป็นต่อการตัดสินได้ว่าคอนเทนต์มาจากไหน ถูกสร้างหรือแก้ไขอย่างไร และสอดคล้องกับสิ่งที่อ้างหรือไม่

ระบบนิเวศแห่งความน่าเชื่อถือผ่านความสอดคล้องกับ C2PA

  • OpenAI มีส่วนร่วมในการพัฒนาและนำมาตรฐานแหล่งที่มาไปใช้มาตั้งแต่ปี 2024 และเริ่มเพิ่ม Content Credentials ให้กับภาพที่สร้างด้วย DALL·E 3
  • หลังจากนั้น ImageGen และ Sora ก็ได้รับการใช้ Content Credentials เช่นกัน
  • OpenAI เข้าร่วมคณะกรรมการกำกับของ Coalition for Content Provenance and Authenticity(C2PA) ซึ่งเป็นองค์กรข้ามอุตสาหกรรมที่ผลักดันมาตรฐานเทคโนโลยีแบบเปิดสำหรับแหล่งที่มาของคอนเทนต์
  • C2PA เป็นแนวทางที่ใช้ เมตาดาตาและลายเซ็นเชิงเข้ารหัส เพื่อช่วยให้ข้อมูลที่เกี่ยวข้องกับสื่อเดินทางไปพร้อมกับตัวคอนเทนต์อย่างปลอดภัย
  • ข้อมูลนี้ให้บริบทแก่ผู้สื่อข่าวที่ต้องประเมินแหล่งที่มา แพลตฟอร์มที่ต้องตัดสินใจด้านความสมบูรณ์ และผู้คนที่ต้องการเข้าใจคอนเทนต์ออนไลน์
  • ล่าสุด OpenAI ได้กลายเป็น ผลิตภัณฑ์สร้างคอนเทนต์ที่สอดคล้องกับ C2PA
  • ความสอดคล้องกับ C2PA เป็นรากฐานที่ช่วยให้แพลตฟอร์มสามารถอ่าน เก็บรักษา และส่งต่อข้อมูลแหล่งที่มาที่แนบมากับคอนเทนต์ได้อย่างน่าเชื่อถือ
  • ข้อมูลแหล่งที่มาจะมีความหมายมากขึ้นเมื่อยังคงอยู่ต่อไปนอกเหนือจากแพลตฟอร์มที่สร้างคอนเทนต์ขึ้นมาแต่แรก และ การปฏิบัติตามข้อกำหนดด้านความสอดคล้อง คือสิ่งที่ทำให้เกิดสิ่งนั้นได้

แหล่งที่มาของภาพแบบหลายชั้นด้วย SynthID

  • เมตาดาตา C2PA เป็นรากฐานที่ช่วยพกพาข้อมูลว่าคอนเทนต์มาจากไหน ถูกสร้างหรือแก้ไขอย่างไร และใครเป็นผู้ลงนามรับรองข้อมูลนั้น
  • เมตาดาตาอาจถูกลบ สูญหายระหว่างการอัปโหลดหรือดาวน์โหลด หรือเสียหายจากการแปลง เช่น การเปลี่ยนรูปแบบไฟล์ การปรับขนาด หรือการจับภาพหน้าจอ
  • เพื่อทำให้ข้อมูลแหล่งที่มามีความทนทานมากขึ้น OpenAI จึงนำ ลายน้ำที่มองไม่เห็น ผ่าน SynthID ของ Google DeepMind มาใช้
  • การใช้งานจะเริ่มจากภาพที่สร้างผ่าน ChatGPT, Codex และ OpenAI API ก่อน
  • SynthID ทำงานเป็นชั้นลายน้ำเพิ่มเติมที่ช่วยเสริมแนวทางที่อิงเมตาดาตาของ C2PA
  • ก่อนหน้านี้ OpenAI ก็ได้ทดลองใช้แนวทางด้านแหล่งที่มาและการทำลายน้ำในสภาพแวดล้อมการใช้งานจริงมาแล้ว
    • Sora ใช้ ลายน้ำแบบมองเห็นได้
    • Voice Engine ใช้ ลายน้ำเสียง
    • และยังคงทดสอบและวิจัยต่อเนื่องว่าความแม่นยำและความน่าเชื่อถือจะคงอยู่เมื่อเวลาผ่านไปหรือไม่
  • C2PA และ SynthID ชดเชยจุดอ่อนของกันและกัน
    • C2PA ช่วยใส่บริบทอย่างละเอียดลงในคอนเทนต์ แต่เมตาดาตาอาจถูกลบหรือเสียหายได้
    • SynthID ช่วยรักษาสัญญาณไว้ได้แม้เมตาดาตาจะไม่คงอยู่ และอาจทนต่อการแปลงอย่างการจับภาพหน้าจอได้ยาวนานกว่า
    • เมตาดาตาให้ข้อมูลได้มากกว่าที่ลายน้ำเพียงอย่างเดียวจะให้ได้
  • เมื่อใช้สองแนวทางร่วมกัน ความทนทานของข้อมูลแหล่งที่มาของคอนเทนต์จะดีกว่าการใช้วิธีใดวิธีหนึ่งเพียงลำพัง

พรีวิวเครื่องมือตรวจสอบแบบสาธารณะ

  • OpenAI เปิดให้ใช้งานเครื่องมือตรวจสอบแบบสาธารณะในเวอร์ชันพรีวิว เพื่อช่วยตรวจว่าภาพถูกสร้างจาก ChatGPT, OpenAI API หรือ Codex หรือไม่
  • เครื่องมือนี้จะตรวจว่าภาพที่อัปโหลดมีสัญญาณแหล่งที่มา เช่น Content Credentials และ SynthID อยู่หรือไม่
  • เป้าหมายคือการรวมหลายสัญญาณเข้าด้วยกัน เพื่อช่วยให้ผู้ใช้ตรวจสอบและตีความข้อมูลแหล่งที่มาของคอนเทนต์ได้ง่ายขึ้น
  • เครื่องมือตรวจสอบแบบสาธารณะสามารถตรวจจับลายน้ำ SynthID ที่มาจาก OpenAI ได้อย่างเสถียร และหากพบเมตาดาตา C2PA ก็สามารถแสดงผลร่วมกันได้
  • เนื่องจากไม่มีวิธีตรวจจับใดที่สมบูรณ์แบบ เมื่อการตรวจจับล้มเหลวจึงจะไม่สรุปแบบเด็ดขาด
    • แม้จะไม่พบเมตาดาตาหรือลายน้ำ ก็จะไม่สรุปว่าภาพนั้นไม่ได้สร้างด้วยเครื่องมือของ OpenAI
    • ในบางกรณี สัญญาณแหล่งที่มาอาจถูกลบออกได้
  • เครื่องมือตรวจสอบ ณ เวลาที่เปิดตัวจะจำกัดอยู่ที่ คอนเทนต์ที่ OpenAI สร้างขึ้น
  • ในอีกไม่กี่เดือนข้างหน้า เป้าหมายคือการสนับสนุนความพยายามระดับอุตสาหกรรมที่ช่วยให้สามารถตรวจสอบได้ครอบคลุมหลายแพลตฟอร์ม
  • คาดว่าเมื่อเวลาผ่านไป จะรองรับคอนเทนต์ออนไลน์ได้หลากหลายประเภทมากขึ้น

ความท้าทายในอนาคต

  • เทคโนโลยีด้านแหล่งที่มาเพียงอย่างเดียวไม่เพียงพอ
  • แนวทางด้านแหล่งที่มาที่แข็งแกร่งต้องผสาน มาตรฐานร่วม, สัญญาณลายน้ำที่คงอยู่ยาวนาน และการตรวจสอบแบบสาธารณะ
  • OpenAI ต้องการมีส่วนช่วยสร้างระบบนิเวศแหล่งที่มาที่ทำงานร่วมกันได้มากขึ้น ผ่านการรองรับ Content Credentials ที่มีอยู่เดิม ความสอดคล้องกับ C2PA การนำ SynthID มาใช้ และพรีวิวเครื่องมือตรวจสอบแบบสาธารณะ

1 ความคิดเห็น

 
GN⁺ 2 시간 전
ความคิดเห็นจาก Hacker News
  • ถ้าทำภาพ AI ให้มีพื้นหลังสีดำ บนจอที่ดีพอจะมองเห็น SynthID ได้ด้วยตาเปล่า มันก็แค่ลายเบลอซ้ำๆ ไม่มีอะไรพิเศษ
    ผมลบมันออกได้ค่อนข้างดีด้วยการมาสก์ทุกพิกเซลที่ 2 แล้วสร้างพิกเซลที่หายไปใหม่ จากนั้นเลื่อนออฟเซ็ต 1 พิกเซลแล้วมาสก์ทุกพิกเซลที่ 2 อีกครั้ง
    ผมใช้โมเดลสำเร็จรูปสำหรับการเติมพิกเซล แต่ก่อนแก้ไขจะส่งออก depth map ก่อน แล้วลดนอยส์เพื่อให้พิกเซลที่สร้างขึ้นมาใหม่ในส่วนที่มาสก์สอดคล้องกับเนื้อหาต้นฉบับ ผลลัพธ์ยังไม่สมบูรณ์ 100% แต่ถ้าใช้เวลาเพิ่มอีกหน่อยและใช้โมเดลที่ปรับจูนละเอียดสำหรับงานนี้โดยเฉพาะ ก็น่าจะลบลายน้ำ AI แบบไหนก็ได้โดยไม่มีปัญหาใหญ่

    • ผมเชื่อยากว่าจะลบลายน้ำแบบ 0.5-bit watermark ที่มีไว้แค่บอกว่ามีหรือไม่มีได้ สิ่งที่มองเห็นได้น่าจะเป็นตัวล่อเชิงหน้าที่มากกว่า
    • แค่ยืดหรือบีบภาพนิดหน่อยไม่ได้เหรอ?
    • น่าสนใจที่ถ้าใช้เวลาเพิ่มอีกหน่อยและใช้โมเดลที่ปรับจูนละเอียดสำหรับงานเฉพาะ ก็จะลบลายน้ำ AI แบบไหนก็ได้โดยไม่มีปัญหาใหญ่ การ ใช้ AI สู้กับ AI สนุกเสมอ
    • มันหลบเลี่ยงได้แน่นอน วิศวกรของเราบางคนก็เคยจัดการเรื่องนี้มานานแล้ว
      https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
  • เมตาดาต้าหรือ SynthID ใส่ข้อมูลอะไรไว้บ้าง? SynthID เข้ารหัสได้กี่บิต?
    จะทำฉลากโภชนาการสำหรับคอนเทนต์สังเคราะห์ได้ไหม? เช่น ข้อความสังเคราะห์ 10%, ภาพสังเคราะห์ 30%
    วันนี้ความเป็นจริงของคุณถูกสังเคราะห์ไป 15% แล้ว (75% บรรษัทขนาดใหญ่, 25% neocloud แบบ open weights)

    • งานวิจัย SynthID-Image เดือนตุลาคม 2025[0] ดูเหมือนจะเป็น encoder-decoder ที่ทดสอบการตรวจสอบแฟลกหรือเพย์โหลด 136 บิตบนภาพขนาด 512x512 และดูความทนทานของลายน้ำหลังการแปลงหลายแบบ
      เวอร์ชันที่ใช้งานจริงน่าจะต่างออกไปพอสมควร
      [0]:https://arxiv.org/html/2510.09263v1
    • อาจใส่ user ID หรือ ลายนิ้วมือ เฉพาะบุคคลได้ด้วย สมัยก่อนเครื่องพิมพ์ก็ทำแบบนั้น และตอนนี้ก็น่าจะทำกับรูปถ่ายและภาพทุกใบที่สร้างขึ้นได้ง่ายขึ้น
    • ผมว่าไม่น่าทำได้ ถ้าคุณแปะชิ้นส่วนสังเคราะห์ลงบนภาพต้นฉบับ SynthID ก็คงไม่มีทางรู้
  • น่าสนใจที่ SynthID ดูเหมือนถูกเจาะหมดแล้ว แต่ลายน้ำใหม่ของ OpenAI ยังไม่เป็นแบบนั้น [1]
    [1] https://github.com/wiltodelta/remove-ai-watermarks

  • นี่มันก็แค่การทำอะไรโชว์ๆ ไร้สาระ
    ในฐานะคนที่ใช้เครื่องมือสร้างอะไรบางอย่างให้หลายสื่อ ผมก็จะเลี่ยงเครื่องมือแบบนี้ที่ยัดเมตาดาต้าแบบสุ่มซึ่งผมไม่ได้เลือกลงไป
    ถ้ากำลังสร้าง texture สำหรับวิดีโอเกม ทำไมต้องใส่ เศษซาก DRM แปลกๆ แบบนี้ด้วย? แล้ว Photoshop มีมานานแค่ไหนแล้ว ทำไมถึงเป็นข้อยกเว้น?

    • การที่มันไม่สมบูรณ์ไม่ได้แปลว่าไม่มีประโยชน์ ผมเคยเห็นโพสต์ออนไลน์ที่มีคนเอาภาพไปตรวจด้วย SynthID checker ของ Google แล้วพิสูจน์ได้ว่าเป็นของปลอม
      Photoshop ไม่ได้ถูกสร้างโดย Google หรือ OpenAI และการใช้ Photoshop ทำภาพหลอกลวงที่สมจริงก็มีอุปสรรคในการเข้าถึงสูงกว่า AI มาก ทุกวันนี้ก็มีเทคนิคที่ตรวจจับการใช้การแต่งภาพแบบดั้งเดิมได้บ้างแม้จะไม่สมบูรณ์
    • ผมเชื่อว่าคุณน่าจะนึกความต่างระหว่าง Photoshop กับ generative AI ออกได้หลายข้อ
    • พูดอย่างเคร่งครัด DRM คือการจัดการสิทธิ์ดิจิทัล และเกี่ยวข้องกับทรัพย์สินทางปัญญา
      SynthID จะเป็น DRM ก็ต่อเมื่อ Google หรือ OpenAI อ้าง สิทธิ์ในทรัพย์สินทางปัญญา เหนือภาพของตัวเอง ซึ่งผมก็ไม่รู้ว่านั่นถูกกฎหมายไหม
    • เผื่อใครสนใจ: https://en.wikipedia.org/wiki/Printer_tracking_dots
    • ปัจจุบัน ปริมาณการผลิตข้อมูลเท็จสูงสุดตามทฤษฎี ต่อนาที เทียบกับ Photoshop ในปี 2021 เป็นอย่างไร?
  • ดีเลย ทุกคนบอกว่ามันจะถูกลบออกได้ แต่ผมยังไม่เห็น repository ที่สาธิตเรื่องนี้ได้แบบทำซ้ำได้

    • แค่ตั้งค่าความแรงการลดนอยส์ 10~15% ใน Stable Diffusion ก็จบแล้ว
      ผมทดสอบกับ Nano Banana Pro ตั้งแต่วันแรกที่ออกและมันใช้ได้ ตอนนี้ก็ยังใช้ได้กับ Nano Banana 2
      ผมไม่โพสต์ไว้ที่ไหนเพราะคิดแบบหยิ่งๆ ว่าการพูดเรื่องนี้ต่อสาธารณะจะทำให้อินเทอร์เน็ตแย่ลง แต่ถ้าผมนึกออกได้ตั้งแต่วันแรก โปรแกรมเมอร์คนอื่นอีกหลายล้านคนก็น่าจะนึกออกเหมือนกัน ดังนั้นมันก็เป็นแค่ความหยิ่งล้วนๆ
      แต่จะมีอาร์ติแฟกต์เฉพาะของโมเดล SD โผล่มา ซึ่งอาจถูกตรวจจับด้วยวิธีอื่นได้ หรือถ้าขยายใหญ่แล้วเพ่งดีๆ ก็อาจมองเห็นได้
    • ดูเหมือนว่าการใช้โมเดลอื่นตั้งแต่แรกจะง่ายกว่ามาก
    • มันคงถูกลบออกได้ แต่คนส่วนใหญ่คงไม่ทำ จริงๆ แล้วผมเคยเห็นข้อมูลเท็จที่ตรวจจับได้ด้วย SynthID
  • จังหวะที่โพสต์นี้ไปอยู่ติดกับโพสต์นี้พอดีนี่ช่างลงตัวจริงๆ: https://news.ycombinator.com/item?id=48200569

  • คล้ายเมตาดาต้าของ mp3 เหรอ?
    ถ้าแคปหน้าจอภาพ AI มา มันยังจะถูกมองว่าเป็นภาพ AI อยู่ไหม? ผมสงสัยว่ามันซ่อนอยู่ในภาพเลย หรือเป็นแค่เมตาดาต้า

    • มันอยู่ในตัวภาพ และถูกออกแบบมาให้อยู่รอดแม้ผ่านกระบวนการแบบนั้น
  • ตอนแรกก็ตรวจสอบว่าภาพมาจาก OpenAI หรือเปล่า จากนั้นก็คงใส่ ข้อมูลสมาชิก กับข้อมูลตำแหน่งที่ตั้งลงไป
    สุดท้ายพวกเขาจะค้นพบว่าไม่มีใครอยากดูรูปถ่ายหรือข้อความที่สร้างด้วย AI เลย พอถึงจุดนั้นเครื่องมือนี้ก็คงล้มเหลวสำหรับสาธารณะ และใช้ได้แค่กับรัฐบาล

    • การใช้งานอย่างเดียวของ AI-generated แบบสมจริงเหมือนภาพถ่าย ดูจะเป็นการหลอกลวง ตอนนี้ในโฆษณาการเมืองของสหรัฐฯ ก็มีการใช้วิดีโอที่สร้างด้วย AI แล้ว
  • ลายน้ำแบบนี้ไม่ใช่ว่าลบหรือบิดเบือนได้ง่ายหรอกเหรอ? มันดูมีประโยชน์แค่ตราบใดที่คนยังพึ่งพามันน้อยและยังไม่คุ้มจะหลบเลี่ยง
    ถ้าแพลตฟอร์มโซเชียลมีเดียเริ่มแบนภาพที่มีลายน้ำแบบนี้ ทุกคนคงแห่กันลบมันทิ้งในชั่วข้ามคืน

    • ไม่ใช่ มันทนต่อการแปลงที่ทำได้ง่ายได้ดีมาก แต่ผมก็ไม่คิดว่ามันเป็นไปไม่ได้
    • เท่าที่ผมเห็น ยังไม่มี GitHub repository สักอันที่ลบลายน้ำ SynthID จริงจากเอาต์พุต Nano Banana 2/NBPro ได้ ส่วนใหญ่ยังเป็นแค่โปรเจ็กต์วิจัยที่ยังไม่ค่อยมีผลลัพธ์
      วิธีที่ผมเห็นจนถึงตอนนี้มีแค่ทริกแปลกๆ อย่างใช้ความโปร่งใสหรือเอาภาพต้นฉบับมาซ้อนตอนใช้ฟีเจอร์แก้ไข หรือไม่ก็ใช้ diffusion model สร้างภาพ NB ใหม่ที่ระดับนอยส์ต่ำ ซึ่งในกรณีนั้นภาพต้นฉบับก็เปลี่ยนไปด้วย
    • ต้องนิยามคำว่า “ง่าย” ก่อน มีแนวทางที่อิงกับ การวิเคราะห์สเปกตรัม ของภาพ และดูเผินๆ เหมือนจะใช้ได้
      https://github.com/aloshdenny/reverse-SynthID
    • นี่ถูกเผยแพร่มาหลายปีแล้วและดูเหมือนยังไม่ถูกทำลาย สักวันก็คงถูกทำลาย แต่ถ้าคุณต้องรอ 1~2 ปีกว่าจะทำ deepfake แล้วอัปขึ้น Facebook ได้ แค่นั้นก็อาจเพียงพอแล้ว แค่หน่วงได้สักเดือนหนึ่งก็น่าจะพอด้วยซ้ำ
    • วิธีที่ให้ AI สร้างภาพขึ้นใหม่ทั้งหมดจากคำอธิบายที่ละเอียดมาก น่าจะใช้ได้
  • มันดูด้อยกว่ามาตรฐานสาธารณะจริงอย่าง C2PA: https://contentauthenticity.org/