RealFill: การเติมเต็มภาพด้วยโมเดลการแพร่กระจาย

(realfill.github.io)

1 คะแนน โดย GN⁺ 2023-09-30 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

แนวทางเชิงกำเนิดแบบใหม่สำหรับการเติมเต็มภาพที่พัฒนาโดย Google Research และมหาวิทยาลัยคอร์เนล
RealFill มีเป้าหมายเพื่อเติมส่วนที่หายไปของภาพด้วยเนื้อหาที่ควรมีอยู่เดิม เพื่อสร้างภาพที่สมจริงยิ่งขึ้น
โมเดลนี้ถูกปรับให้เหมาะกับงานโดยใช้ภาพอ้างอิงจำนวนหนึ่ง ซึ่งไม่จำเป็นต้องตรงกับภาพเป้าหมาย และอาจมีความหลากหลายในมุมมอง สภาพแสง รูรับแสงของกล้อง หรือสไตล์ของภาพ
RealFill ทำผลงานได้เหนือกว่าวิธีการเดิมอย่างชัดเจนบนเบนช์มาร์กการเติมเต็มภาพใหม่ที่ครอบคลุมสถานการณ์หลากหลายและท้าทาย
กระบวนการนี้ประกอบด้วยการปรับจูนแบบละเอียดของโมเดล inpainting diffusion ที่ผ่านการฝึกมาก่อนแล้วสำหรับภาพอ้างอิงและภาพเป้าหมาย ซึ่งช่วยให้เรียนรู้เนื้อหา แสง และสไตล์ของฉากในภาพอินพุต
จากนั้นโมเดลที่ผ่านการปรับจูนแบบละเอียดจะถูกใช้เพื่อเติมพื้นที่ที่หายไปของภาพเป้าหมายผ่านกระบวนการ sampling ของ diffusion มาตรฐาน
RealFill สร้างภาพคุณภาพสูงที่ยังคงซื่อตรงต่อฉากต้นฉบับและดูน่าสนใจทางสายตา แม้จะมีความแตกต่างอย่างมากระหว่างภาพอ้างอิงกับภาพเป้าหมาย
ข้อจำกัดของ RealFill คือกระบวนการปรับจูนแบบละเอียดที่อิงกับ gradient ซึ่งค่อนข้างช้า และมีความยากในการกู้คืนฉาก 3D เมื่อมุมมองระหว่างภาพอ้างอิงกับภาพเป้าหมายต่างกันมาก
RealFill ยังประสบความยากลำบากในกรณีที่ท้าทาย แม้จะใช้โมเดลพื้นฐานที่ผ่านการฝึกมาก่อนอย่าง Stable Diffusion

1 ความคิดเห็น

GN⁺ 2023-09-30

ความคิดเห็นจาก Hacker News

บทความเกี่ยวกับ 'RealFill' เครื่องมือเติมเต็มภาพโดยใช้โมเดลการแพร่
เครื่องมือนี้อาจมีคุณค่าในการปรับปรุงภาพถ่ายทั้งในปัจจุบันและในอดีต
RealFill สามารถปรับปรุงภาพได้โดยการผสานภาพที่คล้ายกันให้เป็นภาพเดียวที่ดีกว่า
เครื่องมือสำหรับสร้างภาพสังเคราะห์เพื่อโพสต์บนโซเชียลมีเดีย ซึ่งอาจเพิ่มความน่าสนใจและความสนุกได้
RealFill เป็นเครื่องมือหลังการถ่ายทำที่มีประโยชน์สำหรับภาพยนตร์และทีวี โดยให้ความยืดหยุ่นในการ "uncropping" และแปลงภาพ 4:3 เป็นจอกว้าง
เครื่องมือนี้สามารถใช้แก้ปัญหาของกล้องรูเข็มราคาถูกในชุดกล้องอาร์เรย์แบบโฮโลกราฟิกได้
RealFill สามารถใช้ซ่อมภาพถ่ายครอบครัวที่ถูกตัดออกโดยไม่ตั้งใจได้
ฟังก์ชัน AI digital zoom out สำหรับสร้างภาพที่ดูเหมือนซูมออกโดยไม่ขึ้นกับเลนส์หรือระยะทาง
มีความกังวลต่อการใช้คำว่า "จริง" และ "การกู้คืน" ในเดโม เพราะภาพผลลัพธ์ไม่ใช่ของจริงหรือการกู้คืน แต่เป็นภาพลวงตา
เครื่องมือนี้อาจทำให้โทรศัพท์ Pixel น่าสนใจยิ่งขึ้น ด้วยความสามารถอย่าง Magic Eraser และ "การเติมเต็มภาพจริง"
ความก้าวหน้าของ AI ในช่วงไม่กี่ปีมานี้น่าประทับใจ และเครื่องมืออย่าง RealFill แสดงถึงก้าวสำคัญของการพัฒนา
ผู้แสดงความเห็นบางส่วนกังวลถึงนัยของการใช้ AI เพื่อสร้างภาพลวงตาของความสมจริง
ความสามารถของเครื่องมือนี้ถูกเปรียบเทียบกับการที่กล้อง GoPro ลบไม้เซลฟี่ออก โดยใช้เฟรมข้างเคียงมาเติมพิกเซล

RealFill: การเติมเต็มภาพด้วยโมเดลการแพร่กระจาย

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News