30 คะแนน โดย GN⁺ 2024-08-11 | 4 ความคิดเห็น | แชร์ทาง WhatsApp
  • รองรับการสลับใบหน้าแบบเรียลไทม์ด้วยการคลิกครั้งเดียวโดยใช้ภาพเพียงภาพเดียวด้วยเทคโนโลยี AI ล้ำสมัย (วิดีโอดีปเฟค)
  • หลายแพลตฟอร์ม: รองรับ CPU, NVIDIA CUDA, Apple Silicon (M1/M2)
  • มีฟังก์ชันตรวจสอบในตัวเพื่อป้องกันการประมวลผลเนื้อหาที่ไม่เหมาะสม และรับประกันการใช้งานที่ถูกกฎหมายและมีจริยธรรม
  • โอเพนซอร์สบน Python
  • ขั้นตอนการใช้งาน
    1. ตั้งค่าสภาพแวดล้อมที่จำเป็น (python, pip, ffmpeg)
    2. โคลนที่เก็บ GitHub
    3. ดาวน์โหลดโมเดลที่จำเป็น (GFPGANv1.4, inswapper_128_fp16.onnx)
    4. ติดตั้ง dependencies (ใช้ venv: CUDA, CoreML, DirectML, OpenVINO)
    5. รันโปรแกรม
    6. เลือกภาพต้นทางและเป้าหมาย
    7. เริ่มกระบวนการสลับใบหน้า

ฟีเจอร์หลักของ Deep Live Cam

  • สลับใบหน้าแบบเรียลไทม์: สามารถสลับใบหน้าแบบเรียลไทม์โดยใช้ภาพเพียงภาพเดียว พร้อมแสดงตัวอย่างได้ทันที
  • ดีปเฟควิดีโอแบบคลิกเดียว: สร้างวิดีโอดีปเฟคคุณภาพสูงได้อย่างรวดเร็วและง่ายดายด้วยการใช้งานที่ไม่ซับซ้อน
  • รองรับหลายแพลตฟอร์ม: ทำงานได้กับการตั้งค่าฮาร์ดแวร์หลากหลาย เช่น CPU, NVIDIA CUDA และ Apple Silicon
  • กลไกความปลอดภัยเพื่อการใช้งานอย่างมีจริยธรรม: มีระบบตรวจสอบในตัวเพื่อป้องกันการประมวลผลเนื้อหาที่ไม่เหมาะสม และช่วยรับประกันการใช้งานตามกฎหมายและจริยธรรม
  • ประสิทธิภาพที่ปรับแต่งมาแล้ว: ใช้อัลกอริทึมที่ปรับแต่งมาเพื่อเพิ่มความเร็วในการประมวลผลอย่างมาก โดยเฉพาะบน NVIDIA GPU ที่รองรับ CUDA

# สรุปของ GN⁺

  • Deep Live Cam เป็นเครื่องมือ AI ล้ำสมัยสำหรับการสลับใบหน้าแบบเรียลไทม์และการสร้างวิดีโอดีปเฟค โดยสามารถทำงานได้บนหลายแพลตฟอร์ม
  • มีระบบความปลอดภัยในตัวเพื่อส่งเสริมการใช้งานอย่างมีจริยธรรม และได้รับการสนับสนุนอย่างต่อเนื่องจากชุมชนโอเพนซอร์ส
  • เครื่องมือนี้มีประโยชน์สำหรับโปรเจกต์เชิงสร้างสรรค์และการผลิตวิดีโอ โดยเฉพาะเมื่อจำเป็นต้องได้ผลลัพธ์ภาพคุณภาพสูงอย่างรวดเร็ว
  • โปรเจกต์อื่นที่มีฟังก์ชันคล้ายกัน ได้แก่ DeepFaceLab และ FaceSwap

4 ความคิดเห็น

 
dongwon 2024-08-13

ผมลองทำเองดูแล้ว แม้จะไม่ถึงกับแยกไม่ออกเลย แต่ก็ยังรู้สึกว่าแค่ภาพจริงภาพเดียวก็ทำได้ถึงขนาดนี้เลยเหรอ...? ให้ความรู้สึกว่าผู้สูงอายุน่าจะโดนหลอกแบบเชื่อสนิทได้จริง ๆ เป็นโลกที่ไม่รู้แล้วว่าควรเชื่ออะไรดี

 
xguru 2024-08-12

เมื่อทำได้ด้วยภาพเพียงภาพเดียว ผลลัพธ์ก็ถือว่ายอดเยี่ยมมากเลยนะ ตอนนี้คงจะเชื่อวิดีโอไม่ได้จริง ๆ แล้ว

 
GN⁺ 2024-08-11
ความเห็นจาก Hacker News
  • "มาตรการป้องกันการใช้งานอย่างมีจริยธรรม" ช่วยป้องกันการจัดการเนื้อหาที่ไม่เหมาะสม

    • มีตัวอย่างการปลอมตัวเป็นคนดังและนักการเมือง (รวมถึง JD Vance)
    • คำจำกัดความของดีปเฟก "อย่างมีจริยธรรม" ยังคลุมเครือ
    • มีหลายสิ่งที่ AI สร้างได้ จึงน่าสงสัยว่าทำไมถึงเลือกทำสิ่งนี้
  • ในเชิงเทคนิค คุณภาพน่าทึ่งมาก

    • ตอนนี้แทบทุก script kiddie สามารถทำดีปเฟกใบหน้าระหว่างวิดีโอคอลแบบเรียลไทม์ได้แล้ว
    • เราไม่อาจเชื่อสิ่งที่เห็นด้วยตาในการวิดีโอคอลได้อีกต่อไป
    • เรากำลังอยู่ในยุคที่น่าสนใจ
  • โปรเจกต์นี้อิงจาก "GFPGAN v1.4" และ "FaceSwap Extension - Automatic 1111 - Proof of Concept"

    • โปรเจกต์ GFPGAN อิงจากงานวิจัยของ Wang และคณะ เรื่อง "GFP-GAN: Towards Real-World Blind Face Restoration with Generative Facial Prior"
  • โปรเจกต์นี้ดูเหมือนจะเป็นฟอร์กของ roop ที่ยุติการพัฒนาแล้ว และมีการปรับปรุงหลัก ๆ ที่ UI

    • หนึ่งในนักพัฒนาหลักของ roop กำลังพัฒนา facefusion ซึ่งรองรับการสลับใบหน้าผ่านเว็บแคมแบบเรียลไทม์
  • แม้จะน่าประทับใจในเชิงเทคนิค แต่ก็ยากจะหากรณีใช้งานที่ดีซึ่งไม่เกี่ยวข้องกับการโฆษณาชวนเชื่อหรือการหลอกลวง

    • แม้แต่บนเว็บไซต์ก็ยังไม่ได้ระบุกรณีใช้งานที่ชัดเจน
  • ถ้าเพิ่มการเสริมเสียงเข้าไป บัญชีธนาคารของคุณปู่คุณย่าคุณตาคุณยายทุกคนอาจถูกกวาดหมด

    • ต้องรีบเตือนกันตั้งแต่ตอนนี้
  • ชวนให้สงสัยว่าเทคโนโลยีนี้มีกรณีใช้งานที่ชอบด้วยกฎหมายหรือไม่

    • อยากรู้ว่าตอนออกแบบผลิตภัณฑ์ เขาตั้งเป้า persona/vertical market แบบไหนไว้
  • "ฟังก์ชันตรวจสอบในตัวช่วยป้องกันการจัดการเนื้อหาที่ไม่เหมาะสม เพื่อให้มั่นใจถึงการใช้งานที่ถูกกฎหมายและมีจริยธรรม"

    • วิศวกรซอฟต์แวร์ก็หวังว่าปืนจะไม่กระโดดลงจากโต๊ะไปยิงคนเอง
  • เราอาจมาถึงจุดที่ควรเชื่อถือเฉพาะสื่อมัลติมีเดียที่ผ่านการตรวจสอบไขว้จากแหล่งที่น่าเชื่อถือแล้วเท่านั้น

    • สงสัยว่ากล้องจะใส่ลายเซ็นดิจิทัลเพื่อระบุได้ไหมว่าวิดีโอ/ภาพนั้นเป็นของจริง
    • การติดแท็กภาพ/วิดีโอที่ไม่ใช่ AI ดูเป็นไปได้จริงมากกว่าการติดแท็กภาพ/วิดีโอจาก AI
  • รู้สึกว่าจังหวะเวลาการเปิดตัวเครื่องมือนี้ไม่เหมาะสมอย่างมาก

    • มีโอกาสทำลายการเลือกตั้งสหรัฐฯ ในปีนี้ได้
    • แค่คิดถึงผลกระทบที่เทคโนโลยีนี้จะมีต่อการเลือกตั้งก็แย่พอแล้ว
    • อาจก่อให้เกิดปัญหามากมาย เช่น สื่อลามกเด็ก การก่อการร้าย การทำให้รัฐบาลไร้เสถียรภาพ สงครามกลางเมือง/สงครามโลก เป็นต้น
 
cosine20 2024-08-13

"วิศวกรซอฟต์แวร์ก็แค่หวังว่าปืนจะไม่กระโดดลงจากโต๊ะไปยิงคน" 555