- รองรับการสลับใบหน้าแบบเรียลไทม์ด้วยการคลิกครั้งเดียวโดยใช้ภาพเพียงภาพเดียวด้วยเทคโนโลยี AI ล้ำสมัย (วิดีโอดีปเฟค)
- หลายแพลตฟอร์ม: รองรับ CPU, NVIDIA CUDA, Apple Silicon (M1/M2)
- มีฟังก์ชันตรวจสอบในตัวเพื่อป้องกันการประมวลผลเนื้อหาที่ไม่เหมาะสม และรับประกันการใช้งานที่ถูกกฎหมายและมีจริยธรรม
- โอเพนซอร์สบน Python
- ขั้นตอนการใช้งาน
- ตั้งค่าสภาพแวดล้อมที่จำเป็น (python, pip, ffmpeg)
- โคลนที่เก็บ GitHub
- ดาวน์โหลดโมเดลที่จำเป็น (GFPGANv1.4, inswapper_128_fp16.onnx)
- ติดตั้ง dependencies (ใช้ venv: CUDA, CoreML, DirectML, OpenVINO)
- รันโปรแกรม
- เลือกภาพต้นทางและเป้าหมาย
- เริ่มกระบวนการสลับใบหน้า
ฟีเจอร์หลักของ Deep Live Cam
- สลับใบหน้าแบบเรียลไทม์: สามารถสลับใบหน้าแบบเรียลไทม์โดยใช้ภาพเพียงภาพเดียว พร้อมแสดงตัวอย่างได้ทันที
- ดีปเฟควิดีโอแบบคลิกเดียว: สร้างวิดีโอดีปเฟคคุณภาพสูงได้อย่างรวดเร็วและง่ายดายด้วยการใช้งานที่ไม่ซับซ้อน
- รองรับหลายแพลตฟอร์ม: ทำงานได้กับการตั้งค่าฮาร์ดแวร์หลากหลาย เช่น CPU, NVIDIA CUDA และ Apple Silicon
- กลไกความปลอดภัยเพื่อการใช้งานอย่างมีจริยธรรม: มีระบบตรวจสอบในตัวเพื่อป้องกันการประมวลผลเนื้อหาที่ไม่เหมาะสม และช่วยรับประกันการใช้งานตามกฎหมายและจริยธรรม
- ประสิทธิภาพที่ปรับแต่งมาแล้ว: ใช้อัลกอริทึมที่ปรับแต่งมาเพื่อเพิ่มความเร็วในการประมวลผลอย่างมาก โดยเฉพาะบน NVIDIA GPU ที่รองรับ CUDA
# สรุปของ GN⁺
- Deep Live Cam เป็นเครื่องมือ AI ล้ำสมัยสำหรับการสลับใบหน้าแบบเรียลไทม์และการสร้างวิดีโอดีปเฟค โดยสามารถทำงานได้บนหลายแพลตฟอร์ม
- มีระบบความปลอดภัยในตัวเพื่อส่งเสริมการใช้งานอย่างมีจริยธรรม และได้รับการสนับสนุนอย่างต่อเนื่องจากชุมชนโอเพนซอร์ส
- เครื่องมือนี้มีประโยชน์สำหรับโปรเจกต์เชิงสร้างสรรค์และการผลิตวิดีโอ โดยเฉพาะเมื่อจำเป็นต้องได้ผลลัพธ์ภาพคุณภาพสูงอย่างรวดเร็ว
- โปรเจกต์อื่นที่มีฟังก์ชันคล้ายกัน ได้แก่ DeepFaceLab และ FaceSwap
4 ความคิดเห็น
ผมลองทำเองดูแล้ว แม้จะไม่ถึงกับแยกไม่ออกเลย แต่ก็ยังรู้สึกว่าแค่ภาพจริงภาพเดียวก็ทำได้ถึงขนาดนี้เลยเหรอ...? ให้ความรู้สึกว่าผู้สูงอายุน่าจะโดนหลอกแบบเชื่อสนิทได้จริง ๆ เป็นโลกที่ไม่รู้แล้วว่าควรเชื่ออะไรดี
เมื่อทำได้ด้วยภาพเพียงภาพเดียว ผลลัพธ์ก็ถือว่ายอดเยี่ยมมากเลยนะ ตอนนี้คงจะเชื่อวิดีโอไม่ได้จริง ๆ แล้ว
ความเห็นจาก Hacker News
"มาตรการป้องกันการใช้งานอย่างมีจริยธรรม" ช่วยป้องกันการจัดการเนื้อหาที่ไม่เหมาะสม
ในเชิงเทคนิค คุณภาพน่าทึ่งมาก
โปรเจกต์นี้อิงจาก "GFPGAN v1.4" และ "FaceSwap Extension - Automatic 1111 - Proof of Concept"
โปรเจกต์นี้ดูเหมือนจะเป็นฟอร์กของ roop ที่ยุติการพัฒนาแล้ว และมีการปรับปรุงหลัก ๆ ที่ UI
แม้จะน่าประทับใจในเชิงเทคนิค แต่ก็ยากจะหากรณีใช้งานที่ดีซึ่งไม่เกี่ยวข้องกับการโฆษณาชวนเชื่อหรือการหลอกลวง
ถ้าเพิ่มการเสริมเสียงเข้าไป บัญชีธนาคารของคุณปู่คุณย่าคุณตาคุณยายทุกคนอาจถูกกวาดหมด
ชวนให้สงสัยว่าเทคโนโลยีนี้มีกรณีใช้งานที่ชอบด้วยกฎหมายหรือไม่
"ฟังก์ชันตรวจสอบในตัวช่วยป้องกันการจัดการเนื้อหาที่ไม่เหมาะสม เพื่อให้มั่นใจถึงการใช้งานที่ถูกกฎหมายและมีจริยธรรม"
เราอาจมาถึงจุดที่ควรเชื่อถือเฉพาะสื่อมัลติมีเดียที่ผ่านการตรวจสอบไขว้จากแหล่งที่น่าเชื่อถือแล้วเท่านั้น
รู้สึกว่าจังหวะเวลาการเปิดตัวเครื่องมือนี้ไม่เหมาะสมอย่างมาก
"วิศวกรซอฟต์แวร์ก็แค่หวังว่าปืนจะไม่กระโดดลงจากโต๊ะไปยิงคน" 555