1. แนะนำตัว

สวัสดีครับ/ค่ะ
ผม/ฉันเป็นนักพัฒนาเดี่ยวคนเดียวกับที่เคยแนะนำ eBook reader (Folio) ไปครั้งก่อน

เวลาตัดต่อวิดีโอ บางครั้งก็อยากลบพื้นหลังโดยไม่ต้องใช้ chroma key
หรืออยากแยกเฉพาะเสียงร้อง หรือเฉพาะเครื่องดนตรีบางชิ้นออกจากเพลง
ผม/ฉันเลยลงมือทำเครื่องมือนี้ขึ้นมาเองด้วยแนวคิดว่า ให้เครื่องมือเดียวจัดการได้ทั้งการลบพื้นหลังและการแยกเสียง


2. สรุปบริการในหนึ่งบรรทัด

AlphaClip เป็นแอปเดสก์ท็อปที่ใช้ AI ลบพื้นหลังจากวิดีโอโดยอัตโนมัติ และแยกเสียงออกเป็นแต่ละแทร็กได้ (เช่น vocal, drum, bass, guitar เป็นต้น)


3. แนะนำบริการ

AlphaClip (Habom) เป็นเครื่องมือ AI ที่เน้นงาน post-processing ของวิดีโอ

  • ลบพื้นหลังจากวิดีโออัตโนมัติด้วย AI (แนะนำพื้นหลังสีขาวหรือสีดำ)
  • แยกเสียงออกเป็นแต่ละแทร็ก (vocal, drum, bass, guitar เป็นต้น)
  • ลบพื้นหลังได้อย่างสะอาดโดยไม่ต้องมีอุปกรณ์ chroma key
  • ทำงานแบบอัตโนมัติให้ใช้ง่ายกว่าฟีเจอร์ลบพื้นหลังของ After Effects

สามารถนำไปใช้กับการทำวิดีโอตัวละคร การตัดต่อเพลง และงาน post-processing ของวิดีโอได้


4. ฟีเจอร์หลัก

🎬 ลบพื้นหลังวิดีโอ

  • ลบพื้นหลังอัตโนมัติด้วย AI
  • แยกเฉพาะตัวแบบออกมาได้โดยไม่ต้องใช้ chroma key
  • รองรับการเร่งความเร็วด้วย GPU (CUDA) เพื่อเพิ่มความเร็วในการประมวลผล

🎵 แยกเสียง

  • แยกเป็นแต่ละแทร็ก เช่น vocal / drum / bass / guitar
  • สามารถแยกเฉพาะเครื่องดนตรีที่ต้องการออกจากเพลงได้

🎞️ สร้างวิดีโอตัวละคร

  • สร้างวิดีโอตัวละครขั้นสุดท้ายด้วย AI

5. เทคโนโลยีที่ใช้

  • Python (พัฒนาด้วยแนวทาง vibe coding)
  • CUDA (การเร่งความเร็วด้วย GPU)
  • AI model (ลบพื้นหลัง / แยกเสียง)

6. ความยากระหว่างการพัฒนา

  • การปรับแต่งการใช้งาน GPU ผ่านการตั้งค่า CUDA ให้เหมาะสมที่สุด
  • การบาลานซ์ระหว่างคุณภาพการลบพื้นหลังและความเร็วในการประมวลผล
  • การรับมือกับข้อผิดพลาดที่ยังคงเหลืออยู่ เนื่องจากนี่เป็นการพัฒนาในสัปดาห์แรกของ vibe coding

7. สถานะปัจจุบัน

  • กำลังพัฒนาด้วย vibe coding มาได้ราว 1 สัปดาห์
  • ตอนนี้เน้นไปที่การทำฟังก์ชันหลักให้เสร็จ โดยยังมีบั๊กบางส่วนหลงเหลืออยู่
  • มีแผนเปิดให้ใช้ฟรีไปก่อนในช่วงนี้ พร้อมปรับปรุงต่อเนื่อง
  • ในอนาคตมีแผนจะนำไปใช้สร้างตัวละครแอนิเมชันและฉากหลัง (78 ใบ) สำหรับแอปไพ่ทาโรต์
  • เป้าหมายสุดท้ายคือการรวบรวมโปรเจ็กต์เล็ก ๆ เหล่านี้ให้กลายเป็น automation pipeline เดียว

ช่วงนี้มีงานที่กำลังเดินอยู่พร้อมกัน 2–4 อย่าง เลยรู้สึกว่าน่าจะต้องเลือกและโฟกัสให้มากขึ้นนิดหน่อย!
สรุปแบบสั้น ๆ คือ

  1. RVC พูดง่าย ๆ คือใช้การฝึก/อนุมานแบบ speech-to-speech เพื่อเปลี่ยนเสียงตัวละคร
  2. หน้า market ด้านล่างนี้ก็ใช้เวลาทำราว 1 เดือนจนรองรับการชำระเงินเสร็จแล้ว แต่ก็ยังมีแผนปรับปรุงต่อเนื่อง
  3. เครื่องมือจัดการการแจ้งเตือนของแอป (APNs/FCM) และเครื่องมือวิเคราะห์ funnel (ลักษณะเดียวกับ Google Analytics)

ยังมีอย่างอื่นอีก แต่ถึงจะใช้เวลา ผม/ฉันจะค่อย ๆ ทยอยแนะนำทีละอย่างนะครับ/คะ!!


8. อยากได้อะไรบ้าง?

  • ฟีดแบ็กจากผู้ใช้จริง (ยินดีรับรายงานข้อผิดพลาดมาก ๆ!! ส่งมาได้เสมอไม่ว่าจะเป็นวิดีโอหรือ SNS!)
  • ความเห็นเกี่ยวกับ workflow การตัดต่อวิดีโอ

ถ้ามีจุดที่ยังไม่ดีหรือมีไอเดียในการปรับปรุง ก็พูดคุยกันได้สบาย ๆ เลยครับ/ค่ะ!
หวังว่าจะเพลิดเพลินกับวิดีโอนะครับ/คะ!


ผม/ฉันได้ลองใช้โปรแกรมนี้ทำวิดีโอด้านล่างด้วย ลองรับชมกันเพลิน ๆ (?) ได้เลย :)

Demo วิดีโอ

https://www.youtube.com/watch?v=lZhiMreW94Q

  • ในวิดีโอยังมีเครื่องมือมอนิเตอร์ cpu/gpu ที่ผม/ฉันเอาไปลงไว้ใน market ด้วยนะ!!
    (alphaclip Habom tools ตอนกำลังทำอยู่ แล้วแวะพัก(?) เลยทำขึ้นมาใน 30 นาทีถึง 1 ชั่วโมง!!)

⬇️ ลิงก์ดาวน์โหลด
📥 ดาวน์โหลด: https://market.habom.kr

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น