โปรเจกต์โอเพนซอร์สที่เปลี่ยนเสียงจากปากให้เป็น Sound effect (New UX for sound generation)

(github.com/thxxx)

13 คะแนน โดย khj6051 6 일 전 | 11 ความคิดเห็น | แชร์ทาง WhatsApp

สวัสดีครับ ผมได้สร้างโมเดลตัวหนึ่งขึ้นมาและเปิดเป็นโอเพนซอร์ส เลยอยากนำมาแชร์ครับ

เคยมีไหมครับที่ตอนทำวิดีโอหรือเกมแล้วต้องการเสียงบางอย่างโดยเฉพาะ?

ในหัวเรารู้ชัดเจนว่าเป็นเสียงแบบไหน แต่คงไม่มีวิธีว่าจะอธิบายและค้นหามันอย่างไรใช่ไหมครับ

ด้วยเหตุนี้ ถ้าได้เข้าไปฟังการประชุมเกี่ยวกับเสียงของสตูดิโอเกม ก็มักจะได้ยินเสียงแบบนี้มากกว่าบทสนทนาเสียอีก

“ฟิ้วฟิ้ว- มากกว่า น่าจะเป็น ฟิยู↘︎ฟิยู↘︎ มากกว่านะ”

ดังนั้นผมเลยสร้างมันขึ้นมาครับ!

โมเดลที่ผมสร้างคือโมเดลที่ให้คุณลองเปล่งเสียงที่ต้องการด้วยปาก แล้วนำเสียงนั้นพร้อมกับข้อความใส่เข้าไปเป็น input ให้กับโมเดล จากนั้นมันจะสร้าง sound effect นั้นออกมาให้ครับ (ใช้เวลาและข้อมูลไปค่อนข้างมาก)

repo: https://github.com/thxxx/VTS
demo: https://spicy-pufferfish-699.notion.site/VTS-347cf95761f480f19dc0eb790…

(ถ้าเข้าไปฟังในลิงก์ demo จะเข้าใจได้ชัดขึ้นมากว่าหมายถึงอะไรครับ ฮ่าๆ)

11 ความคิดเห็น

humblebee 1 일 전

เป็นโปรเจกต์ที่ยอดเยี่ยมจริงๆ!
"จะอธิบายสิ่งที่ฉันต้องการให้ AI agent เข้าใจได้อย่างง่ายดายอย่างไร"
ผมคิดว่านี่เป็นประเด็นที่สำคัญมากในช่วงนี้ และเป็นพื้นที่ที่ต้องขบคิดกันอีกมาก

เหมือนอย่างที่เราเฝ้าดูการพัฒนาของวงการ UI/UX สำหรับบริการไอที ประสบการณ์ผู้ใช้ต่อ AI ก็กำลังก่อตัวสะสมขึ้นเช่นกัน และผมคาดหวังว่าจะมีการพูดคุยกันมากขึ้นว่าอะไรใช้ได้ผลและอะไรสำคัญ

illiil1lii 1 일 전

ดูเหมือนว่าจะเหมาะสำหรับนำไปใช้กับงาน SFX ในภาพยนตร์นะ

bichi 1 일 전

แต่ในเดโม เสียงที่ทำด้วยปากกลับเท่กว่าในฐานะเอฟเฟกต์เสียงเสียอีกนะ

khj6051 1 일 전

พอทดสอบบ่อย ๆ เข้าก็ชำนาญแล้วนะครับ

solvewithit 1 일 전

อันนี้สนุกจริง ๆ เลย 5555

khj6051 1 일 전

ขอบคุณครับ ฮ่าๆ

dukes123 2 일 전

น่าสนใจจังครับ ไม่ทราบว่านอกจากเสียงพูดแล้ว ถ้าเป็นเสียงประมาณพวกโปเกมอน? R2D2? อะไรแบบนี้ก็ทำได้ไหมครับ?

khj6051 2 일 전

ใช่ครับ ตัวโมเดลไม่ได้ฝึกด้วยเสียงพูดโดยตรง เลยคิดว่าน่าจะทำ Sound to Sound ได้ทุกรูปแบบนะครับ แต่ก็ยังไม่เคยลองทดสอบด้วยเสียงโปเกมอนเหมือนกันครับ 555

dukes123 1 일 전

โอ้ ถ้าอย่างนั้น LLM ก็อาจสร้างอะไรคล้ายสูตรขึ้นมาเพื่อควบคุมระดับหนักเบาแล้วสร้างเสียงอิเล็กทรอนิกส์ จากนั้นใส่เป็นอินพุตพร้อมกับข้อความเพื่อให้ได้ sound effect ออกมา ก็น่าจะทำให้สร้างเอฟเฟกต์เสียงที่เข้ากับสถานการณ์ในตอนนั้นได้เลย เท่มากเลยครับ

m00nlygreat 5 일 전

อันนี้สนุกดีนะ 555555

khj6051 3 일 전

ขอบคุณครับ 555

โปรเจกต์โอเพนซอร์สที่เปลี่ยนเสียงจากปากให้เป็น Sound effect (New UX for sound generation)

บทความที่เกี่ยวข้อง

11 ความคิดเห็น