โมเดลเสียงของ OpenAI
(openai.fm)- เดโมแบบอินเทอร์แอกทีฟที่ให้นักพัฒนาลองใช้โมเดลแปลงข้อความเป็นเสียงพูดรุ่นใหม่ของ OpenAI API ได้
- สามารถระบุเอฟเฟกต์เสียง โทน ความเร็ว อารมณ์ การออกเสียง การเว้นจังหวะ ฯลฯ ได้อย่างละเอียดผ่านพรอมป์ต์
เดโม
- เลือกเสียง: Alloy, Ash, Ballad, Coral, Echo และอื่น ๆ รวม 11 แบบ
- เลือก Vibe ได้หลากหลาย: Sincere, Friendly, Noir Detective, Robot, Auctioneer ฯลฯ
- ตัวอย่าง: Sincere
Voice Affect: Calm, composed, and reassuring. Competent and in control, instilling trust. Tone: Sincere, empathetic, with genuine concern for the customer and understanding of the situation. Pacing: Slower during the apology to allow for clarity and processing. Faster when offering solutions to signal action and resolution. Emotions: Calm reassurance, empathy, and gratitude. Pronunciation: Clear, precise: Ensures clarity, especially with key details. Focus on key words like "refund" and "patience." Pauses: Before and after the apology to give space for processing the apology. - ตัวอย่าง: Medieval Knight
เอฟเฟกต์เสียง: ทุ้ม ลักษณะสั่งการ และดราม่าเล็กน้อย สะท้อนความยิ่งใหญ่ของเรื่องเล่าภาษาอังกฤษโบราณ โทน: สูงศักดิ์ กล้าหาญ และเป็นทางการ จับแก่นของอัศวินยุคกลางและการผจญภัยแบบมหากาพย์ อารมณ์: ผสานความตื่นเต้น ความคาดหวัง ความลึกลับ และความเคร่งขรึมของโชคชะตากับหน้าที่ การออกเสียง: ชัดเจน รอบคอบ และมีจังหวะที่ค่อนข้างเป็นทางการ โดยเน้นคำอย่าง "hast", "thou", "doth" อย่างช้า ๆ เพื่อสะท้อนรูปแบบการออกเสียงภาษาอังกฤษโบราณ การเว้นจังหวะ: เว้นหลังวลีภาษาอังกฤษโบราณอย่าง "Lo!", "Hark!" และเว้นระหว่างวลีอย่าง "Choose thy path" เพื่อเน้นความสำคัญของการตัดสินใจ และเปิดโอกาสให้ผู้ฟังซึมซับความจริงจังของภารกิจ
2 ความคิดเห็น
ความเห็นจาก Hacker News
ราคาของโมเดลเหล่านี้ถูกกว่า ElevenLabs อย่างมาก
Jeff จาก OpenAI แจ้งว่าได้เปิดตัวโมเดลเสียงใหม่แล้ว
มีการกล่าวถึงปัญหาความน่าเชื่อถือของโมเดลแปลงข้อความเป็นเสียงและแปลงเสียงเป็นข้อความ
มีคำถามว่าจะได้ "speech marks" พร้อมกับเสียงที่สร้างขึ้นมาได้อย่างไร
ความก้าวหน้าล่าสุดของโมเดลแปลงข้อความเป็นเสียงและเสียงเป็นข้อความขนาดใหญ่
สามารถสร้างน้ำเสียงและบุคลิกที่หลากหลายได้ตามข้อความที่ใส่ในช่อง "vibe"
ปฏิกิริยาเมื่อป้อน Navy Seal copypasta
รู้สึกว่าเสียงของโมเดลใหม่มีอาการสั่นเล็กน้อย จึงด้อยกว่า Siri
เครื่องมือทางการของ OpenAI เชื่อมโยงกับการประกาศโมเดลใหม่
คำพูดสำคัญจากประกาศอย่างเป็นทางการ
ภาษาเกาหลีก็ใช้งานได้อย่างสมบูรณ์แบบเหมือนกันนะครับ