วิธีใช้งาน ElevenLabs Realtime Speech to Text ที่เพิ่งออกมาอย่างรวดเร็ว

ผมทำเฉพาะฟีเจอร์ถอดเสียงให้ง่ายที่สุดเท่าที่จะทำได้ 🙏

  1. git clone https://github.com/lee-lou2/ai-note.git
  2. เข้าไปที่ https://elevenlabs.io/app/developers/api-keys แล้วเข้าถึง 'Speech to Text' เพื่อออก API key
  3. ในหน้าโปรเจ็กต์ที่ clone มา ให้คัดลอก .env.sample เพื่อสร้างไฟล์ .env
  4. ลงทะเบียน ElevenLabs API Key ที่สร้างไว้ใน ELEVENLABS_API_KEY และใส่ข้อมูลบัญชีที่จะใช้ตอนเข้าหน้าเว็บใน BASIC_AUTH_USERNAME, BASIC_AUTH_PASSWORD
  5. ติดตั้งแพ็กเกจ: pip install -r requirements.txt
  6. รัน: uvicorn main:app --reload --port 8000

จากนั้นเมื่อเข้าไปที่ http://localhost:8000 ก็สามารถใช้งานได้ทันที

ต้องบอกว่า ElevenLabs Realtime Speech to Text v2 ทั้งเร็วและแม่นยำมาก
ตอนนี้ผู้ใช้ฟรีก็ใช้งานได้เช่นกัน (ภายหลังอาจมีการเปลี่ยนนโยบายราคาโดย ElevenLabs)

GitHub repo นี้มีแผนอัปเดตต่อเนื่อง

  • (แผน) ฟีเจอร์ให้ผู้ใช้หลายคนเข้ามาพร้อมกันและอัปเดตเอกสารเดียวกัน
  • (แผน) ฟีเจอร์สรุปเนื้อหาที่ถอดเสียงแล้ว
  • (แผน) ฟีเจอร์สรุปร่วมกับเอกสารที่พิมพ์ไว้

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น