วิธีใช้งาน ElevenLabs Realtime Speech to Text ที่เพิ่งออกมาอย่างรวดเร็ว
ผมทำเฉพาะฟีเจอร์ถอดเสียงให้ง่ายที่สุดเท่าที่จะทำได้ 🙏
- git clone https://github.com/lee-lou2/ai-note.git
- เข้าไปที่ https://elevenlabs.io/app/developers/api-keys แล้วเข้าถึง 'Speech to Text' เพื่อออก API key
- ในหน้าโปรเจ็กต์ที่ clone มา ให้คัดลอก
.env.sampleเพื่อสร้างไฟล์.env - ลงทะเบียน ElevenLabs API Key ที่สร้างไว้ใน
ELEVENLABS_API_KEYและใส่ข้อมูลบัญชีที่จะใช้ตอนเข้าหน้าเว็บในBASIC_AUTH_USERNAME,BASIC_AUTH_PASSWORD - ติดตั้งแพ็กเกจ:
pip install -r requirements.txt - รัน:
uvicorn main:app --reload --port 8000
จากนั้นเมื่อเข้าไปที่ http://localhost:8000 ก็สามารถใช้งานได้ทันที
ต้องบอกว่า ElevenLabs Realtime Speech to Text v2 ทั้งเร็วและแม่นยำมาก
ตอนนี้ผู้ใช้ฟรีก็ใช้งานได้เช่นกัน (ภายหลังอาจมีการเปลี่ยนนโยบายราคาโดย ElevenLabs)
GitHub repo นี้มีแผนอัปเดตต่อเนื่อง
- (แผน) ฟีเจอร์ให้ผู้ใช้หลายคนเข้ามาพร้อมกันและอัปเดตเอกสารเดียวกัน
- (แผน) ฟีเจอร์สรุปเนื้อหาที่ถอดเสียงแล้ว
- (แผน) ฟีเจอร์สรุปร่วมกับเอกสารที่พิมพ์ไว้
ยังไม่มีความคิดเห็น