3 คะแนน โดย GN⁺ 2023-12-25 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Storyteller: แพลตฟอร์มซิงก์อัตโนมัติสำหรับหนังสือเสียงและอีบุ๊ก

  • Storyteller เป็นแพลตฟอร์มแบบโฮสต์เองได้สำหรับซิงก์หนังสือเสียงและอีบุ๊กโดยอัตโนมัติ
  • แพลตฟอร์มนี้สร้างไฟล์อีบุ๊กที่สอดคล้องกับมาตรฐาน EPUB 3 ทำให้สามารถอ่านได้ด้วยเครื่องอ่านอีบุ๊กทุกชนิด (ทั้งซอฟต์แวร์และฮาร์ดแวร์) ที่รองรับ EPUB media overlay หรือใช้งานผ่านแอปมือถือ Storyteller โดยเฉพาะก็ได้
  • Storyteller เป็นระบบที่โฮสต์เองทั้งหมด และหนังสือทุกเล่มจะถูกเก็บไว้บนฮาร์ดแวร์ของผู้ใช้ จึงสามารถย้าย คัดลอก และสำรองข้อมูลได้อย่างอิสระตามต้องการ

ความเห็นของ GN⁺

  • Storyteller มีความสำคัญเพราะมอบแพลตฟอร์มที่ช่วยให้ซิงก์หนังสือเสียงและอีบุ๊กได้อย่างง่ายดาย เพื่อยกระดับประสบการณ์การอ่านของผู้ใช้
  • ความสามารถในการโฮสต์เอง ซึ่งทำให้ผู้ใช้ควบคุมข้อมูลของตนได้อย่างสมบูรณ์ สอดคล้องกับความกังวลสมัยใหม่ด้านความเป็นส่วนตัวและความเป็นเจ้าของข้อมูล
  • การสอดคล้องกับมาตรฐาน EPUB 3 ช่วยเพิ่มความเข้ากันได้และการเข้าถึง โดยทำให้ผู้ใช้อ่านหนังสือได้บนอุปกรณ์และซอฟต์แวร์ที่หลากหลาย

1 ความคิดเห็น

 
GN⁺ 2023-12-25
ความคิดเห็นบน Hacker News
  • เคยมีประสบการณ์สร้างเครื่องมือจัดแนวอีบุ๊ก-หนังสือเสียงที่คล้ายกันมาก่อน ตอนนั้นตัดสินใจว่าวิธีจัดแนวข้อความ (รวมถึงการใช้แมชชีนเลิร์นนิง) ใช้การคำนวณสูงและไม่เหมาะกับข้อความยาว จึงเลือกวิธีสังเคราะห์ข้อความแล้วจัดแนวลำดับเสียงสองชุด ดูเหมือนว่า Storyteller จะทำงานด้วยการจัดแนวข้อความ เลยสงสัยว่าต้องใช้เวลานานแค่ไหนในการซิงก์หนังสือ นอกจากนี้ยังมีกรณีที่เวอร์ชันเสียงกับข้อความต่างกันมากอยู่บ่อย ๆ (เช่น เสียงมีอินโทรที่ไม่มีในข้อความ) อยากรู้ว่า Storyteller จัดการกรณีแบบนี้อย่างไร ต้องแก้ไขเสียง/ข้อความด้วยตนเองหรือสามารถจัดการความต่างได้อัตโนมัติ

    • เคยสร้างเครื่องมือจัดแนวหนังสือเสียงกับอีบุ๊กแบบคล้ายกันมาก่อน และสงสัยว่า Storyteller ใช้เวลานานแค่ไหนในการซิงก์ด้วยการจัดแนวข้อความ รวมถึงจัดการความต่างระหว่างเสียงกับข้อความอย่างไร
  • ชอบโปรเจ็กต์นี้มาก แต่ภรรยาและลูก ๆ อ่าน EPUB บนเครื่องอ่านอีบุ๊ก Kobo เลยอยากให้ซิงก์หน้าที่อ่านล่าสุดจาก Kobo กับ Storyteller ได้ เพื่อจะได้ไปฟังต่อในหนังสือเสียงทีหลังได้ ถ้าจำเป็นก็ไม่ได้คัดค้านที่จะติดตั้ง koreader บน Kobo ด้วย koreader ยังไม่รองรับ epub3 media overlay แต่มีฟังก์ชันซิงก์อยู่

    • ต้องการฟังก์ชันซิงก์หน้าที่อ่านล่าสุดกับ Storyteller สำหรับครอบครัวที่ใช้เครื่องอ่านอีบุ๊ก Kobo และกำลังพิจารณาติดตั้ง koreader เพื่อสิ่งนี้
  • โปรเจ็กต์นี้กำลังได้รับความนิยมมากจริง ๆ! ขอบคุณทุกคนที่เข้ามาถามคำถามและให้ข้อเสนอแนะที่นี่ หากมีใครสละเวลามาลองตั้งค่านี้ ขอเชิญเข้ามาทักทายในช่อง Gitter ขอความช่วยเหลือ หรือส่งข้อเสนอแนะได้

    • ขอบคุณสำหรับความสนใจและข้อเสนอแนะเกี่ยวกับโปรเจ็กต์ และแจ้งว่าผู้ใช้สามารถขอความช่วยเหลือหรือส่งความเห็นผ่านช่อง Gitter ได้
  • ไอเดียนี้เจ๋งมาก ผมฟังหนังสือเสียงตอนเดินทางไปกลับที่ทำงาน และอ่านตอนกลางคืน ตอนนี้ใช้ audiobookshelf เพื่อฟังอีบุ๊กอยู่ เลยไปคอมเมนต์เพิ่มในประเด็นที่คุยกันว่า audiobookshelf จะอ่าน EPUB ได้หรือไม่

    • ในฐานะผู้ใช้ที่ฟังหนังสือเสียงตอนเดินทางและอ่านตอนกลางคืน กำลังใช้ audiobookshelf และสนใจว่าบริการนี้จะรองรับ EPUB ได้หรือไม่
  • สงสัยว่าใช้กับเครื่องอ่านอีบุ๊ก e-ink ได้ไหม อยากออกห่างจาก Amazon แต่ก็ไม่อยากกลับไปอ่านบนหน้าจอ

    • สงสัยเรื่องความเข้ากันได้กับเครื่องอ่านอีบุ๊ก e-ink และกำลังมองหาทางเลือกแทน Amazon
  • อยากได้ข้อมูลเกี่ยวกับโปรเจ็กต์นี้มากกว่านี้ น่าจะมีลิงก์แอป iOS หรือภาพหน้าจอ หรือข้อมูลเกี่ยวกับความสามารถของโปรเจ็กต์บ้าง อยากรู้ว่านี่เป็นคลังอีบุ๊ก/หนังสือเสียงแบบ audiobookshelf หรือมีแค่ฟังก์ชันซิงก์อย่างเดียว

    • ต้องการข้อมูลเพิ่มเติมเกี่ยวกับโปรเจ็กต์ โดยเฉพาะรายละเอียดเรื่องแอป iOS ภาพหน้าจอ และความสามารถต่าง ๆ
  • โปรเจ็กต์นี้เจ๋งมาก ถ้ามีฟังก์ชันสร้างเสียงด้วย AI เพิ่มเข้ามาจะยิ่งเจ๋งกว่าเดิมอีก ผมยกเลิก Audible ไปหลายครั้งแล้ว เพราะหนังสือเสียงคุณภาพสูงมีน้อยมาก และแม้แต่หนังสือเสียงที่ผู้เขียนอ่านเองก็ยังแย่ (ส่วนใหญ่ไม่ใช่นักพากย์มืออาชีพ) AI ที่ดีน่าจะน่าทึ่งมาก เพราะสามารถพูดต่อเนื่องได้หลายชั่วโมงโดยไม่เหนื่อย และยังคงพลัง น้ำเสียง และความเร็วได้สม่ำเสมอ

    • มองว่าการเพิ่มฟังก์ชันสร้างเสียงด้วย AI จะทำให้โปรเจ็กต์น่าสนใจยิ่งขึ้น และชี้ถึงศักยภาพของ AI ในการแก้ปัญหาหนังสือเสียงคุณภาพสูงที่มีอยู่น้อย
  • โปรเจ็กต์นี้น่าสนใจ เคยทำโปรเจ็กต์คล้ายกันมาก่อน โดยซิงก์เนื้อหาหนังสือกับไทม์สแตมป์ แล้วแยกคำพูดออกเป็นประโยคเพื่อสร้างชุดข้อมูล LJSPEECH ใช้ aeneas ซึ่งตั้งค่ายุ่งยากนิดหน่อย แต่ก็แมปภาษาที่ไม่ใช่อังกฤษอย่างเยอรมันได้แม่นยำเกิน 80% ชุดข้อมูล LJSPEECH นั้นดี แต่ตอนนั้นเทคโนโลยี TTS ยังไม่พร้อม อาจถึงเวลารื้อโปรเจ็กต์นี้ขึ้นมาใหม่โดยใช้แนวทางการสร้างโมเดลแบบใหม่อย่าง XTTS แล้วก็ได้

    • เคยทำโปรเจ็กต์ที่รวมหนังสือเสียงกับอีบุ๊กเพื่อสังเคราะห์เสียงของผู้บรรยายที่ชอบและ “ตีพิมพ์” หนังสือที่ไม่เคยออกเป็นหนังสือเสียงมาก่อน และกำลังพิจารณาว่าจะกลับมาทำต่อโดยใช้เทคโนโลยี TTS รุ่นใหม่ได้หรือไม่
  • ไม่ได้ใส่ลิงก์ไว้: Storyteller. โดยรวมแล้วเป็นโปรเจ็กต์ที่เจ๋งมาก และก้าวถัดไปคือการสร้างระบบจัดการอีบุ๊กที่ซิงก์แล้ว

    • แชร์ลิงก์ไปยังโปรเจ็กต์ Storyteller และเสนอว่าก้าวต่อไปควรเป็นการสร้างระบบจัดการอีบุ๊กที่ซิงก์แล้ว
  • ขอบคุณที่แชร์ฟีเจอร์นี้มาให้ WhisperSync เป็นตัวเปลี่ยนเกมจริง ๆ เพราะทำให้สลับโหมดได้หลายครั้งต่อวันและอ่านได้มากขึ้นมาก หวังว่าฟีเจอร์แบบนี้จะไม่ถูกจำกัดอยู่แค่บนแพลตฟอร์มปิดและมี DRM อย่าง Amazon/Audible แต่จะถูกใช้อย่างแพร่หลาย

    • ชื่นชมฟีเจอร์ WhisperSync และหวังว่าฟีเจอร์ลักษณะนี้จะถูกใช้อย่างกว้างขวาง ไม่ได้จำกัดอยู่แค่แพลตฟอร์มปิดอย่าง Amazon หรือ Audible