2 คะแนน โดย rkawkancla 4 시간 전 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp
โฆษณา

ผมได้ลองสร้างเครื่องมือโอเพนซอร์สที่สามารถบันทึกการประชุมภาษาเกาหลีบนเครื่องโลคัล ถอดความ สรุป จัดระเบียบเป็น Decision Wiki และค้นหาได้ (AI แชต)

คิดว่าน่าจะเป็นประโยชน์สำหรับคนที่เหมือนผม ซึ่งด้วยสภาพแวดล้อมการทำงานแล้วไม่สามารถใช้ AI ภายนอกหรือบริการบันทึก/ถอดความการประชุมได้
ในวันที่มีประชุมมากกว่า 10 ครั้งต่อวัน แค่คอยตรวจบันทึกการประชุมและ action item ที่ออกมาจากการประชุมก็รู้ตัวอีกทีก็ต้องทำงานล่วงเวลาแล้ว
ปัญหาไม่ใช่แค่การทิ้งบันทึกการประชุมไว้ แต่คือการเก็บมันให้อยู่ในรูปแบบที่สามารถกลับมาค้นหาได้ภายหลัง

ดังนั้น แทนที่จะทำแค่ระบบถอดความการประชุมแบบธรรมดา ผมจึงกำลังทำมันโดยตั้งเป้าเป็น Decision Wiki แบบโลคัล ที่สะสมข้อสรุปและ action item จากการประชุมพร้อมหลักฐานอ้างอิงจากต้นฉบับ

  • ให้สามารถทำงานได้แม้บนเครื่องระดับ M4 16GB....

ตอนนี้ตั้งเป้าให้มีโฟลว์ประมาณนี้

  • รันแบบโลคัลบน Apple Silicon Mac
  • บันทึก/ถอดความการประชุมภาษาเกาหลี
  • แยกผู้พูด
  • ตรวจแก้/สรุปด้วย local LLM (Gemma E4B)
  • ค้นหาการประชุมด้วย ChromaDB + SQLite FTS5
  • จัดระเบียบข้อสรุปและ action item เป็น Markdown Wiki
  • ตรวจสอบหลักฐาน timestamp ของต้นฉบับจากรายการใน Wiki
  • ค้นหา/แชตโดยอิงจากต้นฉบับการประชุมและ Wiki

ทุกขั้นตอนถูกออกแบบให้ประมวลผลบนเครื่องโลคัลเป็นหลัก โดยให้ความสำคัญกับสภาพแวดล้อมที่ส่งข้อมูลการประชุมไปยัง external API ได้ยาก หรือไม่สามารถนำเนื้อหาการหารือภายในองค์กรขึ้นบริการภายนอกได้

ตอนนี้ยังเป็นเบต้าในช่วงเริ่มต้น และรองรับเฉพาะ Apple Silicon Mac เท่านั้น (สภาพแวดล้อมอื่นทดสอบได้ยาก...)

เนื่องจากต้องใช้โมเดลหลายตัว ขั้นตอนการติดตั้งจึงยังไม่ถึงกับเบามากนัก
หากจะใช้โมเดลแยกผู้พูดของ pyannote จำเป็นต้องยอมรับ gated model ของ HuggingFace และตั้งค่าโทเคน อีกทั้งเพราะใช้โมเดลแบบโลคัล จึงมีข้อกำหนดด้านฮาร์ดแวร์ด้วย

ถึงอย่างนั้น ผมก็เปิดเผยโครงการนี้เพราะคิดว่าน่าจะมีประโยชน์สำหรับคนที่เหมือนผม คือมีประชุมเยอะ ใช้เวลามากในการจัดการข้อสรุปการตัดสินใจในแต่ละครั้ง และทำงานอยู่ในสภาพแวดล้อมที่เชื่อมต่อ AI ภายนอกได้ยาก

หากมีข้อเสนอแนะ หรือเคยเจอปัญหาคล้ายกัน ก็จะขอบคุณมากครับ

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น