MCP YouTube Intelligence — เซิร์ฟเวอร์ MCP สำหรับวิเคราะห์วิดีโอ YouTube อย่างมีประสิทธิภาพด้านโทเค็น
(github.com/JangHyuckYun)เป็นเซิร์ฟเวอร์ MCP ที่ประมวลผลคำบรรยาย YouTube บนเซิร์ฟเวอร์ (สรุป/เอนทิตี/หัวข้อ/วิเคราะห์อารมณ์) เพื่อส่งต่อให้ไคลเอนต์ LLM เฉพาะผลลัพธ์ที่ถูกบีบอัดแล้วเท่านั้น
เหตุผลที่ทำขึ้นมา:
ผมลองสำรวจเซิร์ฟเวอร์ YouTube MCP ที่มีอยู่ราว 80 ตัว พบว่าทั้งหมดโยนคำบรรยายต้นฉบับ
เข้าไปให้ LLM ตรง ๆ แบบนั้นเลย วิดีโอ 20 นาทีหนึ่งรายการใช้โทเค็นประมาณ ~15,000 โทเค็น
แต่ตัวนี้ลดให้เหลือสรุปราว ~200-500 โทเค็น และแม้แต่รายงานฉบับเต็มก็อยู่ที่ ~3,000 โทเค็น
ผมตั้งใจให้ใช้กับ Claude skills จึงทำให้ใช้งานผ่าน CLI ได้ด้วย
ฟีเจอร์หลัก:
- รายงานแบบมีโครงสร้าง (สรุป + หัวข้อ + เอนทิตี + ความคิดเห็นในครั้งเดียว)
- 9 MCP tool + CLI (mcp-yt)
- สรุปด้วย LLM ฟรีผ่านการเชื่อมต่อ Ollama/vLLM
- มอนิเตอร์ RSS ของช่อง
- พจนานุกรมเอนทิตีภาษาเกาหลี/อังกฤษกว่า 200 รายการ
- แคช SQLite
pip install mcp-youtube-intelligence
เชื่อมต่อได้ทันทีใน Claude Desktop, Cursor และ Claude Code
GitHub: https://github.com/JangHyuckYun/mcp-youtube-intelligence
PyPI: https://pypi.org/project/mcp-youtube-intelligence/
4 ความคิดเห็น
ดูเหมือนว่าน่าจะมี trade-off เกิดขึ้นจากการลดจำนวนโทเค็นลงอย่างชัดเจน แต่ผมหาข้อมูลเกี่ยวกับส่วนนั้นใน README ไม่เจอครับ!
ช่วงนี้ context พื้นฐานก็ 200k กันแล้ว เลยสงสัยเรื่องคุณภาพที่ลดลงจากการสูญเสียระหว่างการบีบอัดครับ
สวัสดีครับ!
สรุปแบบดึงประโยคสำคัญออกมา (ไม่ใช้ LLM) ถ้าเทียบกับต้นฉบับแล้วโดยความรู้สึกจะอยู่ราว ๆ 6/10 ครับ มันช่วยดึงประโยคหลัก ๆ ออกมาได้ แต่การเชื่อมโยงบริบทยังค่อนข้างอ่อนครับ
ส่วนการสรุปด้วย LLM (เช่น Ollama) จะดีกว่ามาก และพอทดสอบกับวิดีโอแนะนำหรือวิดีโอเกี่ยวกับการพัฒนาหลายตัวแล้ว ก็ดูว่าเพียงพอต่อการทำความเข้าใจเนื้อหาครับ แต่รายละเอียดตัวเลขหรือความแตกต่างของน้ำเสียงเล็ก ๆ น้อย ๆ อาจหายไปได้ครับ
ถ้าเป็นคอนเท็กซ์ 200k สำหรับวิดีโอเดี่ยว หรือวิดีโอที่ค่อนข้างสั้นอย่าง 30 นาทีถึง 1 ชั่วโมง การใช้ต้นฉบับจะดีกว่าครับ
แต่ถ้าต้องประมวลผลวิดีโอจำนวนมากระดับหลายร้อยรายการ หรือวิเคราะห์ซ้ำ ๆ ก็คิดว่าน่าจะใช้โทเคนน้อยกว่าและดึงเฉพาะสาระสำคัญออกมาได้ครับ
(เช่น วิเคราะห์ทั้งช่องของคู่แข่ง, วิเคราะห์วิดีโอของยูทูบเบอร์สายเศรษฐกิจ 100 คลิป เป็นต้น)
เดี๋ยวผมจะลองทดสอบกับวิดีโอที่หลากหลายกว่านี้ใน README และจะเพิ่มผล benchmark กับ trade-off ให้ชัดเจนขึ้นอีกหน่อยครับ!
ขอบคุณมากสำหรับคำตอบที่ใส่ใจมาก ๆ ครับ/ค่ะ!! หวังว่าโปรเจกต์จะประสบความสำเร็จนะครับ/คะ!!
อิอิ ครับ ขอบคุณครับ!