Context Mode - เซิร์ฟเวอร์ MCP ที่ประหยัด context window ของ AI coding agent ได้ 98%
(github.com/mksglu)- ประหยัด ข้อมูลดิบ ที่การเรียกใช้เครื่องมือ MCP เทเข้าไปใน context window และยืดระยะเวลาเซสชันจาก ~30 นาทีเป็น ~3 ชั่วโมง
- การประหยัดคอนเท็กซ์: แยก ข้อมูลดิบไว้ในแซนด์บ็อกซ์ ทำให้ลดจาก 315KB → 5.4KB หรือ ลดลง 98%
- ความต่อเนื่องของเซสชัน: บันทึกและทำดัชนีอีเวนต์ทั้งหมด เช่น การแก้ไขไฟล์ งาน git งาน task ข้อผิดพลาด และการตัดสินใจของผู้ใช้ ลงใน SQLite+FTS5 แล้วค้นหาด้วย BM25 เพื่อติดตามอีเวนต์ของเซสชันและกู้คืนจากการคอมแพกต์
- คิดด้วยโค้ด: แทนที่ LLM จะอ่านข้อมูลโดยตรง ให้เขียนสคริปต์แล้วส่งกลับมาเฉพาะผลลัพธ์ (เช่น เวลานับจำนวนฟังก์ชัน เขียนโค้ดที่เกี่ยวข้องโดยไม่ต้องเก็บคอนเท็กซ์ แล้วรับเฉพาะผลลัพธ์จริง)
- การบีบอัดเอาต์พุต: ลดโทเค็นเอาต์พุตได้ ~65-75% โดยยังคงความแม่นยำทางเทคนิค
- รองรับ 14 แพลตฟอร์ม: Claude Code (plugin marketplace), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity ฯลฯ
- รองรับระดับความต่อเนื่องของเซสชันแตกต่างกันตามระดับ hook ของแต่ละแพลตฟอร์ม (PreToolUse, PostToolUse, SessionStart, PreCompact)
- มี เครื่องมือ MCP 11 รายการ:
ctx_execute(รันไทม์ภาษา 11 ภาษา),ctx_batch_execute(รันหลายคำสั่ง+ค้นหาแบบชุด),ctx_execute_file(ประมวลผลไฟล์ในแซนด์บ็อกซ์),ctx_index/ctx_search(ทำดัชนีและค้นหาฐานความรู้ด้วย FTS5+BM25),ctx_fetch_and_index(ดึง URL มาทำดัชนีพร้อมแคช TTL 24 ชั่วโมง),ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight - ความปลอดภัย: ใช้การตั้งค่า
permissionsของ Claude Code (รูปแบบ deny/allow) กับ MCP sandbox แบบเดียวกัน และแม้เป็นคำสั่งที่ chain กันก็ตรวจแยกแต่ละคำสั่ง - รันแบบโลคัลทั้งหมด: ไม่มี telemetry, cloud sync หรือการติดตามการใช้งาน โดยฐานข้อมูล SQLite จะเก็บไว้ในโฮมไดเรกทอรี
- มีการใช้งานโดยทีมจากบริษัทชั้นนำ เช่น Microsoft, Google, Meta, Amazon, NVIDIA, Stripe, Datadog
- Elastic License 2.0 (เปิดเผยซอร์สโค้ด แต่ห้ามให้บริการแบบโฮสต์)
8 ความคิดเห็น
ผมรู้สึกได้อยู่ว่ามันต่างนะครับ ตอนนี้ใช้แค่ MCP และกำลังตัด hook ออกอยู่ครับ
ใช้ได้ไหม..
ให้ความรู้สึกเหมือนเอา Claude mem มาผสมกับ caveman เลยนะ
ช่วงนี้ดูเหมือนสินค้าหรือพรอมป์ต์แนว "ประหยัดโทเคน" กำลังเป็นกระแสนะครับ แต่จะได้ผลจริงแค่ไหนผมก็ไม่แน่ใจเหมือนกัน
ผมมองว่าการประหยัดโทเค็นกับการประหยัด context window นั้นทับซ้อนกันก็จริง แต่ไม่ใช่เรื่องเดียวกัน
การประหยัดโทเค็นเป็นเรื่องของต้นทุน ส่วนการประหยัด context window เป็นเรื่องของคุณภาพหน่วยความจำในการทำงานของโมเดล หากใส่ล็อกจำนวนมากหรือ DOM snapshot เข้าไปตรง ๆ ค่าใช้จ่ายก็จะเพิ่มขึ้น แต่ปัญหาที่ใหญ่กว่าคือโอกาสที่โมเดลจะพลาดเบาะแสสำคัญท่ามกลางสัญญาณรบกวน หรืออ้างอิงผิดพลาดก็จะสูงขึ้น
ดูแล้วการเข้าใจ context-mode ว่าเป็นเครื่องมือที่ใกล้กับแนวคิด "ควบคุมว่าจะเอาอะไรขึ้นไปไว้ในคอนเท็กซ์" มากกว่า "ใช้น้อย ๆ กันเถอะ" น่าจะถูกต้องกว่า
คุณควรแยกให้ออกระหว่างการประหยัดโทเค็นกับการประหยัดคอนเท็กซ์วินโดว์
เพราะมักถูกพูดถึงควบคู่กันบ่อย ๆ จึงสับสนกันได้ง่ายครับ
ก็จริงนะ ไม่แน่ใจว่ามันใช้งานได้จริงแค่ไหน.. ใช้อีกสักหนึ่งสองครั้งก็น่าจะกินโทเคนเพิ่มขึ้นหรือเปล่า..
จริงเหรอ?