Context Mode - เซิร์ฟเวอร์ MCP ที่ประหยัด context window ของ AI coding agent ได้ 98%

xguru · 2026-05-03T09:31:02+09:00

ประหยัด ข้อมูลดิบ ที่การเรียกใช้เครื่องมือ MCP เทเข้าไปใน context window และยืดระยะเวลาเซสชันจาก ~30 นาทีเป็น ~3 ชั่วโมง การประหยัดคอนเท็กซ์: แยก ข้อมูลดิบไว้ในแซนด์บ็อกซ์ ทำให้ลดจาก 315KB → 5.4KB หรือ ลดลง 98% ความต่อเนื่องของเซสชัน: บันทึกและทำดัชนีอีเวนต์ทั้งหมด เช่น การแก้ไขไฟล์ งาน git งาน task ข้อผิดพลาด และการตัดสินใจของผู้ใช้ ลงใน SQLite+FTS5 แล้วค้นหาด้วย BM25 เพื่อติดตามอีเวนต์ของเซสชันและกู้คืนจากการคอมแพกต์ คิดด้วยโค้ด: แทนที่ LLM จะอ่านข้อมูลโดยตรง ให้เขียนสคริปต์แล้วส่งกลับมาเฉพาะผลลัพธ์ (เช่น เวลานับจำนวนฟังก์ชัน เขียนโค้ดที่เกี่ยวข้องโดยไม่ต้องเก็บคอนเท็กซ์ แล้วรับเฉพาะผลลัพธ์จริง) การบีบอัดเอาต์พุต: ลดโทเค็นเอาต์พุตได้ ~65-75% โดยยังคงความแม่นยำทางเทคนิค รองรับ 14 แพลตฟอร์ม: Claude Code (plugin marketplace), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity ฯลฯ รองรับระดับความต่อเนื่องของเซสชันแตกต่างกันตามระดับ hook ของแต่ละแพลตฟอร์ม (PreToolUse, PostToolUse, SessionStart, PreCompact) มี เครื่องมือ MCP 11 รายการ: ctx_execute (รันไทม์ภาษา 11 ภาษา), ctx_batch_execute (รันหลายคำสั่ง+ค้นหาแบบชุด), ctx_execute_file (ประมวลผลไฟล์ในแซนด์บ็อกซ์), ctx_index/ctx_search (ทำดัชนีและค้นหาฐานความรู้ด้วย FTS5+BM25), ctx_fetch_and_index (ดึง URL มาทำดัชนีพร้อมแคช TTL 24 ชั่วโมง), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight ความปลอดภัย: ใช้การตั้งค่า permissions ของ Claude Code (รูปแบบ deny/allow) กับ MCP sandbox แบบเดียวกัน และแม้เป็นคำสั่งที่ chain กันก็ตรวจแยกแต่ละคำสั่ง รันแบบโลคัลทั้งหมด: ไม่มี telemetry, cloud sync หรือการติดตามการใช้งาน โดยฐานข้อมูล SQLite จะเก็บไว้ในโฮมไดเรกทอรี มีการใช้งานโดยทีมจากบริษัทชั้นนำ เช่น Microsoft, Google, Meta, Amazon, NVIDIA, Stripe, Datadog Elastic License 2.0 (เปิดเผยซอร์สโค้ด แต่ห้ามให้บริการแบบโฮสต์)

(github.com/mksglu)

23 คะแนน โดย xguru 2026-05-03 | 8 ความคิดเห็น | แชร์ทาง WhatsApp

ประหยัด ข้อมูลดิบ ที่การเรียกใช้เครื่องมือ MCP เทเข้าไปใน context window และยืดระยะเวลาเซสชันจาก ~30 นาทีเป็น ~3 ชั่วโมง
การประหยัดคอนเท็กซ์: แยก ข้อมูลดิบไว้ในแซนด์บ็อกซ์ ทำให้ลดจาก 315KB → 5.4KB หรือ ลดลง 98%
ความต่อเนื่องของเซสชัน: บันทึกและทำดัชนีอีเวนต์ทั้งหมด เช่น การแก้ไขไฟล์ งาน git งาน task ข้อผิดพลาด และการตัดสินใจของผู้ใช้ ลงใน SQLite+FTS5 แล้วค้นหาด้วย BM25 เพื่อติดตามอีเวนต์ของเซสชันและกู้คืนจากการคอมแพกต์
คิดด้วยโค้ด: แทนที่ LLM จะอ่านข้อมูลโดยตรง ให้เขียนสคริปต์แล้วส่งกลับมาเฉพาะผลลัพธ์ (เช่น เวลานับจำนวนฟังก์ชัน เขียนโค้ดที่เกี่ยวข้องโดยไม่ต้องเก็บคอนเท็กซ์ แล้วรับเฉพาะผลลัพธ์จริง)
การบีบอัดเอาต์พุต: ลดโทเค็นเอาต์พุตได้ ~65-75% โดยยังคงความแม่นยำทางเทคนิค
รองรับ 14 แพลตฟอร์ม: Claude Code (plugin marketplace), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity ฯลฯ
- รองรับระดับความต่อเนื่องของเซสชันแตกต่างกันตามระดับ hook ของแต่ละแพลตฟอร์ม (PreToolUse, PostToolUse, SessionStart, PreCompact)
มี เครื่องมือ MCP 11 รายการ: ctx_execute (รันไทม์ภาษา 11 ภาษา), ctx_batch_execute (รันหลายคำสั่ง+ค้นหาแบบชุด), ctx_execute_file (ประมวลผลไฟล์ในแซนด์บ็อกซ์), ctx_index/ctx_search (ทำดัชนีและค้นหาฐานความรู้ด้วย FTS5+BM25), ctx_fetch_and_index (ดึง URL มาทำดัชนีพร้อมแคช TTL 24 ชั่วโมง), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight
ความปลอดภัย: ใช้การตั้งค่า permissions ของ Claude Code (รูปแบบ deny/allow) กับ MCP sandbox แบบเดียวกัน และแม้เป็นคำสั่งที่ chain กันก็ตรวจแยกแต่ละคำสั่ง
รันแบบโลคัลทั้งหมด: ไม่มี telemetry, cloud sync หรือการติดตามการใช้งาน โดยฐานข้อมูล SQLite จะเก็บไว้ในโฮมไดเรกทอรี
มีการใช้งานโดยทีมจากบริษัทชั้นนำ เช่น Microsoft, Google, Meta, Amazon, NVIDIA, Stripe, Datadog
Elastic License 2.0 (เปิดเผยซอร์สโค้ด แต่ห้ามให้บริการแบบโฮสต์)

8 ความคิดเห็น

kirkyoon 2026-05-06

ผมรู้สึกได้อยู่ว่ามันต่างนะครับ ตอนนี้ใช้แค่ MCP และกำลังตัด hook ออกอยู่ครับ

kaydash 2026-05-04

ใช้ได้ไหม..

duse0001 2026-05-03

ให้ความรู้สึกเหมือนเอา Claude mem มาผสมกับ caveman เลยนะ

recast7838 2026-05-03

ช่วงนี้ดูเหมือนสินค้าหรือพรอมป์ต์แนว "ประหยัดโทเคน" กำลังเป็นกระแสนะครับ แต่จะได้ผลจริงแค่ไหนผมก็ไม่แน่ใจเหมือนกัน

kurthong 2026-05-04

ผมมองว่าการประหยัดโทเค็นกับการประหยัด context window นั้นทับซ้อนกันก็จริง แต่ไม่ใช่เรื่องเดียวกัน

การประหยัดโทเค็นเป็นเรื่องของต้นทุน ส่วนการประหยัด context window เป็นเรื่องของคุณภาพหน่วยความจำในการทำงานของโมเดล หากใส่ล็อกจำนวนมากหรือ DOM snapshot เข้าไปตรง ๆ ค่าใช้จ่ายก็จะเพิ่มขึ้น แต่ปัญหาที่ใหญ่กว่าคือโอกาสที่โมเดลจะพลาดเบาะแสสำคัญท่ามกลางสัญญาณรบกวน หรืออ้างอิงผิดพลาดก็จะสูงขึ้น

ดูแล้วการเข้าใจ context-mode ว่าเป็นเครื่องมือที่ใกล้กับแนวคิด "ควบคุมว่าจะเอาอะไรขึ้นไปไว้ในคอนเท็กซ์" มากกว่า "ใช้น้อย ๆ กันเถอะ" น่าจะถูกต้องกว่า

ehlegeth 2026-05-04

คุณควรแยกให้ออกระหว่างการประหยัดโทเค็นกับการประหยัดคอนเท็กซ์วินโดว์
เพราะมักถูกพูดถึงควบคู่กันบ่อย ๆ จึงสับสนกันได้ง่ายครับ

shakespeares 2026-05-03

ก็จริงนะ ไม่แน่ใจว่ามันใช้งานได้จริงแค่ไหน.. ใช้อีกสักหนึ่งสองครั้งก็น่าจะกินโทเคนเพิ่มขึ้นหรือเปล่า..

kyg5474 2026-05-03

จริงเหรอ?

Context Mode - เซิร์ฟเวอร์ MCP ที่ประหยัด context window ของ AI coding agent ได้ 98%

บทความที่เกี่ยวข้อง

8 ความคิดเห็น