DeepSeek Reasonix - เอเจนต์เขียนโค้ดแบบเนทีฟสำหรับ DeepSeek ที่แคชสูงและต้นทุนต่ำ

(esengine.github.io)

3 คะแนน โดย GN⁺ 2026-05-25 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

เอเจนต์เขียนโค้ดบนเทอร์มินัลแบบโอเพนซอร์สที่ออกแบบมา สำหรับ DeepSeek API โดยเฉพาะ และสื่อสารกับ api.deepseek.com โดยตรง
ลูปแบบ append-only ถูกปรับให้เหมาะกับ byte-stable prefix cache ของ DeepSeek ทำให้ในเซสชันยาว ๆ ยังคงรักษา อัตรา cache hit มากกว่า 90% และลดค่าใช้จ่ายของโทเค็นขาเข้าลงเหลือราว 1/5 (หรือประมาณ 1/3 ของต้นทุนเมื่อเทียบกับเครื่องมือประเภทเดียวกัน)
รันได้ด้วยคำสั่งเดียว npx reasonix code โดยไม่ต้องติดตั้งแบบ global (รองรับ Node ≥ 22, macOS/Linux/Windows)
แนวคิดการออกแบบหลัก 3 ประการ
- Cache-First Loop: โครงสร้างแบบ append-only, ไม่พึ่งพา marker, และคง prefix cache ด้วยลำดับการเรียกที่เป็นแบบกำหนดแน่นอน
- R1 Thought Harvest: เก็บรวบรวมสายโซ่การให้เหตุผลของ tool call ที่หลุดไป
- Tool-Call Repair: กู้คืนด้วยแนวทาง self-heal ที่รับรู้ schema
ยึดหลัก Terminal-first จึงไม่รองรับปลั๊กอิน IDE และใช้เครื่องมือเทอร์มินัลอย่าง git diff, ls เป็นต้น ได้โดยตรง
- สร้างบนพื้นฐาน TypeScript + Ink TUI และมีเดสก์ท็อปไคลเอนต์ Tauri แยกต่างหากให้ด้วย (บันเดิล Node runtime)
การใช้งานโมเดลแบบสองชั้นใน V4: ใช้ V4-Flash เป็นค่าเริ่มต้นสำหรับงานวนซ้ำต้นทุนต่ำ, ยกระดับเป็น V4-Pro แบบเทิร์นเดียวด้วย /pro, และรันทั้งเซสชันด้วย Pro ผ่าน /preset max
รองรับ MCP (Model Context Protocol) ระดับเฟิร์สคลาส: เชื่อมต่อเซิร์ฟเวอร์ภายนอกได้ในบรรทัดเดียวด้วย --mcp "name=cmd args" และรองรับการส่งข้อมูลแบบ stdio, SSE และ Streamable HTTP
Sandbox + เกต /plan: เครื่องมือในตัวทั้งหมดถูกแซนด์บ็อกซ์ไว้ในไดเรกทอรีที่รัน และโหมด /plan ทำหน้าที่เป็น read-only audit gate เพื่อบล็อกการเขียนก่อนอนุมัติ
- การแก้ไขแบบ SEARCH/REPLACE จะรออยู่ในคิว pending และจะยังไม่ถูกเขียนลงดิสก์จนกว่าจะสั่ง /apply
Composable Skills: วางไฟล์ Markdown ไว้ที่ .reasonix/skills/<name>.md และใช้ frontmatter runAs: subagent กับ allowed-tools เพื่อรันแบบแยกขอบเขต
Replay & Events: ทุกอีเวนต์ถูกบันทึกลงดิสก์ และสามารถใช้คำสั่ง reasonix replay / events / stats เพื่อเล่นย้อนหลัง ดูสถิติ และตรวจสอบเซสชันเก่าได้
การขยายระบบบนพื้นฐาน plain text: จัดการการตั้งค่าทั้งหมดเป็นข้อความล้วนที่ติดตามด้วย git ได้ ผ่านไดเรกทอรี /mcp, /skills, /memory, /config, /slash
รองรับ DeepSeek endpoint แบบ self-hosting: ตั้งแต่ 0.30 เป็นต้นไป อนุญาต non-standard key prefix และหากกำหนด baseUrl เป็นที่อยู่ภายใน ระบบลูป แคช และโปรโตคอล tool จะทำงานเหมือนเดิม
ราคา DeepSeek API: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
ใบอนุญาต MIT

2 ความคิดเห็น

myoun 2026-05-25

DeepSeek ทำให้ส่วนลดราคา V4 Pro เป็นแบบถาวร พอมาคิดดูแล้ว การใช้ DeepSeek เป็น coding agent ก็ดูไม่เลวเหมือนกัน

GN⁺ 2026-05-25

ความเห็นจาก Hacker News

ไม่แน่ใจนักว่าการใช้แคชของ DeepSeek จำเป็นต้องมี coding agent ที่ทำมาเฉพาะสำหรับ DeepSeek จริงหรือเปล่า
เมื่อวานโควตา Codex ยังมีปัญหาอยู่เลย ผมเลยทำบริดจ์เล็ก ๆ เพื่อใช้ DeepSeek V4 Pro ใน Codex แล้วดูเหมือนว่างานแทบทั้งหมดที่ผมทำจะถูกแคชไว้: https://i.imgur.com/7eKn6wN.png
ณ วันที่ 2026-05-23 มี input cache hit 39,123,200 โทเค็น และ cache miss 1,692,286 โทเค็น โดยบริดจ์นี้ไม่ได้ทำอะไรพิเศษ แค่แปลงรูปแบบ DeepSeek API ให้ตรงกับที่ Codex คาดไว้เท่านั้น ไม่มีการจัดการเฉพาะทางเรื่องแคชเลย
นอกจากเรื่องแคชที่อาจดีขึ้นแล้ว ผมยังไม่ค่อยเห็นว่ามันมีข้อดีอะไรเมื่อเทียบกับการรัน OpenCode ตรงกับ DeepSeek API ซึ่งก็น่าจะได้แคชคล้ายกัน แถมถ้าสำคัญก็ยังคุยกับ api.deepseek.com โดยตรง และได้ runtime ที่โตเต็มที่กว่ามาก
- ดูเหมือนว่าควรลิงก์หน้านี้มากกว่า: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
  มันอธิบายว่าทำไมถึงมองว่านี่เป็นทางออกที่ดีกว่า และทำไมถึงมี ปรัชญาการออกแบบที่เข้มข้น แบบนั้น
  “การแคชคำนำหน้าอัตโนมัติจะทำงานก็ต่อเมื่อคำนำหน้าแบบ byte-to-byte ของคำขอก่อนหน้าตรงกันเป๊ะเท่านั้น เอเจนต์ลูปส่วนใหญ่จะสลับลำดับ เขียนใหม่ หรือใส่ timestamp ใหม่ในแต่ละรอบ — อัตรา cache hit จริงจึงต่ำกว่า 20%”
  เพราะฉะนั้นจึงออกแบบมาเพื่อปรับส่วนนี้และเทคนิคอื่น ๆ ให้เหมาะสม เพื่อเพิ่ม cache hit และลดต้นทุน
- Opencode มีปัญหาเรื่อง ความเสถียรของแคช ค่อนข้างหนัก และตอนนี้ก็ดูเหมือนไม่ค่อยอยากแก้
- ผมก็คิดเหมือนกันเป๊ะ แล้วพอไปดูโค้ด provider ของ DeepSeek ใน coding agent ที่ผมใช้อยู่ ก็พบว่าสิ่งที่ผู้เขียนพูดมาส่วนใหญ่ถูกทำไว้เกือบหมดแล้ว
  สำหรับคนที่สงสัย: http://github.com/tontinton/maki
- ถ้าคุณ “ทำบริดจ์เล็ก ๆ เพื่อใช้ DeepSeek V4 Pro ใน Codex” อยากรู้ว่าจะพอแชร์ บริดจ์ นั้นได้ไหม
  DeepSeek v4 ใช้กับ claude-code หรือ opencode แล้วเยี่ยมมาก สำหรับผม claude code ใช้เงินน้อยกว่า opencode ซึ่งน่าจะเป็นเพราะ runtime ถูกออกแบบมาดีกว่า
- อันนี้ดูเหมือนจะเกาะกับเทอร์มินัลแบบเนทีฟเลย คือเหมือนไม่มีแอปแยกมาครอบหรือรันเอเจนต์อยู่ใน TUI
  สุดท้ายเลยเหมือนเป็นการพิมพ์ ประโยคภาษาอังกฤษทั่วไป แทนคำสั่ง
เว็บไซต์นี้ดูเหมือน Codex ทำขึ้นมา ผมเคยให้ Codex ทำ HTML สรุปฟีเจอร์ให้ทีม แล้วสิ่งที่ได้คือสัตว์ประหลาดแต่งเยอะเกินเหตุ มีแต่กล่องสถิติใหญ่ ๆ ที่แทบไม่มีข้อมูลจริง ทั้งฟอนต์ สี เลย์เอาต์ และส่วนฮีโร่ก็คล้ายกันมาก
มันก็แย่มากบนมือถือเหมือนเว็บนี้เหมือนกัน สุดท้ายผมให้ Claude ทำไฟล์ HTML หน้าเดียวแทน และประมาณ 95% ก็ใช้ได้เลย แค่แก้นิดหน่อยก็อธิบายเจตนาได้ชัดเจน
- เดี๋ยวนี้ ดีไซน์ที่ขับเคลื่อนด้วย LLM หลายอันออกมาหน้าตาแบบนี้ ผมไม่เข้าใจว่าทำไมคนถึงไม่รู้สึกว่าการจับคู่ฟอนต์ serif ที่เอียงแรง ๆ มันดูน่าเกลียด
  บนมือถือ ตัวอย่างโค้ดก็ดันคอนเทนต์ไปเรื่อยจนหน้าเว็บส่วนใหญ่แทบอ่านไม่ได้ แน่นอนว่าอาจวิจารณ์แรงไปและเจตนาก็ดี แต่เว็บที่เรียบง่ายกว่านี้ก็น่าจะพอแล้ว
- การบอกแค่ว่า “Claude ทำไฟล์ HTML หน้าเดียวและ 95% ใช้ได้เลย” ไม่ได้บอกอะไรเกี่ยวกับโมเดลไหนมากนัก
  อย่างที่วิศวกรซอฟต์แวร์ทุกคนรู้กันอยู่แล้ว ถ้า ตัดฟีเจอร์ออก โปรเจกต์ไหน ๆ ก็ง่ายลงได้มาก
สิ่งที่ผมอยากให้ผู้เขียนเข้าใจคือ บางคนต้องการ ไบนารีเดี่ยวแบบ self-contained ที่ไม่กินแรมเครื่องไปครึ่งหนึ่ง และนั่นคือเหตุผลที่อยากเขียนด้วย Rust หรือ Go
- ดีใจจริง ๆ ที่มีซอฟต์แวร์ใหม่ ๆ ออกมาด้วย Rust, Go, Zig
  คุณค่ากับความสะดวกในการพัฒนาที่ภาษาตีความช้า ๆ เคยให้ไว้นั้นกำลังลดลงเรื่อย ๆ ภาษาใหม่ ๆ พวกนี้มีของดีติดมาพื้นฐานอยู่แล้ว หรือถ้าจะพูดให้ตรงกว่านั้นคือ เสียงเรียกตอนตีหนึ่งเริ่มทำให้พวกเราไม่ทนอีกต่อไป
- ถึงจะมีเรื่องใช้ AI และคำกล่าวอ้างสารพัด แต่ก็อยากรู้ว่าทำไมถึงจะทำ coding agent ด้วย Go ล้วน ๆ ไม่ได้
  Go ก็มีไลบรารีเทอร์มินัลดี ๆ อยู่เยอะแล้ว
- ถ้าอยากลองไบนารีเดี่ยวแบบ self-contained ที่กินแรมมากกว่าครึ่งเครื่อง ก็มี ds4-agent ด้วย
- โดยเฉพาะในยุคของ coding agent ถ้าอยากได้ของแบบนั้น ก็น่าจะสร้างเองได้ไม่ใช่เหรอ
- การทำ coding bot แต่กลับพยายามประหยัดการเขียนโค้ด มันก็สื่ออะไรบางอย่างอยู่เหมือนกัน
ผมไม่ชอบหน้านั้นเลย เพราะ แอนิเมชันพิมพ์ข้อความ ทำให้ขนาดพื้นที่ตัวอย่างเปลี่ยนตลอด และคอนเทนต์ด้านล่างก็ถูกดันขึ้นลง
เป็นประสบการณ์ใช้งานที่แย่มากจริง ๆ
- จะมี agent หรือไม่ คนก็ยังควรทดสอบเว็บไซต์กับหลายความละเอียด หรืออย่างน้อยหลายขนาดหน้าต่างอยู่ดี
  แต่เหมือนสิ่งนี้กำลังกลายเป็นทักษะที่สูญหายไปเรื่อย ๆ
- ดูเหมือนเศษซากงาน AI ดีไซน์ที่ Claude สร้าง
ในมุมของคนที่ทำ runtime มาหนึ่งปี เรื่องที่ฝั่ง opencode ทำให้ prefix cache พัง ไม่ใช่เพราะเขาโง่
ปกติแล้วเขาทำแบบนั้นโดยตั้งใจ เพราะเวลาทดสอบแล้วผลรวมมันดีกว่า
ถ้าคุณคิดว่า dsv4 มีพฤติกรรมต่างจากโมเดลอื่น ๆ ทั่วไปมากพอ ก็ส่ง PR พร้อมเหตุผลไปยัง runtime ที่คุณอยากให้เพิ่มการจัดการกรณีพิเศษนั้นได้เลย การตั้งสมมติฐานแบบมืดบอดว่า “เพราะแคช เราต้องใช้ append-only ตลอด” เป็นการเสียเวลาของทุกคน
นี่ไม่ใช่ agent ที่ DeepSeek ทำเอง ดังนั้น ชื่อเรื่องจึงชวนให้เข้าใจผิด
ตอนนี้แบรนด์ของ DeepSeek แข็งแรงพอแล้ว จนเริ่มเข้าสู่ช่วงที่คนอยากอาศัย การรับรู้แบรนด์ ของมัน
ค่อนข้างน่าสนใจนะ ผมเป็นสมาชิก Claude เดือนละ 200 ดอลลาร์ และแทบไม่เคยจำเป็นต้องใช้อย่างอื่นเลย
แต่ยิ่ง Claude จำกัด workflow ของผมมากขึ้น โดยเฉพาะหลังการเปลี่ยนแปลงการใช้ IDE/-p ช่วงหลัง ๆ ก็ยิ่งอยากย้ายไปที่อื่น
ผมยังกังวลเพราะอยากได้ reasoning ระดับแนวหน้าจริง ๆ แต่ก็ยังสนใจ DeepSeek อยู่
- ถ้าอยากได้ reasoning ระดับแนวหน้า ลองใช้โมเดลอื่น ๆ ดูแล้วเทียบเองว่ามันต่างจาก โมเดลท็อประดับสูงสุด แค่ไหนน่าจะดีกว่า
  ผมทำแบบนั้นแล้วพบว่า Qwen-2.5-Max ก็พอแล้ว สำหรับงานเล่น ๆ ที่ผมทำ ผมว่า Claude Sonnet 3.5 ก็เพียงพอเหมือนกัน ไม่ได้จะไปชิง Fields Medal ด้านคณิตศาสตร์สักหน่อย
- วันนี้ผมเอา งานย้อนวิศวกรรม ที่ค่อนข้างซับซ้อนไปให้ DS-4 xhigh กับ GPT-5.5 xhigh ทำ
  ผ่านไปประมาณ 6 ชั่วโมง ทั้งคู่ก็ยังย้อนวิศวกรรมจนเสร็จสมบูรณ์ไม่ได้ แต่ความต่างชัดมาก
  DS จะหยุดทุก ๆ 30 นาทีแล้วบอกว่าทำเสร็จสมบูรณ์แล้วและตอนนี้ทุกอย่างน่าจะทำงานได้ แต่จริง ๆ แล้วยังไม่ถึง 1% ด้วยซ้ำ ผมกำชับหนักมากว่าอย่าใช้ทางลัดบางแบบ แต่มันก็ยังพยายามหาทางลัดอยู่ดี ล้มเหลวโดยสิ้นเชิง
  ส่วน GPT-5.5 น่าทึ่งมาก มันทำสิ่งที่ควรทำจริง ๆ และไม่ขยับไปขั้นถัดไปจนกว่าจะจบชั้นต้น ๆ และมั่นใจว่าตัวเองเข้าใจสิ่งที่จำเป็นครบแล้ว ตลอด 6 ชั่วโมง ผมใส่พรอมป์เพิ่มแค่ตอนที่เห็นว่ามันกำลังไปถูกทางและอยากช่วยชี้ให้ดีขึ้นอีกนิด ไม่ได้รู้สึกเหมือนต้องคอยสู้กับมัน
  แน่นอนว่าหลังการบีบอัดบางครั้งมันก็เด้งแนว ๆ ว่า “ฉันช่วยงานย้อนวิศวกรรมไม่ได้” บ้าง แต่พอเปิดเซสชันใหม่ก็แก้ได้เรียบร้อย
  ผมยกเลิกสมาชิก Claude ไปเมื่อเดือนก่อน เลยเทียบตรง ๆ ไม่ได้ แต่ DeepSeek ทำให้นึกถึงความรู้สึกตอนทำงานกับ Opus 4.6/4.7 มาก ซึ่งสำหรับบางคนอาจเป็นสัญญาณบวก แต่พอเห็น GPT-5.5 แล้ว วิธีทำงานแบบ Claude/DS ก็ดูชวนรำคาญเกินไป
- ควรถือแผน 200 ดอลลาร์ต่อเดือนไว้ต่อไป และอย่าไปลองแผน coding 10 ดอลลาร์ที่ใช้โมเดล open-weight กับลิมิตสูงกว่าเลย
  Anthropic ต้องการเงินของคุณเพื่อความอยู่รอด และคุณก็คงจะนอนหลับได้ดีกว่าเมื่อคิดว่าตัวเองกำลังใช้ของล้ำที่สุด
- แทนที่จะทิ้งโมเดลของ Anthropic ไปทั้งหมด ก็อาจใช้มันกับงานบางอย่างอย่างการวางแผน แล้วโยนงานลงมือทำให้ DeepSeek หรือเจ้าอื่น
  ถึงเครื่องมือจะต่างกัน แต่ แผนงาน Markdown ก็ใช้ได้ดีทีเดียว ถ้าผมลดจากสมาชิก 5x Max ลงมาเป็น Pro ก็น่าจะทำแบบนั้น
  ผมยังกำลังทำ launcher ที่ช่วยให้ Claude Code ใช้ provider ภายนอกได้ง่ายขึ้นด้วย: https://ccode.kronis.dev
  ตอนนี้ local proxy ใช้งานได้แล้ว เหลือแค่ยังไม่มีการสลับโมเดลแบบ dynamic ซึ่งก็ดูไม่ยากที่จะเพิ่ม และถ้าตามตาราง ก็น่าจะมาในอีก 1-2 สัปดาห์
  ผมไม่คิดว่าการทิ้ง Anthropic ไปเลยจะเป็นเรื่องฉลาด โมเดลของเขายอดเยี่ยม และการสมัครก็ยังได้ฟีเจอร์อย่าง Remote Control ที่ผมชอบด้วย แต่การเปลี่ยน tier เพื่อประหยัดเงินลงหน่อยก็ดูเป็นไปได้ ในทางกลับกัน คุณก็ยังต้องมี baseline ด้านคุณภาพ เมื่อก่อนตอนผมใช้ GLM 4.6 บน Cerebras มันมีผลลัพธ์แบบลวก ๆ อยู่พอสมควร
- ถ้าอยากได้ reasoning ระดับแนวหน้าจริง ๆ คุณต้องใช้ GPT 5.5 Pro
ผมชอบที่โฟกัสกับ ประสิทธิภาพของ cache hit ขอปรบมือให้ทีม DeepSeek ที่ทำผลิตภัณฑ์ยอดเยี่ยมโดยเน้นความคุ้มค่าของต้นทุนให้ผู้ใช้สูงสุด
- ผมลองใช้มาสักพักแล้ว และเห็นด้วยเต็มที่ ผมว่ามันดีพอ ๆ กับ Codex หรือ Claude ที่ผมใช้คู่กัน
  ในช่วงที่อ่อนไหวเรื่องต้นทุน นี่คือผู้ชนะ และถ้ามีสตาร์ตอัปไหนจับแพ็กดี ๆ โดยคำนึงถึงการเก็บรักษาข้อมูลด้วย มันก็น่าจะเป็นผลิตภัณฑ์ระดับองค์กรที่ขายได้ดี เพราะประเด็นสำคัญของ coding assistant คือ การเก็บรักษาข้อมูลและความเป็นส่วนตัว
- เผื่อใครยังไม่รู้ โปรเจกต์นี้เป็น side project ของใครสักคน
  “โครงการโอเพนซอร์สอิสระ · ไม่เกี่ยวข้องกับ DeepSeek”
- บวกกับค่า API ที่ถูกอยู่แล้ว ก็น่าจะถึงขั้นรันงานเดิมต่อเนื่องได้หลายวัน
- ผมไม่เข้าใจว่าเรื่องประสิทธิภาพของ cache hit ทำได้อย่างไร มันไม่ใช่แค่ปัญหาว่าห้ามเปลี่ยน context ก่อนหน้าหรือ?
  ผมไม่เข้าใจว่ามี คันโยก อะไรให้ปรับได้ตรงนี้
ผมลองใช้แล้ว ช่องกรอกข้อความเป็นพื้นหลังดำกับฟอนต์มืด
ผมไปอ่านเอกสารแล้วขอให้ DeepSeek v4, Claude, Gemini ช่วยเรื่องฟอนต์/สไตล์ แต่ไม่มีอะไรเวิร์กเลยนอกจากต้องรันใน เทอร์มินัลธีมมืด เท่านั้น บ้าชัด ๆ นักพัฒนาโปรเจกต์นี้ไม่มีใครใช้ธีมสว่างกันเลยหรือไง?
- เห็นด้วยว่าเป็นปัญหา แต่ก็น่าจะเป็นเพราะในความเป็นจริงคนแทบไม่ใช้มัน
  ธีมสว่าง ถูกใช้กันน้อยมาก

DeepSeek Reasonix - เอเจนต์เขียนโค้ดแบบเนทีฟสำหรับ DeepSeek ที่แคชสูงและต้นทุนต่ำ

บทความที่เกี่ยวข้อง

2 ความคิดเห็น

ความเห็นจาก Hacker News