1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เอเจนต์เขียนโค้ดบนเทอร์มินัลแบบโอเพนซอร์สที่ออกแบบมา สำหรับ DeepSeek API โดยเฉพาะ และสื่อสารกับ api.deepseek.com โดยตรง
  • ลูปแบบ append-only ถูกปรับให้เหมาะกับ byte-stable prefix cache ของ DeepSeek ทำให้ในเซสชันยาว ๆ ยังคงรักษา อัตรา cache hit มากกว่า 90% และลดค่าใช้จ่ายของโทเค็นขาเข้าลงเหลือราว 1/5 (หรือประมาณ 1/3 ของต้นทุนเมื่อเทียบกับเครื่องมือประเภทเดียวกัน)
  • รันได้ด้วยคำสั่งเดียว npx reasonix code โดยไม่ต้องติดตั้งแบบ global (รองรับ Node ≥ 22, macOS/Linux/Windows)
  • แนวคิดการออกแบบหลัก 3 ประการ
    • Cache-First Loop: โครงสร้างแบบ append-only, ไม่พึ่งพา marker, และคง prefix cache ด้วยลำดับการเรียกที่เป็นแบบกำหนดแน่นอน
    • R1 Thought Harvest: เก็บรวบรวมสายโซ่การให้เหตุผลของ tool call ที่หลุดไป
    • Tool-Call Repair: กู้คืนด้วยแนวทาง self-heal ที่รับรู้ schema
  • ยึดหลัก Terminal-first จึงไม่รองรับปลั๊กอิน IDE และใช้เครื่องมือเทอร์มินัลอย่าง git diff, ls เป็นต้น ได้โดยตรง
    • สร้างบนพื้นฐาน TypeScript + Ink TUI และมีเดสก์ท็อปไคลเอนต์ Tauri แยกต่างหากให้ด้วย (บันเดิล Node runtime)
  • การใช้งานโมเดลแบบสองชั้นใน V4: ใช้ V4-Flash เป็นค่าเริ่มต้นสำหรับงานวนซ้ำต้นทุนต่ำ, ยกระดับเป็น V4-Pro แบบเทิร์นเดียวด้วย /pro, และรันทั้งเซสชันด้วย Pro ผ่าน /preset max
  • รองรับ MCP (Model Context Protocol) ระดับเฟิร์สคลาส: เชื่อมต่อเซิร์ฟเวอร์ภายนอกได้ในบรรทัดเดียวด้วย --mcp "name=cmd args" และรองรับการส่งข้อมูลแบบ stdio, SSE และ Streamable HTTP
  • Sandbox + เกต /plan: เครื่องมือในตัวทั้งหมดถูกแซนด์บ็อกซ์ไว้ในไดเรกทอรีที่รัน และโหมด /plan ทำหน้าที่เป็น read-only audit gate เพื่อบล็อกการเขียนก่อนอนุมัติ
    • การแก้ไขแบบ SEARCH/REPLACE จะรออยู่ในคิว pending และจะยังไม่ถูกเขียนลงดิสก์จนกว่าจะสั่ง /apply
  • Composable Skills: วางไฟล์ Markdown ไว้ที่ .reasonix/skills/<name>.md และใช้ frontmatter runAs: subagent กับ allowed-tools เพื่อรันแบบแยกขอบเขต
  • Replay & Events: ทุกอีเวนต์ถูกบันทึกลงดิสก์ และสามารถใช้คำสั่ง reasonix replay / events / stats เพื่อเล่นย้อนหลัง ดูสถิติ และตรวจสอบเซสชันเก่าได้
  • การขยายระบบบนพื้นฐาน plain text: จัดการการตั้งค่าทั้งหมดเป็นข้อความล้วนที่ติดตามด้วย git ได้ ผ่านไดเรกทอรี /mcp, /skills, /memory, /config, /slash
  • รองรับ DeepSeek endpoint แบบ self-hosting: ตั้งแต่ 0.30 เป็นต้นไป อนุญาต non-standard key prefix และหากกำหนด baseUrl เป็นที่อยู่ภายใน ระบบลูป แคช และโปรโตคอล tool จะทำงานเหมือนเดิม
  • ราคา DeepSeek API: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
  • ใบอนุญาต MIT

1 ความคิดเห็น

 
GN⁺ 4 시간 전
ความเห็นจาก Hacker News
  • ไม่แน่ใจนักว่าการใช้แคชของ DeepSeek จำเป็นต้องมี coding agent ที่ทำมาเฉพาะสำหรับ DeepSeek จริงหรือเปล่า
    เมื่อวานโควตา Codex ยังมีปัญหาอยู่เลย ผมเลยทำบริดจ์เล็ก ๆ เพื่อใช้ DeepSeek V4 Pro ใน Codex แล้วดูเหมือนว่างานแทบทั้งหมดที่ผมทำจะถูกแคชไว้: https://i.imgur.com/7eKn6wN.png
    ณ วันที่ 2026-05-23 มี input cache hit 39,123,200 โทเค็น และ cache miss 1,692,286 โทเค็น โดยบริดจ์นี้ไม่ได้ทำอะไรพิเศษ แค่แปลงรูปแบบ DeepSeek API ให้ตรงกับที่ Codex คาดไว้เท่านั้น ไม่มีการจัดการเฉพาะทางเรื่องแคชเลย
    นอกจากเรื่องแคชที่อาจดีขึ้นแล้ว ผมยังไม่ค่อยเห็นว่ามันมีข้อดีอะไรเมื่อเทียบกับการรัน OpenCode ตรงกับ DeepSeek API ซึ่งก็น่าจะได้แคชคล้ายกัน แถมถ้าสำคัญก็ยังคุยกับ api.deepseek.com โดยตรง และได้ runtime ที่โตเต็มที่กว่ามาก

    • ดูเหมือนว่าควรลิงก์หน้านี้มากกว่า: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
      มันอธิบายว่าทำไมถึงมองว่านี่เป็นทางออกที่ดีกว่า และทำไมถึงมี ปรัชญาการออกแบบที่เข้มข้น แบบนั้น
      “การแคชคำนำหน้าอัตโนมัติจะทำงานก็ต่อเมื่อคำนำหน้าแบบ byte-to-byte ของคำขอก่อนหน้าตรงกันเป๊ะเท่านั้น เอเจนต์ลูปส่วนใหญ่จะสลับลำดับ เขียนใหม่ หรือใส่ timestamp ใหม่ในแต่ละรอบ — อัตรา cache hit จริงจึงต่ำกว่า 20%”
      เพราะฉะนั้นจึงออกแบบมาเพื่อปรับส่วนนี้และเทคนิคอื่น ๆ ให้เหมาะสม เพื่อเพิ่ม cache hit และลดต้นทุน
    • Opencode มีปัญหาเรื่อง ความเสถียรของแคช ค่อนข้างหนัก และตอนนี้ก็ดูเหมือนไม่ค่อยอยากแก้
    • ผมก็คิดเหมือนกันเป๊ะ แล้วพอไปดูโค้ด provider ของ DeepSeek ใน coding agent ที่ผมใช้อยู่ ก็พบว่าสิ่งที่ผู้เขียนพูดมาส่วนใหญ่ถูกทำไว้เกือบหมดแล้ว
      สำหรับคนที่สงสัย: http://github.com/tontinton/maki
    • ถ้าคุณ “ทำบริดจ์เล็ก ๆ เพื่อใช้ DeepSeek V4 Pro ใน Codex” อยากรู้ว่าจะพอแชร์ บริดจ์ นั้นได้ไหม
      DeepSeek v4 ใช้กับ claude-code หรือ opencode แล้วเยี่ยมมาก สำหรับผม claude code ใช้เงินน้อยกว่า opencode ซึ่งน่าจะเป็นเพราะ runtime ถูกออกแบบมาดีกว่า
    • อันนี้ดูเหมือนจะเกาะกับเทอร์มินัลแบบเนทีฟเลย คือเหมือนไม่มีแอปแยกมาครอบหรือรันเอเจนต์อยู่ใน TUI
      สุดท้ายเลยเหมือนเป็นการพิมพ์ ประโยคภาษาอังกฤษทั่วไป แทนคำสั่ง
  • เว็บไซต์นี้ดูเหมือน Codex ทำขึ้นมา ผมเคยให้ Codex ทำ HTML สรุปฟีเจอร์ให้ทีม แล้วสิ่งที่ได้คือสัตว์ประหลาดแต่งเยอะเกินเหตุ มีแต่กล่องสถิติใหญ่ ๆ ที่แทบไม่มีข้อมูลจริง ทั้งฟอนต์ สี เลย์เอาต์ และส่วนฮีโร่ก็คล้ายกันมาก
    มันก็แย่มากบนมือถือเหมือนเว็บนี้เหมือนกัน สุดท้ายผมให้ Claude ทำไฟล์ HTML หน้าเดียวแทน และประมาณ 95% ก็ใช้ได้เลย แค่แก้นิดหน่อยก็อธิบายเจตนาได้ชัดเจน

    • เดี๋ยวนี้ ดีไซน์ที่ขับเคลื่อนด้วย LLM หลายอันออกมาหน้าตาแบบนี้ ผมไม่เข้าใจว่าทำไมคนถึงไม่รู้สึกว่าการจับคู่ฟอนต์ serif ที่เอียงแรง ๆ มันดูน่าเกลียด
      บนมือถือ ตัวอย่างโค้ดก็ดันคอนเทนต์ไปเรื่อยจนหน้าเว็บส่วนใหญ่แทบอ่านไม่ได้ แน่นอนว่าอาจวิจารณ์แรงไปและเจตนาก็ดี แต่เว็บที่เรียบง่ายกว่านี้ก็น่าจะพอแล้ว
    • การบอกแค่ว่า “Claude ทำไฟล์ HTML หน้าเดียวและ 95% ใช้ได้เลย” ไม่ได้บอกอะไรเกี่ยวกับโมเดลไหนมากนัก
      อย่างที่วิศวกรซอฟต์แวร์ทุกคนรู้กันอยู่แล้ว ถ้า ตัดฟีเจอร์ออก โปรเจกต์ไหน ๆ ก็ง่ายลงได้มาก
  • สิ่งที่ผมอยากให้ผู้เขียนเข้าใจคือ บางคนต้องการ ไบนารีเดี่ยวแบบ self-contained ที่ไม่กินแรมเครื่องไปครึ่งหนึ่ง และนั่นคือเหตุผลที่อยากเขียนด้วย Rust หรือ Go

    • ดีใจจริง ๆ ที่มีซอฟต์แวร์ใหม่ ๆ ออกมาด้วย Rust, Go, Zig
      คุณค่ากับความสะดวกในการพัฒนาที่ภาษาตีความช้า ๆ เคยให้ไว้นั้นกำลังลดลงเรื่อย ๆ ภาษาใหม่ ๆ พวกนี้มีของดีติดมาพื้นฐานอยู่แล้ว หรือถ้าจะพูดให้ตรงกว่านั้นคือ เสียงเรียกตอนตีหนึ่งเริ่มทำให้พวกเราไม่ทนอีกต่อไป
    • ถึงจะมีเรื่องใช้ AI และคำกล่าวอ้างสารพัด แต่ก็อยากรู้ว่าทำไมถึงจะทำ coding agent ด้วย Go ล้วน ๆ ไม่ได้
      Go ก็มีไลบรารีเทอร์มินัลดี ๆ อยู่เยอะแล้ว
    • ถ้าอยากลองไบนารีเดี่ยวแบบ self-contained ที่กินแรมมากกว่าครึ่งเครื่อง ก็มี ds4-agent ด้วย
    • โดยเฉพาะในยุคของ coding agent ถ้าอยากได้ของแบบนั้น ก็น่าจะสร้างเองได้ไม่ใช่เหรอ
    • การทำ coding bot แต่กลับพยายามประหยัดการเขียนโค้ด มันก็สื่ออะไรบางอย่างอยู่เหมือนกัน
  • ผมไม่ชอบหน้านั้นเลย เพราะ แอนิเมชันพิมพ์ข้อความ ทำให้ขนาดพื้นที่ตัวอย่างเปลี่ยนตลอด และคอนเทนต์ด้านล่างก็ถูกดันขึ้นลง
    เป็นประสบการณ์ใช้งานที่แย่มากจริง ๆ

    • จะมี agent หรือไม่ คนก็ยังควรทดสอบเว็บไซต์กับหลายความละเอียด หรืออย่างน้อยหลายขนาดหน้าต่างอยู่ดี
      แต่เหมือนสิ่งนี้กำลังกลายเป็นทักษะที่สูญหายไปเรื่อย ๆ
    • ดูเหมือนเศษซากงาน AI ดีไซน์ที่ Claude สร้าง
  • ในมุมของคนที่ทำ runtime มาหนึ่งปี เรื่องที่ฝั่ง opencode ทำให้ prefix cache พัง ไม่ใช่เพราะเขาโง่
    ปกติแล้วเขาทำแบบนั้นโดยตั้งใจ เพราะเวลาทดสอบแล้วผลรวมมันดีกว่า
    ถ้าคุณคิดว่า dsv4 มีพฤติกรรมต่างจากโมเดลอื่น ๆ ทั่วไปมากพอ ก็ส่ง PR พร้อมเหตุผลไปยัง runtime ที่คุณอยากให้เพิ่มการจัดการกรณีพิเศษนั้นได้เลย การตั้งสมมติฐานแบบมืดบอดว่า “เพราะแคช เราต้องใช้ append-only ตลอด” เป็นการเสียเวลาของทุกคน

  • นี่ไม่ใช่ agent ที่ DeepSeek ทำเอง ดังนั้น ชื่อเรื่องจึงชวนให้เข้าใจผิด

  • ตอนนี้แบรนด์ของ DeepSeek แข็งแรงพอแล้ว จนเริ่มเข้าสู่ช่วงที่คนอยากอาศัย การรับรู้แบรนด์ ของมัน

  • ค่อนข้างน่าสนใจนะ ผมเป็นสมาชิก Claude เดือนละ 200 ดอลลาร์ และแทบไม่เคยจำเป็นต้องใช้อย่างอื่นเลย
    แต่ยิ่ง Claude จำกัด workflow ของผมมากขึ้น โดยเฉพาะหลังการเปลี่ยนแปลงการใช้ IDE/-p ช่วงหลัง ๆ ก็ยิ่งอยากย้ายไปที่อื่น
    ผมยังกังวลเพราะอยากได้ reasoning ระดับแนวหน้าจริง ๆ แต่ก็ยังสนใจ DeepSeek อยู่

    • ถ้าอยากได้ reasoning ระดับแนวหน้า ลองใช้โมเดลอื่น ๆ ดูแล้วเทียบเองว่ามันต่างจาก โมเดลท็อประดับสูงสุด แค่ไหนน่าจะดีกว่า
      ผมทำแบบนั้นแล้วพบว่า Qwen-2.5-Max ก็พอแล้ว สำหรับงานเล่น ๆ ที่ผมทำ ผมว่า Claude Sonnet 3.5 ก็เพียงพอเหมือนกัน ไม่ได้จะไปชิง Fields Medal ด้านคณิตศาสตร์สักหน่อย
    • วันนี้ผมเอา งานย้อนวิศวกรรม ที่ค่อนข้างซับซ้อนไปให้ DS-4 xhigh กับ GPT-5.5 xhigh ทำ
      ผ่านไปประมาณ 6 ชั่วโมง ทั้งคู่ก็ยังย้อนวิศวกรรมจนเสร็จสมบูรณ์ไม่ได้ แต่ความต่างชัดมาก
      DS จะหยุดทุก ๆ 30 นาทีแล้วบอกว่าทำเสร็จสมบูรณ์แล้วและตอนนี้ทุกอย่างน่าจะทำงานได้ แต่จริง ๆ แล้วยังไม่ถึง 1% ด้วยซ้ำ ผมกำชับหนักมากว่าอย่าใช้ทางลัดบางแบบ แต่มันก็ยังพยายามหาทางลัดอยู่ดี ล้มเหลวโดยสิ้นเชิง
      ส่วน GPT-5.5 น่าทึ่งมาก มันทำสิ่งที่ควรทำจริง ๆ และไม่ขยับไปขั้นถัดไปจนกว่าจะจบชั้นต้น ๆ และมั่นใจว่าตัวเองเข้าใจสิ่งที่จำเป็นครบแล้ว ตลอด 6 ชั่วโมง ผมใส่พรอมป์เพิ่มแค่ตอนที่เห็นว่ามันกำลังไปถูกทางและอยากช่วยชี้ให้ดีขึ้นอีกนิด ไม่ได้รู้สึกเหมือนต้องคอยสู้กับมัน
      แน่นอนว่าหลังการบีบอัดบางครั้งมันก็เด้งแนว ๆ ว่า “ฉันช่วยงานย้อนวิศวกรรมไม่ได้” บ้าง แต่พอเปิดเซสชันใหม่ก็แก้ได้เรียบร้อย
      ผมยกเลิกสมาชิก Claude ไปเมื่อเดือนก่อน เลยเทียบตรง ๆ ไม่ได้ แต่ DeepSeek ทำให้นึกถึงความรู้สึกตอนทำงานกับ Opus 4.6/4.7 มาก ซึ่งสำหรับบางคนอาจเป็นสัญญาณบวก แต่พอเห็น GPT-5.5 แล้ว วิธีทำงานแบบ Claude/DS ก็ดูชวนรำคาญเกินไป
    • ควรถือแผน 200 ดอลลาร์ต่อเดือนไว้ต่อไป และอย่าไปลองแผน coding 10 ดอลลาร์ที่ใช้โมเดล open-weight กับลิมิตสูงกว่าเลย
      Anthropic ต้องการเงินของคุณเพื่อความอยู่รอด และคุณก็คงจะนอนหลับได้ดีกว่าเมื่อคิดว่าตัวเองกำลังใช้ของล้ำที่สุด
    • แทนที่จะทิ้งโมเดลของ Anthropic ไปทั้งหมด ก็อาจใช้มันกับงานบางอย่างอย่างการวางแผน แล้วโยนงานลงมือทำให้ DeepSeek หรือเจ้าอื่น
      ถึงเครื่องมือจะต่างกัน แต่ แผนงาน Markdown ก็ใช้ได้ดีทีเดียว ถ้าผมลดจากสมาชิก 5x Max ลงมาเป็น Pro ก็น่าจะทำแบบนั้น
      ผมยังกำลังทำ launcher ที่ช่วยให้ Claude Code ใช้ provider ภายนอกได้ง่ายขึ้นด้วย: https://ccode.kronis.dev
      ตอนนี้ local proxy ใช้งานได้แล้ว เหลือแค่ยังไม่มีการสลับโมเดลแบบ dynamic ซึ่งก็ดูไม่ยากที่จะเพิ่ม และถ้าตามตาราง ก็น่าจะมาในอีก 1-2 สัปดาห์
      ผมไม่คิดว่าการทิ้ง Anthropic ไปเลยจะเป็นเรื่องฉลาด โมเดลของเขายอดเยี่ยม และการสมัครก็ยังได้ฟีเจอร์อย่าง Remote Control ที่ผมชอบด้วย แต่การเปลี่ยน tier เพื่อประหยัดเงินลงหน่อยก็ดูเป็นไปได้ ในทางกลับกัน คุณก็ยังต้องมี baseline ด้านคุณภาพ เมื่อก่อนตอนผมใช้ GLM 4.6 บน Cerebras มันมีผลลัพธ์แบบลวก ๆ อยู่พอสมควร
    • ถ้าอยากได้ reasoning ระดับแนวหน้าจริง ๆ คุณต้องใช้ GPT 5.5 Pro
  • ผมชอบที่โฟกัสกับ ประสิทธิภาพของ cache hit ขอปรบมือให้ทีม DeepSeek ที่ทำผลิตภัณฑ์ยอดเยี่ยมโดยเน้นความคุ้มค่าของต้นทุนให้ผู้ใช้สูงสุด

    • ผมลองใช้มาสักพักแล้ว และเห็นด้วยเต็มที่ ผมว่ามันดีพอ ๆ กับ Codex หรือ Claude ที่ผมใช้คู่กัน
      ในช่วงที่อ่อนไหวเรื่องต้นทุน นี่คือผู้ชนะ และถ้ามีสตาร์ตอัปไหนจับแพ็กดี ๆ โดยคำนึงถึงการเก็บรักษาข้อมูลด้วย มันก็น่าจะเป็นผลิตภัณฑ์ระดับองค์กรที่ขายได้ดี เพราะประเด็นสำคัญของ coding assistant คือ การเก็บรักษาข้อมูลและความเป็นส่วนตัว
    • เผื่อใครยังไม่รู้ โปรเจกต์นี้เป็น side project ของใครสักคน
      “โครงการโอเพนซอร์สอิสระ · ไม่เกี่ยวข้องกับ DeepSeek”
    • บวกกับค่า API ที่ถูกอยู่แล้ว ก็น่าจะถึงขั้นรันงานเดิมต่อเนื่องได้หลายวัน
    • ผมไม่เข้าใจว่าเรื่องประสิทธิภาพของ cache hit ทำได้อย่างไร มันไม่ใช่แค่ปัญหาว่าห้ามเปลี่ยน context ก่อนหน้าหรือ?
      ผมไม่เข้าใจว่ามี คันโยก อะไรให้ปรับได้ตรงนี้
  • ผมลองใช้แล้ว ช่องกรอกข้อความเป็นพื้นหลังดำกับฟอนต์มืด
    ผมไปอ่านเอกสารแล้วขอให้ DeepSeek v4, Claude, Gemini ช่วยเรื่องฟอนต์/สไตล์ แต่ไม่มีอะไรเวิร์กเลยนอกจากต้องรันใน เทอร์มินัลธีมมืด เท่านั้น บ้าชัด ๆ นักพัฒนาโปรเจกต์นี้ไม่มีใครใช้ธีมสว่างกันเลยหรือไง?

    • เห็นด้วยว่าเป็นปัญหา แต่ก็น่าจะเป็นเพราะในความเป็นจริงคนแทบไม่ใช้มัน
      ธีมสว่าง ถูกใช้กันน้อยมาก