1 คะแนน โดย k08200 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

เมื่อ 3 สัปดาห์ก่อนใน Show GN แรก ผมแชร์ไว้ว่ากำลังทำ 5-tier firewall อยู่ ช่วงที่ผ่านมามีทั้งการแก้แบบการออกแบบ + สิ่งที่ ship จริง เลยมาอัปเดตให้ครับ

▶ ปรับจาก 5-tier → 4-tier (PUSH / QUEUE / SILENT / AUTO)
ส่วน tier แบบ "Call" เอาออกและพักไว้ก่อน ตัดสินใจจากข้อมูลระหว่างทำ PoC

▶ ทำ Agent loop แบบ end-to-end เสร็จแล้ว
อีเมลขอนัดประชุมเข้ามา → แยกประเภท tier → Klorn เช็ก calendar conflict → ร่างคำตอบกลับ + ร่าง calendar event → รอใน PendingAction → ผู้ใช้กดอนุมัติแบบ 1-click → ยิงออกไป ทุก action จะถูกเซ็นด้วย payload hash ก่อนยิง และถ้าไม่มี ActionReceipt ที่ตรงกันก็จะ execute ไม่ได้

▶ ส่วนที่ใช้เวลานานที่สุด: invariant test (โค้ดน้อยกว่า 100 บรรทัด)
เป็นเทสต์ที่ทำให้ build พังทันทีถ้า action อย่าง send_email ถูกรันโดยไม่มีการอนุมัติจากผู้ใช้ ถ้าใครลบ approval check ออก → เทสต์ล้มเหลว → build ล้มเหลว → deploy ล้มเหลว การ bypass จึงไม่ใช่ตัวเลือกตั้งแต่แรก นี่คือเหตุผลที่คำว่า "agent จะไม่ส่งเอง" ไม่ใช่แค่ข้อความการตลาด แต่เป็นข้อเท็จจริง

โฆษณา

▶ เจอและแก้ prod bug จริงได้ 1 ตัว
OpenRouter retire SKU ของโมเดลแบบ :free ทำให้ autonomous cycle ทั้งหมดตายด้วย "404 No endpoints found" เดิม failover รองรับแค่ 402 / 403 / 429 แต่ยังไม่รองรับกรณี "โมเดลหายไป" เลยใส่ multi-model fallback chain ทำให้ต่อให้ upstream SKU ตัวหนึ่งตาย agent ก็ไม่ตายตาม

▶ กำลังวัด Day 14+7 retention
เกณฑ์ผ่าน PoC คือ activate ICP ให้ได้ 5 คน ฟีดแบ็กตรงไปตรงมาแม้แค่บรรทัดเดียวก็ยินดีมากครับ

▶ วิดีโอ 60 วินาที: https://klorn.ai
▶ โค้ด: https://github.com/k08200/klorn

เบต้าฟรี + ใช้ PRO ให้อัตโนมัติ ขอบคุณมากจริงๆ สำหรับทุกความเห็นในโพสต์แรกครับ

1 ความคิดเห็น

 
k08200 4 시간 전

ขอถามหนึ่งข้อ — สำหรับคนที่ทำ agent / SaaS อยู่ เวลา agent ทำงานโดยไม่ตรงกับเจตนาของผู้ใช้ รูปแบบความล้มเหลวที่เจอบ่อยที่สุดคืออะไรบ้าง?

จากที่ผมเจอระหว่างดูแลระบบ เรียงตามความถี่คือ:

  1. Prompt drift — ส่งข้อความตอบกลับอัตโนมัติที่ไม่ใช่สิ่งที่ตั้งใจไว้
  2. Model retire — พอ :free SKU ตาย วงจรก็ตายตามไปเลยโดยไม่มี fallback
  3. เข้าใจ Tool argument ผิด — agent ไปทำ action ภายนอกด้วยพารามิเตอร์ที่ผิด

อยากรู้เหมือนกันว่าของคนอื่นมีแพตเทิร์นแบบไหนบ้าง