อย่าฝากอีเมลไว้กับ AI — สิ่งที่อินบ็อกซ์ต้องการไม่ใช่เลขา แต่คือ 'ไฟร์วอลล์' (โอเพนซอร์ส)
(github.com/k08200)ช่วงนี้เครื่องมือ "AI อีเมล" ทั้งหมดดูจะไปในทิศทางเดียวกัน คือวางร่างตอบกลับให้ทุกฉบับ ติดป้ายว่า "AI แนะนำให้ตอบแบบนี้" และเพิ่มปุ่มส่งอัตโนมัติ ผลลัพธ์คืออะไร? อินบ็อกซ์ไม่ได้เงียบลง แต่กลับวุ่นวายมากขึ้น มันคือการเอาหน้าจออีกชั้นไปทับบนหน้าจอเดิม
ผมสร้างมันในทางตรงกันข้าม ไม่ได้ฝากอินบ็อกซ์ไว้กับ AI แต่สร้างไฟร์วอลล์เพื่อกัน AI ออกไป Klorn จะส่งออกมาแค่การจัดหมวดหมู่เดียวต่ออีเมลที่เข้ามาแต่ละฉบับ และจะไม่แสดงอย่างอื่น
4 ระดับ — SILENT(เก็บบันทึกอย่างเดียว, ไม่แสดง) / QUEUE(แสดงในคิว, ไม่มีการแจ้งเตือน) / PUSH(ปลุกจริง) / AUTO(ตอนนี้มีแค่การจัดหมวดหมู่, ตั้งใจไม่เชื่อมการทำงานจริงไว้)
แกนหลัก — LLM ไม่ได้เป็นคนตัดสินใจ มันแค่ให้คะแนนตัวเลข 4 ค่าในแต่ละอีเมลเท่านั้น (ความมั่นใจ·ความน่าเชื่อถือของผู้ส่ง·การย้อนกลับได้·ความเร่งด่วน) แล้วกฎแบบกำหนดแน่นอนที่มนุษย์อ่านเข้าใจได้จะนำไปแมปเป็นระดับ ดังนั้นจึงสามารถตรวจสอบและทดสอบนโยบายได้แม้ไม่มีโมเดล และถึง LLM ล่ม fallback แบบคีย์เวิร์ดก็ยังสร้างตัวเลขชุดเดียวกันเพื่อให้อีเมลด่วนผ่านได้
และสิ่งที่ย้อนกลับไม่ได้จะไม่ให้ AI แตะต้องเด็ดขาด การส่ง·การลบถาวร·การส่งต่อออกภายนอก ทั้ง 3 อย่างอยู่หลัง deterministic floor — ตอนอนุมัติจะตรึงไบต์ที่จะส่งไว้เป็น receipt และตอนรันถ้าแม้แต่ 1 ไบต์ต่างออกไปก็ throw ทันที เส้นทางอัตโนมัติเป็นแบบ fail-closed ต่อให้ AI ยืนยันว่า "ส่งแล้ว" ถ้าไบต์ไม่ตรงก็จะไม่ถูกส่งออกไป
ส่วนที่ว่า "AI คือเวทมนตร์" ผมก็วัดมาด้วยตัวเองแล้ว ในงานจัดหมวดหมู่ โมเดลที่ถูกกว่ามากกลับแม่นยำกว่า GPT-4o งานแบบนี้ไม่ต้องการโมเดลอัจฉริยะ แต่ต้องการความสม่ำเสมอในการอ่าน 4 สัญญาณเดิมแบบเดียวกันทุกครั้ง (ตัวเลขและเหตุผลอยู่ในบทความด้านล่าง)
เป็นโอเพนซอร์สภายใต้ AGPLv3 และเชื่อมได้กับทุก OpenAI-compatible endpoint (ใช้ Ollama แล้วอีเมลจะไม่ออกจากเครื่องผมเลย) พูดกันตรง ๆ นี่คือ PoC ระยะแรก — เทียบกับอีเมลจริงของผม 50 ฉบับได้ความตรงกันราว 80% (รอบเดียว, อิง baseline ที่ผมตั้งเอง), ผู้ใช้จริงตอนนี้มีแค่ผมคนเดียว, และปิดการทำงานจริงของ AUTO ไว้โดยตั้งใจ ถ้าโม้เกินไปคอมเมนต์แรกคงมารุมแน่
บทความการออกแบบ (ซีรีส์ที่มีวิศวกรมาถกสถาปัตยกรรมกัน):
ทำไมโมเดลถูกกว่าถึงชนะ GPT-4o: https://dev.to/k08200/…
ทำไมให้ LLM แค่ให้คะแนน แต่ไม่ให้ตัดสินใจ: https://dev.to/k08200/…
deterministic floor สำหรับแอ็กชันที่ย้อนกลับไม่ได้: https://dev.to/k08200/…
เรโป: https://github.com/k08200/klorn (docker-compose + การตั้งค่า local LLM). เดโมอยู่ใน OAuth testing mode (100 คน) ดังนั้น self-host จะเร็วที่สุด.
ยังไม่มีความคิดเห็น