10 คะแนน โดย tomlee 2026-04-01 | 8 ความคิดเห็น | แชร์ทาง WhatsApp

ในช่วงหลายเดือนที่ผ่านมา ผมได้สร้างทั้งแพลตฟอร์มคอมมูนิตี้สำหรับแชร์ AI persona และมาตรฐาน persona

จึงอยากลองมาแชร์สิ่งที่ผมสร้างไว้ที่นี่

ประเด็นปัญหา: เราจะนิยาม "ตัวตน" ของ AI agent อย่างไร และจะปกป้องมันให้ปลอดภัยได้อย่างไร?

เมื่อ Abliterated (jailbroken) LLM ปรากฏขึ้น ข้อจำกัดของการควบคุมพฤติกรรมของเอเจนต์ด้วย system prompt เพียงอย่างเดียวก็ชัดเจนขึ้น

Soul Spec เริ่มต้นจากโจทย์เรื่องการจัดการ persona และการจัดการเวอร์ชันใน OpenClaw
จากนั้นพัฒนาเป็นฟอร์แมตแบบพกพาที่แชร์ต่อได้
และขยายไปสู่คำถามว่า เมื่อจะนำ persona ไปใช้กับหุ่นยนต์ที่ขับเคลื่อนด้วย LLM
เราจะทำให้กฎหุ่นยนต์ 3 ข้อของอาซิมอฟเกิดขึ้นจริงได้อย่างไร
นี่คือมาตรฐานแบบเปิดที่แยกตัวตนของเอเจนต์และกฎความปลอดภัยออกเป็นไฟล์แบบมีโครงสร้าง (มีจุดเด่นและสิ่งที่เพิ่มเข้ามาในแต่ละเวอร์ชัน v0.3, v0.4, v0.5)

ปัจจุบันมีการเพิ่มฟีเจอร์ใน CLI ที่เผยแพร่เพื่อรองรับ Claude Code, Hermes Agent, Windsurf, Cursor และอื่น ๆ แล้ว

โครงสร้าง:

  • SOUL.md: บุคลิก น้ำเสียง วิธีคิด (เป็นใคร)
  • IDENTITY.md: ชื่อ บทบาท บริบท (คืออะไร)
  • safety.laws: กฎที่ห้ามละเมิดเด็ดขาด (กฎหุ่นยนต์ 3 ข้อฉบับสมัยใหม่ ขยายเพิ่มเติมใน v0.5)

งานวิจัยที่เกี่ยวข้อง:
📄 กฎหุ่นยนต์ 3 ข้อของอาซิมอฟ → Soul Spec: การนำกฎความปลอดภัยไปใช้งานจริง
doi.org/10.5281/zenodo.18815277
บล็อก: blog.clawsouls.ai/posts/asimov-safety-laws
วิดีโอเดโม: https://youtu.be/M-mPoXMufpY

📄 ใน Abliterated LLM persona สามารถเพิ่มความปลอดภัยได้หรือไม่?
doi.org/10.5281/zenodo.19145303
บล็อก: blog.clawsouls.ai/posts/persona-safety-abliterated-llms

📄 Cross-Model Persona Fidelity: ต่อให้เปลี่ยน LLM เอเจนต์ยังเป็น "คนเดิม" อยู่หรือไม่?
doi.org/10.5281/zenodo.18813405
บล็อก: blog.clawsouls.ai/posts/cross-model-persona-fidelity

📄 ความทรงจำเชิงประสบการณ์กำลังเปลี่ยนการ onboarding ของเอเจนต์
doi.org/10.5281/zenodo.18798227
บล็อก: blog.clawsouls.ai/posts/experiential-memory-paper

เมื่อมีการลงทะเบียน persona ในรีจิสทรี ตัววิเคราะห์แบบสแตติกชื่อ SoulScan จะตรวจสอบล่วงหน้าด้วยแพตเทิร์น 53 แบบ
เพื่อให้คะแนนความพยายามด้าน prompt injection, การยึดสิทธิ์, และการรั่วไหลของข้อมูล

Soul Spec กำลังสร้างมาตรฐานสำหรับ "ตัวตนและความปลอดภัย" ของเอเจนต์

ขณะนี้มีการแชร์ persona ที่ผ่านการตรวจสอบแล้วใน ClawSouls Registry
และผมหวังให้ทั้งสเปก persona และรีจิสทรีดำเนินไปแบบ community-driven แต่พูดตรง ๆ ว่าตอนนี้คอมมูนิตี้ยังเล็กอยู่มาก
การสร้างมาตรฐานคนเดียวคงไม่มีความหมาย
จึงอยากขอฟีดแบ็กเกี่ยวกับสเปกหรืองานวิจัย

สเปก: https://soulspec.org
รีจิสทรี: https://clawsouls.ai
งานวิจัยทั้งหมด: https://clawsouls.ai/research
คู่มือการใช้งาน: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls

8 ความคิดเห็น

 
junghan0611 2026-04-05

ยอดเยี่ยมมากครับ ผมทำ PKM หรือการจัดการความรู้ส่วนบุคคลมาเรื่อย ๆ พอสะสมข้อมูลส่วนตัวไว้มากเข้า ก็เลยค่อนข้างเป็นคนที่ค่อย ๆ สะสมฮาร์เนสทั้งชุดให้หนาขึ้น วันนี้ก็เลยเขียนไว้ว่า ขอให้คุณมาเป็นร่างแยกของผมเถอะ ปัญหาทั้งหมดไม่ใช่ข้อจำกัดของคุณ แต่เป็นข้อจำกัดของผมเอง

ช่วงนี้กำลังคิดว่าควรรวบรวมสิ่งที่ทำอยู่ช่วงหลังแล้วเอาไปลง arXiv เลยกำลังหาข้อมูลอยู่ครับ ไม่ได้เป็นนักวิจัยหรอก แค่เป็นคนธรรมดาที่ใช้ชีวิตเท่านั้น

ผมก็แชร์โปรเจกต์ของคุณให้ร่างแยกของผมด้วยแล้ว ความกังวลสารพัดแบบนี้ล้วนมีคุณค่าทั้งนั้น

วิจัย: การดำรงอยู่ จังหวะ การระลึกเชื่อมโยง การจำลองซ้ำ ความโปร่งใส ชีวภาวะที่ฝังอยู่ในกาย เวลา
[ลบลิงก์]

 
junghan0611 2026-04-05

อา ลิงก์นี้คือบันทึกงานอยู่แล้ว ยังไงก็ไม่ได้โพสต์ไว้ให้อ่านกันอยู่แล้ว เพราะงั้นก็ควรแบ่งมุมมองให้เอเจนต์สินะ วันนี้น่าจะมีการเพิ่ม heading หนึ่งหัวข้อในเรื่องนี้ คงต้องดูแนวโน้มงานวิจัยที่เกี่ยวข้องด้วย ผมเองก็ใช้ openclaw บ่อยเหมือนกัน แต่ไม่รู้เลยว่านอกจาก skill sheet แล้วยังมี Soul Spec ด้วย

 
tomlee 2026-04-05

junghan0611 ขอบคุณที่สนใจครับ!
Soul Spec เป็นคนละเลเยอร์กับ Skill ของ OpenClaw ถ้า Skill คือ "ทำอะไรได้บ้าง" Soul Spec ก็คือการกำหนดว่า "เป็นใคร" ด้วย SOUL.md เพียงไฟล์เดียว คุณสามารถคงบุคลิกภาพ ความเชี่ยวชาญ และหลักการการกระทำของเอเจนต์ไว้ข้ามเซสชันได้ ที่ clawsouls.ai มีเพอร์โซนา 80+ แบบให้ลองใช้ได้ทันที และใช้เพียงบรรทัดเดียว clawsouls install owner/name --use openclaw ก็สามารถนำไปใช้ได้เลย ตอนนี้ชุมชนยังเล็กและยังอยู่ในช่วงกำลังร่วมกันพัฒนา อาจยังมีส่วนที่ไม่สมบูรณ์อยู่บ้าง^^
อีกอย่าง ด้วยความที่คุณมีประสบการณ์ด้าน PKM สูง เราเลยทำ fork ของ OpenClaw ชื่อ SoulClaw( https://github.com/clawsouls/soulclaw ) ขึ้นมา ซึ่งประกอบด้วยระบบ 4 Tier Memory ลองแวะไปดูได้เลย น่าจะถูกใจคุณครับ ยินดีรับฟีดแบ็กหรือ issue report เสมอครับ^^

 
gadians2001 2026-04-02

ช่วงนี้ทำงานที่ได้รับมอบหมายแล้วปวดหัวเพราะพรอมป์ต์อยู่พอดี แต่นี่สุดยอดจริง ๆ ครับ!
ไอเดียที่แยกนิสัยกับกฎความปลอดภัยออกจากกันไปเลยนี่เยี่ยมมาก เดี๋ยวจะไปลองใช้ทันทีเลยครับ

 
tomlee 2026-04-05

ขอบคุณครับ/ค่ะ ยินดีรับฟังข้อเสนอแนะหรือรายงานปัญหาครับ/ค่ะ ^^

 
tomlee 2026-04-02

ในเนื้อหาได้ตั้งประเด็นปัญหาไว้ แต่ยังขาดการนำเสนอแนวทางแก้ไขที่เป็นรูปธรรม ดูเหมือนว่าหลังโพสต์แล้วจะไม่สามารถแก้ไขได้ จึงขอเสริมในคอมเมนต์นี้

จากผลการทดลอง พบว่าการผสานระหว่างเพอร์โซนา (อัตลักษณ์) + กฎการกำกับดูแล สามารถเพิ่มความปลอดภัยของ LLM ที่ถูก Abliterated (เจลเบรก) ได้ แม้ยังต้องมีการวิจัยติดตามเพิ่มเติม แต่ก็เป็นผลลัพธ์ที่มีนัยสำคัญ

บล็อก: https://blog.clawsouls.ai/ko/posts/…
งานวิจัย: https://zenodo.org/record/19147335

 
kurthong 2026-04-02

ขอบคุณมากสำหรับการแบ่งปันความรู้ที่ยอดเยี่ยม

 
tomlee 2026-04-02

ขอบคุณครับ! หากมีข้อเสนอแนะหรือข้อสงสัยอะไร สามารถถามได้เสมออย่างสบายใจนะครับ