Soul Spec - มาตรฐานเพอร์โซนาสำหรับ AI Agent
(soulspec.org)ในช่วงหลายเดือนที่ผ่านมา ผมได้สร้างทั้งแพลตฟอร์มคอมมูนิตี้สำหรับแชร์ AI persona และมาตรฐาน persona
จึงอยากลองมาแชร์สิ่งที่ผมสร้างไว้ที่นี่
ประเด็นปัญหา: เราจะนิยาม "ตัวตน" ของ AI agent อย่างไร และจะปกป้องมันให้ปลอดภัยได้อย่างไร?
เมื่อ Abliterated (jailbroken) LLM ปรากฏขึ้น ข้อจำกัดของการควบคุมพฤติกรรมของเอเจนต์ด้วย system prompt เพียงอย่างเดียวก็ชัดเจนขึ้น
Soul Spec เริ่มต้นจากโจทย์เรื่องการจัดการ persona และการจัดการเวอร์ชันใน OpenClaw
จากนั้นพัฒนาเป็นฟอร์แมตแบบพกพาที่แชร์ต่อได้
และขยายไปสู่คำถามว่า เมื่อจะนำ persona ไปใช้กับหุ่นยนต์ที่ขับเคลื่อนด้วย LLM
เราจะทำให้กฎหุ่นยนต์ 3 ข้อของอาซิมอฟเกิดขึ้นจริงได้อย่างไร
นี่คือมาตรฐานแบบเปิดที่แยกตัวตนของเอเจนต์และกฎความปลอดภัยออกเป็นไฟล์แบบมีโครงสร้าง (มีจุดเด่นและสิ่งที่เพิ่มเข้ามาในแต่ละเวอร์ชัน v0.3, v0.4, v0.5)
ปัจจุบันมีการเพิ่มฟีเจอร์ใน CLI ที่เผยแพร่เพื่อรองรับ Claude Code, Hermes Agent, Windsurf, Cursor และอื่น ๆ แล้ว
โครงสร้าง:
- SOUL.md: บุคลิก น้ำเสียง วิธีคิด (เป็นใคร)
- IDENTITY.md: ชื่อ บทบาท บริบท (คืออะไร)
- safety.laws: กฎที่ห้ามละเมิดเด็ดขาด (กฎหุ่นยนต์ 3 ข้อฉบับสมัยใหม่ ขยายเพิ่มเติมใน v0.5)
งานวิจัยที่เกี่ยวข้อง:
📄 กฎหุ่นยนต์ 3 ข้อของอาซิมอฟ → Soul Spec: การนำกฎความปลอดภัยไปใช้งานจริง
doi.org/10.5281/zenodo.18815277
บล็อก: blog.clawsouls.ai/posts/asimov-safety-laws
วิดีโอเดโม: https://youtu.be/M-mPoXMufpY
📄 ใน Abliterated LLM persona สามารถเพิ่มความปลอดภัยได้หรือไม่?
doi.org/10.5281/zenodo.19145303
บล็อก: blog.clawsouls.ai/posts/persona-safety-abliterated-llms
📄 Cross-Model Persona Fidelity: ต่อให้เปลี่ยน LLM เอเจนต์ยังเป็น "คนเดิม" อยู่หรือไม่?
doi.org/10.5281/zenodo.18813405
บล็อก: blog.clawsouls.ai/posts/cross-model-persona-fidelity
📄 ความทรงจำเชิงประสบการณ์กำลังเปลี่ยนการ onboarding ของเอเจนต์
doi.org/10.5281/zenodo.18798227
บล็อก: blog.clawsouls.ai/posts/experiential-memory-paper
เมื่อมีการลงทะเบียน persona ในรีจิสทรี ตัววิเคราะห์แบบสแตติกชื่อ SoulScan จะตรวจสอบล่วงหน้าด้วยแพตเทิร์น 53 แบบ
เพื่อให้คะแนนความพยายามด้าน prompt injection, การยึดสิทธิ์, และการรั่วไหลของข้อมูล
Soul Spec กำลังสร้างมาตรฐานสำหรับ "ตัวตนและความปลอดภัย" ของเอเจนต์
ขณะนี้มีการแชร์ persona ที่ผ่านการตรวจสอบแล้วใน ClawSouls Registry
และผมหวังให้ทั้งสเปก persona และรีจิสทรีดำเนินไปแบบ community-driven แต่พูดตรง ๆ ว่าตอนนี้คอมมูนิตี้ยังเล็กอยู่มาก
การสร้างมาตรฐานคนเดียวคงไม่มีความหมาย
จึงอยากขอฟีดแบ็กเกี่ยวกับสเปกหรืองานวิจัย
สเปก: https://soulspec.org
รีจิสทรี: https://clawsouls.ai
งานวิจัยทั้งหมด: https://clawsouls.ai/research
คู่มือการใช้งาน: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls
8 ความคิดเห็น
ยอดเยี่ยมมากครับ ผมทำ PKM หรือการจัดการความรู้ส่วนบุคคลมาเรื่อย ๆ พอสะสมข้อมูลส่วนตัวไว้มากเข้า ก็เลยค่อนข้างเป็นคนที่ค่อย ๆ สะสมฮาร์เนสทั้งชุดให้หนาขึ้น วันนี้ก็เลยเขียนไว้ว่า ขอให้คุณมาเป็นร่างแยกของผมเถอะ ปัญหาทั้งหมดไม่ใช่ข้อจำกัดของคุณ แต่เป็นข้อจำกัดของผมเอง
ช่วงนี้กำลังคิดว่าควรรวบรวมสิ่งที่ทำอยู่ช่วงหลังแล้วเอาไปลง arXiv เลยกำลังหาข้อมูลอยู่ครับ ไม่ได้เป็นนักวิจัยหรอก แค่เป็นคนธรรมดาที่ใช้ชีวิตเท่านั้น
ผมก็แชร์โปรเจกต์ของคุณให้ร่างแยกของผมด้วยแล้ว ความกังวลสารพัดแบบนี้ล้วนมีคุณค่าทั้งนั้น
วิจัย: การดำรงอยู่ จังหวะ การระลึกเชื่อมโยง การจำลองซ้ำ ความโปร่งใส ชีวภาวะที่ฝังอยู่ในกาย เวลา
[ลบลิงก์]
อา ลิงก์นี้คือบันทึกงานอยู่แล้ว ยังไงก็ไม่ได้โพสต์ไว้ให้อ่านกันอยู่แล้ว เพราะงั้นก็ควรแบ่งมุมมองให้เอเจนต์สินะ วันนี้น่าจะมีการเพิ่ม heading หนึ่งหัวข้อในเรื่องนี้ คงต้องดูแนวโน้มงานวิจัยที่เกี่ยวข้องด้วย ผมเองก็ใช้ openclaw บ่อยเหมือนกัน แต่ไม่รู้เลยว่านอกจาก skill sheet แล้วยังมี Soul Spec ด้วย
junghan0611 ขอบคุณที่สนใจครับ!
Soul Spec เป็นคนละเลเยอร์กับ Skill ของ OpenClaw ถ้า Skill คือ "ทำอะไรได้บ้าง" Soul Spec ก็คือการกำหนดว่า "เป็นใคร" ด้วย
SOUL.mdเพียงไฟล์เดียว คุณสามารถคงบุคลิกภาพ ความเชี่ยวชาญ และหลักการการกระทำของเอเจนต์ไว้ข้ามเซสชันได้ ที่ clawsouls.ai มีเพอร์โซนา 80+ แบบให้ลองใช้ได้ทันที และใช้เพียงบรรทัดเดียวclawsouls install owner/name --use openclawก็สามารถนำไปใช้ได้เลย ตอนนี้ชุมชนยังเล็กและยังอยู่ในช่วงกำลังร่วมกันพัฒนา อาจยังมีส่วนที่ไม่สมบูรณ์อยู่บ้าง^^อีกอย่าง ด้วยความที่คุณมีประสบการณ์ด้าน PKM สูง เราเลยทำ fork ของ OpenClaw ชื่อ SoulClaw( https://github.com/clawsouls/soulclaw ) ขึ้นมา ซึ่งประกอบด้วยระบบ 4 Tier Memory ลองแวะไปดูได้เลย น่าจะถูกใจคุณครับ ยินดีรับฟีดแบ็กหรือ issue report เสมอครับ^^
ช่วงนี้ทำงานที่ได้รับมอบหมายแล้วปวดหัวเพราะพรอมป์ต์อยู่พอดี แต่นี่สุดยอดจริง ๆ ครับ!
ไอเดียที่แยกนิสัยกับกฎความปลอดภัยออกจากกันไปเลยนี่เยี่ยมมาก เดี๋ยวจะไปลองใช้ทันทีเลยครับ
ขอบคุณครับ/ค่ะ ยินดีรับฟังข้อเสนอแนะหรือรายงานปัญหาครับ/ค่ะ ^^
ในเนื้อหาได้ตั้งประเด็นปัญหาไว้ แต่ยังขาดการนำเสนอแนวทางแก้ไขที่เป็นรูปธรรม ดูเหมือนว่าหลังโพสต์แล้วจะไม่สามารถแก้ไขได้ จึงขอเสริมในคอมเมนต์นี้
จากผลการทดลอง พบว่าการผสานระหว่างเพอร์โซนา (อัตลักษณ์) + กฎการกำกับดูแล สามารถเพิ่มความปลอดภัยของ LLM ที่ถูก Abliterated (เจลเบรก) ได้ แม้ยังต้องมีการวิจัยติดตามเพิ่มเติม แต่ก็เป็นผลลัพธ์ที่มีนัยสำคัญ
บล็อก: https://blog.clawsouls.ai/ko/posts/…
งานวิจัย: https://zenodo.org/record/19147335
ขอบคุณมากสำหรับการแบ่งปันความรู้ที่ยอดเยี่ยม
ขอบคุณครับ! หากมีข้อเสนอแนะหรือข้อสงสัยอะไร สามารถถามได้เสมออย่างสบายใจนะครับ