- ทักษะเอเจนต์ คือ ฟอร์แมตแบบเปิด สำหรับเพิ่ม ความสามารถและความเชี่ยวชาญใหม่ ให้กับเอเจนต์ปัญญาประดิษฐ์
- พัฒนาโดย Anthropic ก่อนเปิดเผยเป็น มาตรฐานเปิด และกำลังถูกรับไปใช้ในผลิตภัณฑ์เอเจนต์หลากหลายประเภท
- ทักษะอยู่ในรูปแบบโฟลเดอร์ที่ประกอบด้วย คำสั่ง, สคริปต์, ทรัพยากร ซึ่งเอเจนต์สามารถสำรวจและใช้งานเพื่อทำงานได้อย่างแม่นยำและมีประสิทธิภาพมากขึ้น
- รองรับ ความเชี่ยวชาญเฉพาะโดเมน, การขยายความสามารถใหม่, เวิร์กโฟลว์ที่ทำซ้ำได้, การทำงานร่วมกันได้
- องค์กรและนักพัฒนาสามารถใช้สิ่งนี้เพื่อทำให้ การนำความรู้องค์กรกลับมาใช้ซ้ำและการทำงานอัตโนมัติของการเผยแพร่ใช้งาน เกิดขึ้นได้
ภาพรวม
- Agent Skills เป็น รูปแบบที่เรียบง่ายและเปิดกว้าง สำหรับมอบ ความสามารถและความเชี่ยวชาญใหม่ ให้กับเอเจนต์
- แต่ละทักษะประกอบด้วยโฟลเดอร์ที่มี คำสั่ง, สคริปต์, ทรัพยากร ซึ่งเอเจนต์สามารถโหลดมาใช้เพื่อเพิ่มความแม่นยำและประสิทธิภาพในการทำงาน
ทำไมต้อง Agent Skills
- เอเจนต์มีความสามารถมากขึ้นเรื่อย ๆ แต่ยังมีปัญหาเรื่อง การขาดข้อมูลบริบท ที่จำเป็นต่อการทำงานจริงอย่างเสถียร
- ทักษะช่วยให้สามารถโหลด ความรู้เชิงกระบวนการ และ บริบทเฉพาะขององค์กร, ทีม, ผู้ใช้ มาใช้ได้เมื่อต้องการ
- เอเจนต์ที่มีทักษะสามารถขยายความสามารถได้ตามงานที่ได้รับ
- ผู้สร้างทักษะ สามารถนำความสามารถที่สร้างครั้งเดียวไปเผยแพร่ให้กับผลิตภัณฑ์เอเจนต์หลายตัวได้
- เอเจนต์ที่รองรับ ช่วยให้ผู้ใช้เพิ่มความสามารถใหม่ได้ทันที
- ทีมและองค์กร สามารถเก็บรักษาความรู้ขององค์กรในรูปแบบ แพ็กเกจพกพาที่จัดการเวอร์ชันได้
สิ่งที่ทำได้ด้วย Agent Skills
- ความเชี่ยวชาญเฉพาะโดเมน: แพ็กความรู้เฉพาะทาง เช่น การตรวจสอบด้านกฎหมาย การวิเคราะห์ข้อมูล เป็นชุดคำสั่งที่นำกลับมาใช้ซ้ำได้
- ความสามารถใหม่: เพิ่มฟังก์ชันหลากหลาย เช่น การสร้างงานนำเสนอ การสร้างเซิร์ฟเวอร์ MCP การวิเคราะห์ชุดข้อมูล
- เวิร์กโฟลว์ที่ทำซ้ำได้: เปลี่ยนงานหลายขั้นตอนให้เป็นกระบวนการที่สม่ำเสมอและตรวจสอบย้อนหลังได้
- การทำงานร่วมกันได้: ใช้ทักษะเดียวกันซ้ำได้ในผลิตภัณฑ์เอเจนต์ที่รองรับหลายตัว
สถานะการนำไปใช้
- Agent Skills ได้รับการรองรับใน เครื่องมือพัฒนา AI หลายตัว
- ตัวอย่างเช่น Factory.ai, Gemini CLI, Mux, Ampcode, Letta, Autohand.ai, Spring AI, Goose, Piebald.ai, OpenAI Codex, Cursor, Databricks, Mistral Vibe, Roocode, VS Code, Agentman.ai, Trae.ai, Commandcode.ai, Firebender, Opencode.ai, Claude.ai และอื่น ๆ
การพัฒนาแบบเปิด
- ฟอร์แมต Agent Skills ถูกพัฒนาขึ้นครั้งแรกโดย Anthropic และเปิดเผยเป็น มาตรฐานเปิด
- หลังจากนั้นผลิตภัณฑ์เอเจนต์หลากหลายตัวได้นำไปใช้ และเปิดให้มี การมีส่วนร่วมจากทั้งอีโคซิสเต็ม
- สามารถดูฟอร์แมตและตัวอย่างทักษะได้ผ่านคลัง GitHub
เริ่มต้นใช้งาน
6 ความคิดเห็น
มีเรโปอย่างเป็นทางการของ anthropic อยู่แล้ว แล้วทำไมถึงมีโปรเจ็กต์แบบนี้จากฝั่ง third-party อีกล่ะครับ?
> Agent Skills เป็นฟอร์แมตแบบเปิดที่ดูแลโดย Anthropic และเปิดรับการมีส่วนร่วมจากชุมชน
สรุปว่ามาตรฐานนี้ Anthropic เป็นคนสร้างขึ้นสินะ
ที่นี่ก็เป็นของทางการเหมือนกันสินะ.. อันนี้กับ https://github.com/anthropics/skills น่าจะคนละอย่างกันใช่ไหม?
ใช่ครับ อันที่คุณส่งมานั่นคือ implementation
ส่วนที่แชร์ไว้ในเนื้อหาคือ spec
ประมาณว่า
มาตรฐานของอะไรอย่าง Docker = OCI
Docker, podman = container runtime ที่ implement OCI
(อาจจะผิดก็ได้นะครับ)
อ๋อ คือสเปกกับตัว implementation สินะครับ.. ขอบคุณครับ
ความคิดเห็นจาก Hacker News
การถกเถียงนี้เริ่มจากคำถามเรื่อง ความจำเป็นของการทำให้เป็นมาตรฐาน
ฉันยังคิดว่าหัวใจของเอกสารที่ดีคือ “เขียนให้อ่านง่ายสำหรับคน” อยู่ดี เลยสงสัยว่าจำเป็นต้องบังคับใช้ฟอร์แมตใหม่จริงหรือไม่ ถ้าช่วยเพิ่มประสิทธิภาพได้จริง ก็น่าจะพิสูจน์ได้ด้วยการศึกษาเปรียบเทียบ
ทีมของเราประสบความสำเร็จโดยปฏิบัติกับ skills เหมือน ฟังก์ชันกึ่งกำหนดแน่นอนที่นำกลับมาใช้ซ้ำได้
ตัวอย่างเช่น skill
/create-new-endpointจะรวม boilerplate ทั้งหมดไว้ เช่น การอัปเดต OpenAPI และการเพิ่ม integration test เมื่อกรอกหมายเลขตั๋ว JIRA ใน CLI แล้ว LLM จะทำงานเสร็จด้วยคุณภาพที่สม่ำเสมอมีข้อเสนอให้ทำโครงสร้างโฟลเดอร์ให้เป็นมาตรฐาน
.mdแล้วนำไปใช้ ถึงอย่างนั้นก็น่าจะดีถ้ามี มาตรฐานแบบบูรณาการที่รวมถึงปลั๊กอิน ด้วย~/.config/claudeตาม XDG base spec มากกว่า ปัจจุบันวิธี~/.claudeใช้งานไม่สะดวกมีทิปให้สร้าง README.md ในแต่ละโฟลเดอร์ย่อยแล้ว ลิงก์ skill ที่เกี่ยวข้อง เข้าไว้ด้วย ซึ่งมีประโยชน์กับมนุษย์เช่นกัน บทความที่เกี่ยวข้องคือ Claude Skills Considered Harmful
justก็จะเป็นประโยชน์ทั้งกับคนและเอเจนต์ฉันพบว่าการมอง skills เป็น เวิร์กโฟลว์แบบชัดเจน ได้ผลมาก
ถ้านิยามเป็นขั้นตอนที่ครบจบแบบ “ทำ X จากนั้นทำ Y แล้วตรวจสอบ Z” เอเจนต์จะรับรู้มันเป็นโหมดหนึ่งไปเลย ในทางกลับกัน ถ้าเป็นแนวทางกำกวมมักถูกมองข้ามได้ง่าย
/fooได้ จึงชอบวิธีนั้นมากกว่ามีคนมองว่า skills ช่วยทำให้ ความรู้เชิงโดเมนที่เคยซ่อนอยู่ ถูกบันทึกเป็นเอกสารได้ กฎที่เคยอยู่ในหัวนักพัฒนาจะถูกจดไว้และนำกลับไปใช้กับการฝึก LLM ได้อีก
มีคำถามว่า “ถ้าเอเจนต์ไม่ร้องขอ มันก็จะไม่ใช้ skills ใช่ไหม”
มีคนบอกว่า skill ที่ได้รับความนิยมอันดับสามบน skills.sh เป็นแค่ลิงก์ดาวน์โหลดคำสั่งธรรมดา ไฟล์อย่าง SKILLS.md/AGENTS.md/COMMANDS.md เหล่านี้สุดท้ายก็เป็นเพียง ชุดของพรอมป์ต์ และถ้าใช้ไม่ดีอาจอันตรายได้
คนที่กำลังพัฒนาภาษาโปรแกรมใหม่บอกว่าใช้ AGENTS.md และ SKILLS เพื่อช่วยให้ LLM เข้าใจภาษาที่มันยังไม่เคยฝึกมา และการทำให้เป็นมาตรฐานก็ช่วยให้รวมเข้ากับเครื่องมือต่าง ๆ ได้ง่ายขึ้น
คุณค่าที่แท้จริงไม่ได้อยู่ที่ฟอร์แมต แต่อยู่ที่ การเปิดเผยข้อมูลแบบค่อยเป็นค่อยไป (progressive disclosure)
ถ้ายัดคำแนะนำทั้งหมดไว้ในเอกสารเดียว ก็จะเปลืองโทเคนโดยไม่จำเป็น รูปแบบ skills ช่วยให้เรียกอ่านรายละเอียดเฉพาะตอนจำเป็น ส่วนการทำให้เป็นมาตรฐานมีไว้เพื่อ การแจกจ่ายและการนำกลับมาใช้ซ้ำ เป็นหลัก
ใช้การไล่ระดับรายละเอียดแบบค่อยเป็นค่อยไปตามลำดับ GLANCE.yml → CARD.yml → SKILL.md → README.md
GLANCE ยาว 5~70 บรรทัด ใช้ตัดสินเพียงว่า “เกี่ยวข้องหรือไม่”, CARD ใช้นิยามอินเทอร์เฟซ, SKILL คือขั้นตอนจริง, และ README คือคำอธิบายสำหรับมนุษย์
เขาบอกว่า INDEX.md มีอัตราการบีบอัดดีกว่า INDEX.yml มากกว่า 80% และยังให้ โครงสร้างเชิงบรรยาย ด้วย
ลิงก์ที่เกี่ยวข้อง: INDEX.yml, INDEX.md
นอกจากนี้ยังมีโครงสร้าง sniffable-python ที่ทำให้อ่านเพียง 50 บรรทัดแรกของโค้ดก็เข้าใจ API ได้
เอกสารที่เกี่ยวข้อง: คำอธิบาย Semantic Image Pyramid, sister-script, sniffable-python README, sniffable-python SKILL