Claude Skills น่าทึ่งมาก อาจเป็นนวัตกรรมที่ใหญ่กว่า MCP เสียอีก

(simonwillison.net)

52 คะแนน โดย GN⁺ 2025-10-18 | 12 ความคิดเห็น | แชร์ทาง WhatsApp

Claude Skills ที่ Anthropic เปิดตัว คือรูปแบบใหม่ที่จัดเตรียมคำแนะนำ สคริปต์ และทรัพยากรที่จำเป็นต่อการให้โมเดลทำงานเฉพาะด้านในรูปแบบโฟลเดอร์ โดยเป็นวิธี โหลดความเชี่ยวชาญเฉพาะงานแบบไดนามิก
Skills ประกอบด้วยไฟล์ Markdown และสคริปต์เสริมแบบเลือกใช้ โดยเมื่อเริ่มเซสชันจะโหลดเฉพาะเมทาดาทาของแต่ละสกิลด้วยโทเคนเพียง ไม่กี่สิบโทเคน แล้วค่อยดึงเนื้อหาทั้งหมดมาเมื่อจำเป็นจริงเท่านั้น ทำให้มี ประสิทธิภาพด้านโทเคน สูงมาก
ผ่าน Claude Code, Skills ขยายจากเครื่องมือเขียนโค้ดธรรมดาไปสู่ เอเจนต์อัตโนมัติแบบอเนกประสงค์ และหากมีเพียงระบบไฟล์กับสภาพแวดล้อมสำหรับรันคำสั่ง ก็สามารถทำงานอัตโนมัติได้หลากหลายประเภท
ต่างจาก MCP ตรงที่ Skills ไม่ใช่โปรโตคอล แต่เป็น โครงสร้างเรียบง่ายบนพื้นฐานของ Markdown และ YAML จึงนำไปใช้กับโมเดลหรือเครื่องมืออื่นได้ทันที และแชร์หรือเผยแพร่ต่อได้ง่าย
ด้วยความเรียบง่ายและมีประสิทธิภาพนี้ คาดว่า Skills จะ ขยายระบบนิเวศได้เร็วกว่ามากเมื่อเทียบกับ MCP และสามารถสร้างเอเจนต์เฉพาะทางได้ในหลายสาขา ตั้งแต่งาน data journalism ไปจนถึงแนวทางแบรนด์ โดยหลีกเลี่ยงปัญหาการใช้โทเคนสูงและสเปกที่ซับซ้อนของ MCP ได้

แนวคิดและโครงสร้างของ Skills

Anthropic ประกาศเปิดตัว Claude Skills อย่างเป็นทางการเมื่อวันที่ 16 ตุลาคม 2025
- เป็นระบบขยายความสามารถแบบหน่วยโฟลเดอร์ ที่บรรจุคำแนะนำ สคริปต์ และทรัพยากรซึ่งจำเป็นต่อการให้โมเดลทำงานเฉพาะอย่าง เช่น งาน Excel หรือการปฏิบัติตามแนวทางแบรนด์ขององค์กร
- Claude จะเข้าถึงสกิลนั้นเฉพาะเมื่อเกี่ยวข้องกับงาน เพื่อเพิ่มความสามารถในการทำงานเฉพาะทาง
มีตัวอย่างสกิลอย่างเป็นทางการใน GitHub repository anthropic/skills
ในเชิงแนวคิด Skills เรียบง่ายอย่างมาก
- แกนหลักคือไฟล์ Markdown ที่บอกโมเดลว่าควรทำงานนั้นอย่างไร
- สามารถใส่เอกสารเพิ่มเติมและสคริปต์ที่เตรียมไว้ล่วงหน้าแบบเลือกใช้ เพื่อช่วยให้งานเสร็จสมบูรณ์
ฟีเจอร์สร้างเอกสารของ Claude ที่ประกาศในเดือนกันยายน แท้จริงแล้วถูก สร้างขึ้นด้วย Skills ทั้งหมด
- สามารถดูสกิลสำหรับจัดการไฟล์ .pdf, .docx, .xlsx, .pptx ได้ใน public repository

ประสิทธิภาพด้านโทเคน: จุดเด่นหลักของ Skills

เมื่อเริ่มเซสชัน Claude จะสแกนไฟล์สกิลทั้งหมดที่มี และอ่านเพียง คำอธิบายสั้น ๆ จาก frontmatter YAML ของแต่ละสกิล
โทเคนเริ่มต้นที่แต่ละสกิลใช้มีเพียง ไม่กี่สิบโทเคน จึงมีประสิทธิภาพสูงมาก
จะโหลดรายละเอียดทั้งหมดก็ต่อเมื่อผู้ใช้ร้องของานที่สกิลนั้นอาจช่วยได้
นี่คือจุดต่างสำคัญที่ทำให้มันไม่ได้เป็นเพียงการเก็บไฟล์ไว้บนดิสก์ แต่กลายเป็น ฟีเจอร์ที่ใช้งานได้จริง

กรณีฝึกใช้สกิลสร้าง GIF สำหรับ Slack

คำอธิบายเมทาดาทาของสกิล slack-gif-creator
- ชุดเครื่องมือสร้าง GIF แบบแอนิเมชันที่ปรับให้เหมาะกับ Slack
- มีตัวตรวจสอบข้อจำกัดด้านขนาด และองค์ประกอบแอนิเมชันพื้นฐานที่นำมาประกอบกันได้
- ใช้กับคำขออย่าง “ช่วยสร้าง GIF สำหรับ Slack ที่เป็นภาพ X ทำ Y ให้หน่อย”
กระบวนการทดสอบจริง
- เปิดใช้งานสกิล slack-gif-creator บน Claude mobile web app ด้วยโมเดล Sonnet 4.5
- ป้อนพรอมป์ต์ “Make me a gif for slack about how Skills are way cooler than MCPs”
- Claude สร้าง GIF ให้อัตโนมัติทันที (คุณภาพยังควรปรับปรุงได้ แต่สกิลแบบนี้ทำซ้ำเพื่อพัฒนาได้ง่าย)
จุดที่น่าสนใจใน Python script ที่สร้างขึ้น
- เพิ่มไดเรกทอรีสกิลเข้าไปใน Python path: sys.path.insert(0, '/mnt/skills/examples/slack-gif-creator')
- ใช้คลาส GIFBuilder ในไดเรกทอรี core/ ของสกิล
- บันทึกไฟล์ไว้ที่ /mnt/user-data/outputs/
- ใช้ ฟังก์ชันตรวจสอบขนาดตามข้อจำกัดของ Slack (2MB) check_slack_size() เพื่อยืนยันว่าเป็นไปตามข้อกำหนด
- ถ้าขนาดเกิน โมเดลสามารถลองสร้างไฟล์ใหม่ที่เล็กลงโดยอัตโนมัติได้

การพึ่งพาสภาพแวดล้อมของ Skills

กลไกของ Skills จะ ทำงานได้เต็มรูปแบบ ก็ต่อเมื่อโมเดลเข้าถึงสิ่งต่อไปนี้ได้
- ระบบไฟล์
- เครื่องมือสำหรับสำรวจระบบไฟล์
- ความสามารถในการรันคำสั่งในสภาพแวดล้อม
นี่เป็นแพตเทิร์นทั่วไปของเครื่องมือ LLM
- ChatGPT Code Interpreter เป็นกรณีขนาดใหญ่ครั้งแรกตั้งแต่ ต้นปี 2023
- หลังจากนั้นก็ขยายไปถึงเครื่องมือเอเจนต์เขียนโค้ดบนเครื่องโลคัล เช่น Cursor, Claude Code, Codex CLI และ Gemini CLI
ข้อกำหนดนี้คือ ความต่างที่ใหญ่ที่สุด จากความพยายามขยายความสามารถของ LLM ในอดีตอย่าง MCP หรือ ChatGPT Plugins
แม้จะเป็นการพึ่งพาที่สำคัญ แต่ ขนาดของความสามารถใหม่ที่ปลดล็อกได้ นั้นน่าทึ่งมาก
ประเด็นด้านความปลอดภัยยังคงสำคัญ
- ต้องมีสภาพแวดล้อมการเขียนโค้ดที่ ปลอดภัย
- ต้องมีวิธีสร้างสภาพแวดล้อมแบบ sandbox ที่จำกัดความเสียหายจากการโจมตีอย่าง prompt injection ให้อยู่ในระดับที่ยอมรับได้

Claude Code: วิวัฒนาการสู่เอเจนต์อเนกประสงค์

ในเดือนมกราคม 2025 ผู้เขียนเคยคาดการณ์ว่า “เอเจนต์” จะล้มเหลว แต่กลับผิดเต็ม ๆ
- ปี 2025 กลายเป็นปีแห่ง “เอเจนต์” จริง ๆ (แม้จะมีหลายคำนิยาม แต่ผู้เขียนนิยามว่าเป็น “tools in a loop”)
Claude Code เป็นชื่อที่ตั้งได้ไม่ตรงนัก
- มันไม่ใช่แค่เครื่องมือเขียนโค้ดล้วน ๆ แต่เป็น เครื่องมืออัตโนมัติสำหรับคอมพิวเตอร์แบบอเนกประสงค์
- สามารถทำงานอัตโนมัติได้กับ ทุกงาน ที่ทำได้ด้วยการพิมพ์คำสั่งลงในคอมพิวเตอร์
- คำอธิบายที่เหมาะที่สุดคือ general agent
Skills ทำให้ศักยภาพนี้ชัดเจนและเป็นรูปธรรมมากยิ่งขึ้น
ขอบเขตการประยุกต์ใช้นั้นกว้างจนแทบเวียนหัว
- ตัวอย่างด้าน data journalism: สามารถจัดโฟลเดอร์สกิลสำหรับงานต่อไปนี้ได้
  - ทำความเข้าใจแหล่งข้อมูลและโครงสร้างของข้อมูลสำมะโนประชากรสหรัฐฯ
  - โหลดข้อมูลหลายรูปแบบเข้า SQLite/DuckDB ด้วยไลบรารี Python
  - เผยแพร่ข้อมูลออนไลน์เป็นไฟล์ Parquet บน S3 หรือตาราง Datasette Cloud
  - วิธีค้นหาเรื่องราวที่น่าสนใจจากชุดข้อมูลใหม่ ๆ (ตามแนวทางของนักข่าวข้อมูลที่มีประสบการณ์)
  - สร้าง data visualization ที่สะอาดและอ่านง่ายด้วย D3
- ผลลัพธ์คือ สามารถสร้าง “เอเจนต์ data journalism” ที่ค้นพบและเผยแพร่เรื่องราวจากข้อมูลสำมะโนประชากรสหรัฐฯ ได้ ด้วยเพียงไฟล์ Markdown และตัวอย่าง Python script ไม่กี่ไฟล์

เปรียบเทียบ Skills กับ MCP

Model Context Protocol (MCP) ได้รับความสนใจอย่างมหาศาลหลังเปิดตัวในเดือนพฤศจิกายน 2024
- ทุกบริษัทต่างต้องการ “กลยุทธ์ AI” และการประกาศรองรับ MCP ก็เป็นวิธีง่าย ๆ ที่ตอบโจทย์นั้น
ข้อจำกัดของ MCP เริ่มชัดเจนขึ้นเรื่อย ๆ
- ปัญหาสำคัญที่สุดคือปริมาณการใช้โทเคน
- MCP อย่างเป็นทางการของ GitHub เพียงตัวเดียวก็ใช้ context token หลายหมื่นโทเคน
- ถ้าเพิ่มอีกไม่กี่ตัว ก็แทบไม่เหลือพื้นที่ให้ LLM ทำงานที่มีประโยชน์จริง
หลังจากผู้เขียนเริ่มจริงจังกับ coding agent ความสนใจใน MCP ก็ลดลง
- เกือบทุกอย่างที่ทำได้ด้วย MCP สามารถ แทนที่ด้วยเครื่องมือ CLI ได้
- LLM รู้วิธีเรียก cli-tool --help อยู่แล้ว จึงไม่จำเป็นต้องเสียโทเคนจำนวนมากเพื่ออธิบายวิธีใช้
- โมเดลสามารถหาคำตอบเองได้เมื่อจำเป็น
Skills มีข้อดีแบบเดียวกันนี้ตรง ๆ และยิ่งไปกว่านั้น ยังไม่จำเป็นต้องสร้างเครื่องมือ CLI ใหม่ด้วยซ้ำ
- แค่วางไฟล์ Markdown ที่อธิบายวิธีทำงานนั้นลงไป
- เพิ่มสคริปต์เฉพาะเมื่อช่วยเรื่องเสถียรภาพหรือประสิทธิภาพได้จริงเท่านั้น

แนวโน้มการเติบโตแบบระเบิดของระบบนิเวศ Skills

หนึ่งในจุดที่น่าสนใจที่สุดของ Skills คือ การแชร์ได้ง่าย
- คาดว่าสกิลจำนวนมากจะถูกทำเป็นไฟล์เดียว
- ส่วนสกิลที่ซับซ้อนขึ้นก็จะเป็นโฟลเดอร์ที่มีไม่กี่ไฟล์
เอกสารจาก Anthropic
- Agent Skills documentation
- Claude Skills Cookbook
ผู้เขียนเองก็กำลังคิดไอเดียสกิล เช่น วิธีสร้าง Datasette plugin
ใช้กับโมเดลอื่นได้ด้วย: เป็นข้อดีอีกอย่างของการออกแบบ Skills
- หากเชื่อมโฟลเดอร์สกิลเข้ากับ Codex CLI หรือ Gemini CLI แล้วสั่งว่า “อ่าน pdf/SKILL.md แล้วสร้าง PDF ที่อธิบายโปรเจกต์นี้ให้หน่อย” ก็ใช้งานได้
- ทำได้แม้เครื่องมือและโมเดลนั้นจะไม่มีความรู้ในตัวเกี่ยวกับระบบสกิลเลยก็ตาม
คาดการณ์ว่า จะเกิด การระเบิดแบบแคมเบรียนของ Skills จนทำให้กระแส MCP ในปีนี้ดูจืดชืดไปเลย

ความเรียบง่ายคือจุดแข็งหลัก

บางคนอาจคัดค้านว่า Skills เรียบง่ายเกินไปจนแทบไม่ใช่ฟีเจอร์
- หลายคนเคยทดลองใส่คำแนะนำเพิ่มเติมไว้ในไฟล์ Markdown แล้วให้ coding agent อ่านอยู่แล้ว
- AGENTS.md เป็นแพตเทิร์นที่ได้รับการยอมรับดี และสามารถใส่คำสั่งอย่าง “ให้อ่าน PDF.md ก่อนสร้าง PDF” ได้
แต่ ความเรียบง่ายที่เป็นหัวใจของการออกแบบ Skills นี่เอง คือเหตุผลที่ผู้เขียนรู้สึกตื่นเต้น
MCP มีทั้ง สเปกของโปรโตคอล เต็มรูปแบบ
- host, client, server, resource, prompt, tool, sampling, root, elicitation
- รวมถึงการขนส่ง 3 แบบ (stdio, streamable HTTP และเดิมคือ SSE)
ขณะที่ Skills มีเพียง Markdown + เมทาดาทา YAML เล็กน้อย + สคริปต์สำหรับรันแบบเลือกใช้
- มันใกล้กับธรรมชาติของ LLM มากกว่า คือโยนข้อความให้โมเดลแล้วปล่อยให้จัดการเอง
Skills โยนส่วนที่ยากไปให้ LLM harness และสภาพแวดล้อมคอมพิวเตอร์ที่เกี่ยวข้อง รับผิดชอบ
- เมื่อพิจารณาจากทุกสิ่งที่เราได้เรียนรู้ในช่วงไม่กี่ปีที่ผ่านมาเกี่ยวกับความสามารถของ LLM ในการเรียกใช้เครื่องมือ นี่ถือเป็นกลยุทธ์ที่ฉลาดมาก

12 ความคิดเห็น

shakespeares 2025-10-19

ผมก็สงสัยเหมือนกันว่าส่วนนี้จะนำไปประยุกต์ใช้ได้ตอนใช้ Claude Code สำหรับการเขียนโค้ดหรือเปล่า
ตอนนี้ก็ใส่ไกด์ไว้ใน Claude.md อยู่แล้ว และแยกไกด์รายละเอียดออกไปดำเนินการทีละส่วนครับ

labeldock 2025-10-19

ถ้าต้องการทำงานได้มากด้วยโทเค็นน้อย ๆ ผมรู้สึกว่าน่าจะแก้ได้อย่างเรียบง่ายกว่าด้วยการใช้มัลติเอเจนต์และการสรุป มากกว่าการทำ prompt optimization นะครับ ผมเห็นด้วยกับปัญหาที่ชี้มา แต่ก็รู้สึกว่าวิธีแก้นั้นยังมีข้อจำกัดอยู่

savvykang 2025-10-18

Skills ก็ใช้โทเค็นเหมือนกันไม่ใช่เหรอ? ถ้าเป็นอย่างนั้นก็ดูเหมือนว่าปัญหาเรื่องปริมาณการใช้โทเค็นจะเกิดขึ้นอีก แล้วตอนนั้นจะรับมือกันอย่างไร ผมก็ยังไม่ค่อยแน่ใจเหมือนกัน

dnjstmxhs 2025-10-19

ดูเหมือนว่าในคอนเท็กซ์จะไม่ได้ใส่ SKILLS.md ทั้งหมด แต่จะใส่เฉพาะส่วนชื่อและคำอธิบายด้านบนแบบด้านล่างนี้ไว้เสมอก่อน

name: skill-creator
description: คู่มือสำหรับการสร้าง skills ที่มีประสิทธิภาพ skill นี้ควรถูกใช้เมื่อผู้ใช้ต้องการสร้าง skill ใหม่ (หรืออัปเดต skill ที่มีอยู่) ที่ขยายความสามารถของ Claude ด้วยความรู้เฉพาะทาง เวิร์กโฟลว์ หรือการผสานรวมเครื่องมือ
license: เงื่อนไขทั้งหมดอยู่ใน LICENSE.txt

ds2ilz 2025-10-18

เวลาทำงานด้วย Claude Code เรามักต้องป้อนคำสั่งหรือกฎต่าง ๆ เข้าไปเป็นคอนเท็กซ์อยู่เรื่อย ๆ สุดท้ายก็ต้องคอยชั่งใจระหว่างปริมาณโทเคนที่ใช้กับคอนเท็กซ์ที่มีอยู่ครับ แล้วผมก็คิดวิธีขึ้นมาได้ คือสร้างโฟลเดอร์ไว้ แล้วใส่รายละเอียดเชิงลึกเป็นไฟล์ .md แยกตามฟังก์ชัน ส่วนใน claude.md ก็ใส่แค่พอยน์เตอร์เยอะ ๆ ว่าถ้าจะทำอะไรให้ไปดูอะไร วิธีนี้ทำงานได้ดีทีเดียวในต้นทุนที่ค่อนข้างต่ำ ถ้า skills ก็คือการเอาสิ่งพวกนี้มารวมไว้ สุดท้ายก็น่าจะใช้งานได้ดีไม่น้อยเลย

laeyoung 2025-10-19

แล้วถ้ามี skills marketplace ออกมาตามที่ประกาศไว้จริง ก็รู้สึกว่าน่าจะโอเคพอสมควรเลยนะ แค่ดาวน์โหลด skill ที่จำเป็นมาแล้วเปิดใช้งานตอนที่ต้องใช้

shakespeares 2025-10-19

โอ ขอบคุณสำหรับคำอธิบายประเด็นสำคัญครับ

2025-10-18

[ความคิดเห็นนี้ถูกซ่อน]