- Skill คือโฟลเดอร์ที่ประกอบด้วยไฟล์ Markdown และทรัพยากรเสริมแบบเลือกได้ เป็นโครงสร้างที่ทำให้ LLM สำรวจระบบไฟล์เพื่อทำงานตามความสามารถได้
- ในสภาพแวดล้อม Code Interpreter ของ ChatGPT มีการเพิ่มโฟลเดอร์
/home/oai/skills ซึ่งมีสกิลสำหรับจัดการสเปรดชีต, DOCX และ PDF
- สกิล PDF จะ แปลงเอกสารเป็น PNG แยกตามหน้าแล้ววิเคราะห์ด้วยโมเดลด้านวิชัน เพื่อคงข้อมูลเลย์เอาต์และกราฟิกไว้
- ใน Codex CLI ก็มีการเพิ่มฟีเจอร์สกิลแบบทดลองโดยอิงกับโฟลเดอร์
~/.codex/skills ทำให้ผู้ใช้เขียนและใช้งานสกิลเองได้
- โครงสร้างสกิลที่มีสเปกขนาดเบานี้ช่วยเพิ่ม การทำงานร่วมกันระหว่างเครื่องมือ AI และมีการตั้งคำถามถึงความจำเป็นในการทำให้เป็นมาตรฐานในอนาคต
ฟีเจอร์สกิลภายใน ChatGPT
- พบโฟลเดอร์
/home/oai/skills ในสภาพแวดล้อม Code Interpreter ของ ChatGPT
- Elias Judin เป็นผู้พบสิ่งนี้ก่อนเป็นคนแรก และหากพิมพ์พรอมป์ต์
Create a zip file of /home/oai/skills ก็สามารถบีบอัดและดาวน์โหลดเนื้อหาในโฟลเดอร์ได้
- Simon Willison ได้ลองทำด้วยตัวเอง เผยแพร่ไฟล์ ZIP และจัดทำเว็บ UI สำหรับสำรวจเนื้อหาดังกล่าว
- สกิลที่รวมมาเกี่ยวข้องกับ สเปรดชีต, DOCX, PDF
- สกิล PDF และเอกสารใช้วิธี เรนเดอร์ไฟล์เป็น PNG แยกตามหน้าแล้วส่งให้โมเดลวิชัน เพื่อคงข้อมูลเลย์เอาต์ที่อาจสูญหายไปหากดึงเฉพาะข้อความอย่างเดียว
- Elias Judin แชร์สำเนาของสกิลไว้บน GitHub ซึ่งมีโครงสร้างคล้ายกับรีโพ
anthropics/skills ของ Anthropic
- เมื่อขอให้ ChatGPT “สร้าง PDF สรุปสถานการณ์ของต้น rimu และฤดูผสมพันธุ์ของ kakapo” โมเดล GPT-5.2 จะ อ้างอิง
skill.md เพื่ออ่านคำแนะนำการสร้าง PDF แล้วค้นหาข้อมูลที่เกี่ยวข้องก่อนสร้าง PDF
- ใช้เวลาราว 11 นาที และเมื่อฟอนต์ไม่รองรับอักขระ macron ก็สลับไปใช้ฟอนต์อื่นโดยอัตโนมัติ แสดงให้เห็นถึง เวิร์กโฟลว์แบบตรวจสอบตนเอง
การรองรับสกิลใน Codex CLI
- มีการรวม PR ที่เพิ่มการรองรับ
skills.md เข้าไปในเครื่องมือโอเพนซอร์ส Codex CLI ของ OpenAI
- ตามเอกสาร แต่ละไดเรกทอรีภายในโฟลเดอร์
~/.codex/skills จะถูกมองว่าเป็นสกิล
- โค้ดที่เกี่ยวข้องถูกติดตั้งไว้ที่
codex-rs/core/src/skills/render.rs
- Simon Willison ใช้ ความสามารถในการเขียนสกิลของ Claude Opus 4.5 เพื่อสร้างสกิลสำหรับสร้างปลั๊กอิน Datasette แล้วติดตั้งลงใน Codex CLI
- สามารถเปิดใช้ฟีเจอร์สกิลได้ด้วยคำสั่ง
codex --enable skills -m gpt-5.2 และตรวจสอบรายการสกิลที่ติดตั้งด้วยคำสั่ง list skills
- Codex รู้จักสกิล “เขียนปลั๊กอิน Datasette” และสร้างโค้ดปลั๊กอินที่เพิ่มหน้า / - /cowsay?text=hello ให้โดยอัตโนมัติตามคำขอ
- โค้ดที่สร้างถูกเผยแพร่บน GitHub และสามารถรันได้โดยตรงด้วยคำสั่ง
uvx
ความสำคัญของแนวคิดเรื่องสกิล
- หลังจากมีการเปิดตัว Claude Skills ในเดือนตุลาคม 2025 OpenAI ก็ผสานแนวคิดนี้เข้ากับ ChatGPT และ Codex ภายในเวลาเพียงสองเดือน
- สกิลประกอบด้วย สเปกที่เรียบง่ายมาก แต่สามารถทำหน้าที่เป็น หน่วยการทำงานที่แชร์กันได้ ระหว่างเครื่องมือ AI หลายประเภท
- ผู้เขียนระบุว่าโครงสร้างนี้ควรถูกจัดทำเอกสารอย่างเป็นทางการผ่านองค์กรอย่าง Agentic AI Foundation
- การนำไปใช้ของ OpenAI ถูกมองว่าเป็นตัวอย่างที่เพิ่มโอกาสของการทำให้ มาตรฐานด้านการทำงานร่วมกันของ AI บนฐานสกิล เกิดขึ้นจริง
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
น่าทึ่งที่ Anthropic ยังคงปล่อย นวัตกรรมที่เรียบง่ายแต่เข้าใจได้ทันที ออกมาอย่างต่อเนื่อง
MCP แทบจะเรียกว่าเป็นโปรโตคอลยังไม่ได้ด้วยซ้ำ แต่ Skills แม้จะเป็นเพียงไฟล์ md ธรรมดา ก็ยังแสดงให้เห็นว่า ความสามารถในการวางกรอบแนวคิด ของพวกเขาโดดเด่นมาก
ณ วันนี้มีการส่ง คำเตือนแบบเปิดเผย ไปยังผู้สมัครสมาชิก OpenAI Plus
แม้จะโฆษณา context 196k tokens แต่ในความเป็นจริง จะถูกตัดเมื่อป้อนเกิน 50,000 tokens
ตอน GPT-5.0 ก่อนหน้านี้ก็มีปัญหาเดียวกัน และครั้งนี้ก็เกิดขึ้นอีก
ดู ลิงก์คู่มือช่วยเหลืออย่างเป็นทางการ
ระหว่างเขียนโพสต์นี้ รู้สึกดีที่ได้พูดถึงข่าว ฤดูผสมพันธุ์ของ Kākāpō ไปด้วย
(ไม่ได้เขียนแต่เรื่องนกกระทุงอย่างเดียว)
แต่ก็อาจถูกนำไปใช้ผิดทางได้ จึงเข้าใจได้ว่าฝั่งบริษัทอาจระมัดระวัง
เลยสงสัยว่าเคยลองใช้กับ local LLM บ้างหรือยัง
แนวคิดของ “Skill” ยังไม่ชัดเจนนัก
เหมือนจะเป็นแค่ เครื่องมือจัดการคอนเท็กซ์ หรือเปล่า จึงถามว่าควรเข้าใจว่าเป็นโครงสร้างที่โมเดลจะอ่านคำอธิบาย แล้วถ้าตัดสินใจว่าจำเป็นก็จะโหลดสคริปต์หรือเอกสารที่เกี่ยวข้องเข้ามาใช่หรือไม่
เช่น: “ใช้ Image Manipulation skill เพื่อสร้างไอคอนจาก image.png”
และบางครั้งก็ให้ Claude เขียน skill ของตัวเอง ด้วย เทมเพลต skill ของฉันเปิดเผยไว้ที่ GitHub
โครงสร้างแบบนี้ให้ความรู้สึกเหมือน ปรัชญา UNIX ที่มีเครื่องมือเล็ก ๆ เชื่อมต่อกันเป็น pipeline
ฉันมักจะสั่งแบบชัดเจนว่า “โหลด wireframe-skill แล้วทำ X”
และรู้สึกว่าการโหลด reference ทั้งหมดในครั้งเดียวแม่นยำกว่าการทำ progressive loading
โดยเฉพาะ debugging skill ช่วยป้องกันไม่ให้ AI ติดลูป
มองในเชิงเทคนิค skill ก็คือ ระบบ prompt injection แบบอัตโนมัติ
เป็นรูปแบบที่ทำให้สิ่งที่แอป AI wrapper ส่วนใหญ่ทำอยู่เรียบง่ายลง (prompt injection + RAG + MCP)
ฝากขอบคุณ @simonw ที่ใส่ alt text ให้ภาพเสมอ
ถามว่ามี ความต่างเชิงพื้นฐาน ระหว่าง Skill กับ Tool หรือไม่ และสงสัยว่าสามารถสร้าง skill สั้น ๆ เพื่อใช้แทน tool ได้หรือเปล่า
ถ้าอยากใช้ skill กับโมเดลอื่นด้วย (เช่น Gemini CLI) สามารถใช้ open-skills ที่ฉันทำไว้ได้
แต่ ต้องใช้ Mac และรันใน local container โดยไม่พึ่งพาคลาวด์
มีการเผยแพร่วิดีโอ อธิบายปรัชญาการออกแบบ Skills ของ Anthropic
ดู ลิงก์ YouTube
โครงสร้างที่ซับซ้อนขึ้นเรื่อย ๆ ทำให้ สับสน
เมื่อก่อนใช้ agents.md เพื่อขยายคอนเท็กซ์ ตอนนี้กลับต้องเพิ่มไฟล์ md อีกแบบหนึ่ง