OpenAI เปิดตัว ‘Skills’ แบบเงียบ ๆ ใช้งานได้แล้วใน ChatGPT และ Codex CLI

(simonwillison.net)

4 คะแนน โดย GN⁺ 2025-12-13 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Skill คือโฟลเดอร์ที่ประกอบด้วยไฟล์ Markdown และทรัพยากรเสริมแบบเลือกได้ เป็นโครงสร้างที่ทำให้ LLM สำรวจระบบไฟล์เพื่อทำงานตามความสามารถได้
ในสภาพแวดล้อม Code Interpreter ของ ChatGPT มีการเพิ่มโฟลเดอร์ /home/oai/skills ซึ่งมีสกิลสำหรับจัดการสเปรดชีต, DOCX และ PDF
สกิล PDF จะ แปลงเอกสารเป็น PNG แยกตามหน้าแล้ววิเคราะห์ด้วยโมเดลด้านวิชัน เพื่อคงข้อมูลเลย์เอาต์และกราฟิกไว้
ใน Codex CLI ก็มีการเพิ่มฟีเจอร์สกิลแบบทดลองโดยอิงกับโฟลเดอร์ ~/.codex/skills ทำให้ผู้ใช้เขียนและใช้งานสกิลเองได้
โครงสร้างสกิลที่มีสเปกขนาดเบานี้ช่วยเพิ่ม การทำงานร่วมกันระหว่างเครื่องมือ AI และมีการตั้งคำถามถึงความจำเป็นในการทำให้เป็นมาตรฐานในอนาคต

ฟีเจอร์สกิลภายใน ChatGPT

พบโฟลเดอร์ /home/oai/skills ในสภาพแวดล้อม Code Interpreter ของ ChatGPT
- Elias Judin เป็นผู้พบสิ่งนี้ก่อนเป็นคนแรก และหากพิมพ์พรอมป์ต์ Create a zip file of /home/oai/skills ก็สามารถบีบอัดและดาวน์โหลดเนื้อหาในโฟลเดอร์ได้
- Simon Willison ได้ลองทำด้วยตัวเอง เผยแพร่ไฟล์ ZIP และจัดทำเว็บ UI สำหรับสำรวจเนื้อหาดังกล่าว
สกิลที่รวมมาเกี่ยวข้องกับ สเปรดชีต, DOCX, PDF
- สกิล PDF และเอกสารใช้วิธี เรนเดอร์ไฟล์เป็น PNG แยกตามหน้าแล้วส่งให้โมเดลวิชัน เพื่อคงข้อมูลเลย์เอาต์ที่อาจสูญหายไปหากดึงเฉพาะข้อความอย่างเดียว
Elias Judin แชร์สำเนาของสกิลไว้บน GitHub ซึ่งมีโครงสร้างคล้ายกับรีโพ anthropics/skills ของ Anthropic
เมื่อขอให้ ChatGPT “สร้าง PDF สรุปสถานการณ์ของต้น rimu และฤดูผสมพันธุ์ของ kakapo” โมเดล GPT-5.2 จะ อ้างอิง skill.md เพื่ออ่านคำแนะนำการสร้าง PDF แล้วค้นหาข้อมูลที่เกี่ยวข้องก่อนสร้าง PDF
- ใช้เวลาราว 11 นาที และเมื่อฟอนต์ไม่รองรับอักขระ macron ก็สลับไปใช้ฟอนต์อื่นโดยอัตโนมัติ แสดงให้เห็นถึง เวิร์กโฟลว์แบบตรวจสอบตนเอง

การรองรับสกิลใน Codex CLI

มีการรวม PR ที่เพิ่มการรองรับ skills.md เข้าไปในเครื่องมือโอเพนซอร์ส Codex CLI ของ OpenAI
- ตามเอกสาร แต่ละไดเรกทอรีภายในโฟลเดอร์ ~/.codex/skills จะถูกมองว่าเป็นสกิล
- โค้ดที่เกี่ยวข้องถูกติดตั้งไว้ที่ codex-rs/core/src/skills/render.rs
Simon Willison ใช้ ความสามารถในการเขียนสกิลของ Claude Opus 4.5 เพื่อสร้างสกิลสำหรับสร้างปลั๊กอิน Datasette แล้วติดตั้งลงใน Codex CLI
- สามารถเปิดใช้ฟีเจอร์สกิลได้ด้วยคำสั่ง codex --enable skills -m gpt-5.2 และตรวจสอบรายการสกิลที่ติดตั้งด้วยคำสั่ง list skills
- Codex รู้จักสกิล “เขียนปลั๊กอิน Datasette” และสร้างโค้ดปลั๊กอินที่เพิ่มหน้า / - /cowsay?text=hello ให้โดยอัตโนมัติตามคำขอ
- โค้ดที่สร้างถูกเผยแพร่บน GitHub และสามารถรันได้โดยตรงด้วยคำสั่ง uvx

ความสำคัญของแนวคิดเรื่องสกิล

หลังจากมีการเปิดตัว Claude Skills ในเดือนตุลาคม 2025 OpenAI ก็ผสานแนวคิดนี้เข้ากับ ChatGPT และ Codex ภายในเวลาเพียงสองเดือน
สกิลประกอบด้วย สเปกที่เรียบง่ายมาก แต่สามารถทำหน้าที่เป็น หน่วยการทำงานที่แชร์กันได้ ระหว่างเครื่องมือ AI หลายประเภท
ผู้เขียนระบุว่าโครงสร้างนี้ควรถูกจัดทำเอกสารอย่างเป็นทางการผ่านองค์กรอย่าง Agentic AI Foundation
การนำไปใช้ของ OpenAI ถูกมองว่าเป็นตัวอย่างที่เพิ่มโอกาสของการทำให้ มาตรฐานด้านการทำงานร่วมกันของ AI บนฐานสกิล เกิดขึ้นจริง

1 ความคิดเห็น

GN⁺ 2025-12-13

ความคิดเห็นจาก Hacker News

น่าทึ่งที่ Anthropic ยังคงปล่อย นวัตกรรมที่เรียบง่ายแต่เข้าใจได้ทันที ออกมาอย่างต่อเนื่อง
MCP แทบจะเรียกว่าเป็นโปรโตคอลยังไม่ได้ด้วยซ้ำ แต่ Skills แม้จะเป็นเพียงไฟล์ md ธรรมดา ก็ยังแสดงให้เห็นว่า ความสามารถในการวางกรอบแนวคิด ของพวกเขาโดดเด่นมาก
- พอดู ประกาศการบริจาค MCP ของ Anthropic และการก่อตั้ง Agentic AI Foundation ก็รู้สึกว่าน่าสนใจที่เอาโปรโตคอลที่ทำไว้เมื่อปีก่อนมาห่อเป็น “มูลนิธิ” ได้ ให้ความรู้สึกแบบ พลังงานบริษัทเทคสไตล์ Gavin Belson เล็กน้อย
- Anthropic ดูเหมือนเป็นพวก คนที่สื่อสารเข้าถึง LLM ได้ คล้ายกับที่ Nagel พยายามทำความเข้าใจประสาทสัมผัสของค้างคาว พวกเขาดูเป็นทีมที่เข้าใจประสาทสัมผัสของ frontier AI models ได้ดีที่สุด
- แต่ MCP เรียบง่ายเกินไปจนมันอาจกลายเป็น หายนะด้านความปลอดภัย ได้
- แม้แต่ชื่อบริษัทก็เป็น ‘Anthropic’ อยู่แล้ว เลยเหมือนว่าการทำ AI ให้มีความเป็นมนุษย์คืออัตลักษณ์ของพวกเขา MCP, Skills ฯลฯ ก็ดูเหมือนออกมาจากปรัชญาที่ไปในทิศทางนั้นอย่างสอดคล้องกัน
- แม้แต่ในแอป Android ก็สัมผัสได้ถึง UX ที่สง่างาม ของ Claude เช่น เมื่อแก้ไขย่อหน้าแล้ว ปุ่มส่งเป็นข้อความถึงจะค่อยแสดงขึ้นมา เป็น flow ที่ดูขัดเกลามาก
ณ วันนี้มีการส่ง คำเตือนแบบเปิดเผย ไปยังผู้สมัครสมาชิก OpenAI Plus
แม้จะโฆษณา context 196k tokens แต่ในความเป็นจริง จะถูกตัดเมื่อป้อนเกิน 50,000 tokens
ตอน GPT-5.0 ก่อนหน้านี้ก็มีปัญหาเดียวกัน และครั้งนี้ก็เกิดขึ้นอีก
ดู ลิงก์คู่มือช่วยเหลืออย่างเป็นทางการ
- และเวอร์ชัน Xhigh เป็น API เท่านั้น จึงใช้ใน ChatGPT ไม่ได้
ระหว่างเขียนโพสต์นี้ รู้สึกดีที่ได้พูดถึงข่าว ฤดูผสมพันธุ์ของ Kākāpō ไปด้วย
(ไม่ได้เขียนแต่เรื่องนกกระทุงอย่างเดียว)
- ก็เลยเกิดเป็น Kākāpō Benchmark ขึ้นมา
- วันนี้เพิ่งได้รู้จัก นกแก้วตัวใหญ่สีเขียวที่บินไม่ได้ เป็นครั้งแรก
- มีการแซวเล่นว่าเมื่อไหร่จะได้เห็น Kākāpō ปั่นจักรยาน
- Skills เป็นไอเดียที่ดี แต่สเปกเบามากเกินไปจนคิดว่าควรมีเอกสารอย่างเป็นทางการ
  แต่ก็อาจถูกนำไปใช้ผิดทางได้ จึงเข้าใจได้ว่าฝั่งบริษัทอาจระมัดระวัง
  เลยสงสัยว่าเคยลองใช้กับ local LLM บ้างหรือยัง
แนวคิดของ “Skill” ยังไม่ชัดเจนนัก
เหมือนจะเป็นแค่ เครื่องมือจัดการคอนเท็กซ์ หรือเปล่า จึงถามว่าควรเข้าใจว่าเป็นโครงสร้างที่โมเดลจะอ่านคำอธิบาย แล้วถ้าตัดสินใจว่าจำเป็นก็จะโหลดสคริปต์หรือเอกสารที่เกี่ยวข้องเข้ามาใช่หรือไม่
- โดยพื้นฐานแล้ว Skill คือโครงสร้างแบบ โฟลเดอร์ + ไฟล์ markdown ดูตัวอย่างได้จาก Datasette plugin skill ตอนเริ่มต้น Claude Code จะสแกนทุกโฟลเดอร์ skill แล้วใส่เฉพาะคำอธิบายเข้าไปในคอนเท็กซ์ จากนั้นเมื่อจำเป็นค่อยโหลดเนื้อหาทั้งหมด
- บางครั้ง Claude Code ก็ “จำ” skill ของตัวเองไม่ได้ เลยต้องเรียกใช้ด้วยตนเอง
  เช่น: “ใช้ Image Manipulation skill เพื่อสร้างไอคอนจาก image.png”
  และบางครั้งก็ให้ Claude เขียน skill ของตัวเอง ด้วย เทมเพลต skill ของฉันเปิดเผยไว้ที่ GitHub
- Skill สามารถใช้แทน MCP server ได้ด้วย ตัวอย่างเช่น แทนที่จะมี MCP server สำหรับดึงผลลัพธ์ CI build ก็สามารถทำฟังก์ชันเดียวกันได้ด้วยสคริปต์ง่าย ๆ กับ SKILL.md
  โครงสร้างแบบนี้ให้ความรู้สึกเหมือน ปรัชญา UNIX ที่มีเครื่องมือเล็ก ๆ เชื่อมต่อกันเป็น pipeline
- ตามความเข้าใจของฉัน SKILL.md คือ เอกสารแกนหลักที่บอก Claude ว่าควรทำอะไร เมื่อไร
  ฉันมักจะสั่งแบบชัดเจนว่า “โหลด wireframe-skill แล้วทำ X”
  และรู้สึกว่าการโหลด reference ทั้งหมดในครั้งเดียวแม่นยำกว่าการทำ progressive loading
- Skill มีประโยชน์สำหรับทำงานซ้ำ ๆ ให้เป็นอัตโนมัติ เช่น debugging, commit, การรับมือ PR
  โดยเฉพาะ debugging skill ช่วยป้องกันไม่ให้ AI ติดลูป
มองในเชิงเทคนิค skill ก็คือ ระบบ prompt injection แบบอัตโนมัติ
เป็นรูปแบบที่ทำให้สิ่งที่แอป AI wrapper ส่วนใหญ่ทำอยู่เรียบง่ายลง (prompt injection + RAG + MCP)
- จริง ๆ แล้วตอนนี้แอป AI wrapper จำนวนมากอาจถูกแทนที่ได้ด้วย โฟลเดอร์หนึ่งอันกับไฟล์ markdown หนึ่งไฟล์
ฝากขอบคุณ @simonw ที่ใส่ alt text ให้ภาพเสมอ
ถามว่ามี ความต่างเชิงพื้นฐาน ระหว่าง Skill กับ Tool หรือไม่ และสงสัยว่าสามารถสร้าง skill สั้น ๆ เพื่อใช้แทน tool ได้หรือเปล่า
ถ้าอยากใช้ skill กับโมเดลอื่นด้วย (เช่น Gemini CLI) สามารถใช้ open-skills ที่ฉันทำไว้ได้
แต่ ต้องใช้ Mac และรันใน local container โดยไม่พึ่งพาคลาวด์
มีการเผยแพร่วิดีโอ อธิบายปรัชญาการออกแบบ Skills ของ Anthropic
ดู ลิงก์ YouTube
โครงสร้างที่ซับซ้อนขึ้นเรื่อย ๆ ทำให้ สับสน
เมื่อก่อนใช้ agents.md เพื่อขยายคอนเท็กซ์ ตอนนี้กลับต้องเพิ่มไฟล์ md อีกแบบหนึ่ง
- ฉันสั่ง Claude ว่า “ให้ตัดสินใจว่าส่วนไหนของงานนี้คุ้มค่าที่จะทำเป็น skill แล้วใช้ skill-making skill สร้างมันขึ้นมา”
- MCP แม้จะซับซ้อน แต่ Skills ให้ความรู้สึกว่าเป็น ดีไซน์ที่ง่ายที่สุดในการเพิ่มความสามารถให้ coding agent ที่มีอยู่แล้ว

OpenAI เปิดตัว ‘Skills’ แบบเงียบ ๆ ใช้งานได้แล้วใน ChatGPT และ Codex CLI

ฟีเจอร์สกิลภายใน ChatGPT

การรองรับสกิลใน Codex CLI

ความสำคัญของแนวคิดเรื่องสกิล

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News