4 คะแนน โดย GN⁺ 2025-12-13 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Skill คือโฟลเดอร์ที่ประกอบด้วยไฟล์ Markdown และทรัพยากรเสริมแบบเลือกได้ เป็นโครงสร้างที่ทำให้ LLM สำรวจระบบไฟล์เพื่อทำงานตามความสามารถได้
  • ในสภาพแวดล้อม Code Interpreter ของ ChatGPT มีการเพิ่มโฟลเดอร์ /home/oai/skills ซึ่งมีสกิลสำหรับจัดการสเปรดชีต, DOCX และ PDF
  • สกิล PDF จะ แปลงเอกสารเป็น PNG แยกตามหน้าแล้ววิเคราะห์ด้วยโมเดลด้านวิชัน เพื่อคงข้อมูลเลย์เอาต์และกราฟิกไว้
  • ใน Codex CLI ก็มีการเพิ่มฟีเจอร์สกิลแบบทดลองโดยอิงกับโฟลเดอร์ ~/.codex/skills ทำให้ผู้ใช้เขียนและใช้งานสกิลเองได้
  • โครงสร้างสกิลที่มีสเปกขนาดเบานี้ช่วยเพิ่ม การทำงานร่วมกันระหว่างเครื่องมือ AI และมีการตั้งคำถามถึงความจำเป็นในการทำให้เป็นมาตรฐานในอนาคต

ฟีเจอร์สกิลภายใน ChatGPT

  • พบโฟลเดอร์ /home/oai/skills ในสภาพแวดล้อม Code Interpreter ของ ChatGPT
    • Elias Judin เป็นผู้พบสิ่งนี้ก่อนเป็นคนแรก และหากพิมพ์พรอมป์ต์ Create a zip file of /home/oai/skills ก็สามารถบีบอัดและดาวน์โหลดเนื้อหาในโฟลเดอร์ได้
    • Simon Willison ได้ลองทำด้วยตัวเอง เผยแพร่ไฟล์ ZIP และจัดทำเว็บ UI สำหรับสำรวจเนื้อหาดังกล่าว
  • สกิลที่รวมมาเกี่ยวข้องกับ สเปรดชีต, DOCX, PDF
    • สกิล PDF และเอกสารใช้วิธี เรนเดอร์ไฟล์เป็น PNG แยกตามหน้าแล้วส่งให้โมเดลวิชัน เพื่อคงข้อมูลเลย์เอาต์ที่อาจสูญหายไปหากดึงเฉพาะข้อความอย่างเดียว
  • Elias Judin แชร์สำเนาของสกิลไว้บน GitHub ซึ่งมีโครงสร้างคล้ายกับรีโพ anthropics/skills ของ Anthropic
  • เมื่อขอให้ ChatGPT “สร้าง PDF สรุปสถานการณ์ของต้น rimu และฤดูผสมพันธุ์ของ kakapo” โมเดล GPT-5.2 จะ อ้างอิง skill.md เพื่ออ่านคำแนะนำการสร้าง PDF แล้วค้นหาข้อมูลที่เกี่ยวข้องก่อนสร้าง PDF
    • ใช้เวลาราว 11 นาที และเมื่อฟอนต์ไม่รองรับอักขระ macron ก็สลับไปใช้ฟอนต์อื่นโดยอัตโนมัติ แสดงให้เห็นถึง เวิร์กโฟลว์แบบตรวจสอบตนเอง

การรองรับสกิลใน Codex CLI

  • มีการรวม PR ที่เพิ่มการรองรับ skills.md เข้าไปในเครื่องมือโอเพนซอร์ส Codex CLI ของ OpenAI
    • ตามเอกสาร แต่ละไดเรกทอรีภายในโฟลเดอร์ ~/.codex/skills จะถูกมองว่าเป็นสกิล
    • โค้ดที่เกี่ยวข้องถูกติดตั้งไว้ที่ codex-rs/core/src/skills/render.rs
  • Simon Willison ใช้ ความสามารถในการเขียนสกิลของ Claude Opus 4.5 เพื่อสร้างสกิลสำหรับสร้างปลั๊กอิน Datasette แล้วติดตั้งลงใน Codex CLI
    • สามารถเปิดใช้ฟีเจอร์สกิลได้ด้วยคำสั่ง codex --enable skills -m gpt-5.2 และตรวจสอบรายการสกิลที่ติดตั้งด้วยคำสั่ง list skills
    • Codex รู้จักสกิล “เขียนปลั๊กอิน Datasette” และสร้างโค้ดปลั๊กอินที่เพิ่มหน้า / - /cowsay?text=hello ให้โดยอัตโนมัติตามคำขอ
    • โค้ดที่สร้างถูกเผยแพร่บน GitHub และสามารถรันได้โดยตรงด้วยคำสั่ง uvx

ความสำคัญของแนวคิดเรื่องสกิล

  • หลังจากมีการเปิดตัว Claude Skills ในเดือนตุลาคม 2025 OpenAI ก็ผสานแนวคิดนี้เข้ากับ ChatGPT และ Codex ภายในเวลาเพียงสองเดือน
  • สกิลประกอบด้วย สเปกที่เรียบง่ายมาก แต่สามารถทำหน้าที่เป็น หน่วยการทำงานที่แชร์กันได้ ระหว่างเครื่องมือ AI หลายประเภท
  • ผู้เขียนระบุว่าโครงสร้างนี้ควรถูกจัดทำเอกสารอย่างเป็นทางการผ่านองค์กรอย่าง Agentic AI Foundation
  • การนำไปใช้ของ OpenAI ถูกมองว่าเป็นตัวอย่างที่เพิ่มโอกาสของการทำให้ มาตรฐานด้านการทำงานร่วมกันของ AI บนฐานสกิล เกิดขึ้นจริง

1 ความคิดเห็น

 
GN⁺ 2025-12-13
ความคิดเห็นจาก Hacker News
  • น่าทึ่งที่ Anthropic ยังคงปล่อย นวัตกรรมที่เรียบง่ายแต่เข้าใจได้ทันที ออกมาอย่างต่อเนื่อง
    MCP แทบจะเรียกว่าเป็นโปรโตคอลยังไม่ได้ด้วยซ้ำ แต่ Skills แม้จะเป็นเพียงไฟล์ md ธรรมดา ก็ยังแสดงให้เห็นว่า ความสามารถในการวางกรอบแนวคิด ของพวกเขาโดดเด่นมาก

    • พอดู ประกาศการบริจาค MCP ของ Anthropic และการก่อตั้ง Agentic AI Foundation ก็รู้สึกว่าน่าสนใจที่เอาโปรโตคอลที่ทำไว้เมื่อปีก่อนมาห่อเป็น “มูลนิธิ” ได้ ให้ความรู้สึกแบบ พลังงานบริษัทเทคสไตล์ Gavin Belson เล็กน้อย
    • Anthropic ดูเหมือนเป็นพวก คนที่สื่อสารเข้าถึง LLM ได้ คล้ายกับที่ Nagel พยายามทำความเข้าใจประสาทสัมผัสของค้างคาว พวกเขาดูเป็นทีมที่เข้าใจประสาทสัมผัสของ frontier AI models ได้ดีที่สุด
    • แต่ MCP เรียบง่ายเกินไปจนมันอาจกลายเป็น หายนะด้านความปลอดภัย ได้
    • แม้แต่ชื่อบริษัทก็เป็น ‘Anthropic’ อยู่แล้ว เลยเหมือนว่าการทำ AI ให้มีความเป็นมนุษย์คืออัตลักษณ์ของพวกเขา MCP, Skills ฯลฯ ก็ดูเหมือนออกมาจากปรัชญาที่ไปในทิศทางนั้นอย่างสอดคล้องกัน
    • แม้แต่ในแอป Android ก็สัมผัสได้ถึง UX ที่สง่างาม ของ Claude เช่น เมื่อแก้ไขย่อหน้าแล้ว ปุ่มส่งเป็นข้อความถึงจะค่อยแสดงขึ้นมา เป็น flow ที่ดูขัดเกลามาก
  • ณ วันนี้มีการส่ง คำเตือนแบบเปิดเผย ไปยังผู้สมัครสมาชิก OpenAI Plus
    แม้จะโฆษณา context 196k tokens แต่ในความเป็นจริง จะถูกตัดเมื่อป้อนเกิน 50,000 tokens
    ตอน GPT-5.0 ก่อนหน้านี้ก็มีปัญหาเดียวกัน และครั้งนี้ก็เกิดขึ้นอีก
    ดู ลิงก์คู่มือช่วยเหลืออย่างเป็นทางการ

    • และเวอร์ชัน Xhigh เป็น API เท่านั้น จึงใช้ใน ChatGPT ไม่ได้
  • ระหว่างเขียนโพสต์นี้ รู้สึกดีที่ได้พูดถึงข่าว ฤดูผสมพันธุ์ของ Kākāpō ไปด้วย
    (ไม่ได้เขียนแต่เรื่องนกกระทุงอย่างเดียว)

    • ก็เลยเกิดเป็น Kākāpō Benchmark ขึ้นมา
    • วันนี้เพิ่งได้รู้จัก นกแก้วตัวใหญ่สีเขียวที่บินไม่ได้ เป็นครั้งแรก
    • มีการแซวเล่นว่าเมื่อไหร่จะได้เห็น Kākāpō ปั่นจักรยาน
    • Skills เป็นไอเดียที่ดี แต่สเปกเบามากเกินไปจนคิดว่าควรมีเอกสารอย่างเป็นทางการ
      แต่ก็อาจถูกนำไปใช้ผิดทางได้ จึงเข้าใจได้ว่าฝั่งบริษัทอาจระมัดระวัง
      เลยสงสัยว่าเคยลองใช้กับ local LLM บ้างหรือยัง
  • แนวคิดของ “Skill” ยังไม่ชัดเจนนัก
    เหมือนจะเป็นแค่ เครื่องมือจัดการคอนเท็กซ์ หรือเปล่า จึงถามว่าควรเข้าใจว่าเป็นโครงสร้างที่โมเดลจะอ่านคำอธิบาย แล้วถ้าตัดสินใจว่าจำเป็นก็จะโหลดสคริปต์หรือเอกสารที่เกี่ยวข้องเข้ามาใช่หรือไม่

    • โดยพื้นฐานแล้ว Skill คือโครงสร้างแบบ โฟลเดอร์ + ไฟล์ markdown ดูตัวอย่างได้จาก Datasette plugin skill ตอนเริ่มต้น Claude Code จะสแกนทุกโฟลเดอร์ skill แล้วใส่เฉพาะคำอธิบายเข้าไปในคอนเท็กซ์ จากนั้นเมื่อจำเป็นค่อยโหลดเนื้อหาทั้งหมด
    • บางครั้ง Claude Code ก็ “จำ” skill ของตัวเองไม่ได้ เลยต้องเรียกใช้ด้วยตนเอง
      เช่น: “ใช้ Image Manipulation skill เพื่อสร้างไอคอนจาก image.png”
      และบางครั้งก็ให้ Claude เขียน skill ของตัวเอง ด้วย เทมเพลต skill ของฉันเปิดเผยไว้ที่ GitHub
    • Skill สามารถใช้แทน MCP server ได้ด้วย ตัวอย่างเช่น แทนที่จะมี MCP server สำหรับดึงผลลัพธ์ CI build ก็สามารถทำฟังก์ชันเดียวกันได้ด้วยสคริปต์ง่าย ๆ กับ SKILL.md
      โครงสร้างแบบนี้ให้ความรู้สึกเหมือน ปรัชญา UNIX ที่มีเครื่องมือเล็ก ๆ เชื่อมต่อกันเป็น pipeline
    • ตามความเข้าใจของฉัน SKILL.md คือ เอกสารแกนหลักที่บอก Claude ว่าควรทำอะไร เมื่อไร
      ฉันมักจะสั่งแบบชัดเจนว่า “โหลด wireframe-skill แล้วทำ X”
      และรู้สึกว่าการโหลด reference ทั้งหมดในครั้งเดียวแม่นยำกว่าการทำ progressive loading
    • Skill มีประโยชน์สำหรับทำงานซ้ำ ๆ ให้เป็นอัตโนมัติ เช่น debugging, commit, การรับมือ PR
      โดยเฉพาะ debugging skill ช่วยป้องกันไม่ให้ AI ติดลูป
  • มองในเชิงเทคนิค skill ก็คือ ระบบ prompt injection แบบอัตโนมัติ
    เป็นรูปแบบที่ทำให้สิ่งที่แอป AI wrapper ส่วนใหญ่ทำอยู่เรียบง่ายลง (prompt injection + RAG + MCP)

    • จริง ๆ แล้วตอนนี้แอป AI wrapper จำนวนมากอาจถูกแทนที่ได้ด้วย โฟลเดอร์หนึ่งอันกับไฟล์ markdown หนึ่งไฟล์
  • ฝากขอบคุณ @simonw ที่ใส่ alt text ให้ภาพเสมอ

  • ถามว่ามี ความต่างเชิงพื้นฐาน ระหว่าง Skill กับ Tool หรือไม่ และสงสัยว่าสามารถสร้าง skill สั้น ๆ เพื่อใช้แทน tool ได้หรือเปล่า

  • ถ้าอยากใช้ skill กับโมเดลอื่นด้วย (เช่น Gemini CLI) สามารถใช้ open-skills ที่ฉันทำไว้ได้
    แต่ ต้องใช้ Mac และรันใน local container โดยไม่พึ่งพาคลาวด์

  • มีการเผยแพร่วิดีโอ อธิบายปรัชญาการออกแบบ Skills ของ Anthropic
    ดู ลิงก์ YouTube

  • โครงสร้างที่ซับซ้อนขึ้นเรื่อย ๆ ทำให้ สับสน
    เมื่อก่อนใช้ agents.md เพื่อขยายคอนเท็กซ์ ตอนนี้กลับต้องเพิ่มไฟล์ md อีกแบบหนึ่ง

    • ฉันสั่ง Claude ว่า “ให้ตัดสินใจว่าส่วนไหนของงานนี้คุ้มค่าที่จะทำเป็น skill แล้วใช้ skill-making skill สร้างมันขึ้นมา”
    • MCP แม้จะซับซ้อน แต่ Skills ให้ความรู้สึกว่าเป็น ดีไซน์ที่ง่ายที่สุดในการเพิ่มความสามารถให้ coding agent ที่มีอยู่แล้ว