- เป็นข้อกำหนดที่สรุปความสามารถทางเทคนิคที่เว็บไซต์ที่ดีควรมีโดยไม่ขึ้นกับแพลตฟอร์ม ครอบคลุมตั้งแต่
<title> ไปจนถึง llms.txt
- ออกแบบมาสำหรับทั้งมนุษย์และ เอเจนต์ โดยอ้างอิงมาตรฐานเว็บสมัยใหม่ เช่น WHATWG, W3C, IETF RFCs, WCAG และ MDN
- ไม่ว่าจะเผยแพร่ด้วย WordPress, Next.js, แอป Django หรือ HTML ล้วน ๆ ตัวข้อกำหนดเองเหมือนกันทั้งหมด และยังมีคำแนะนำในการนำไปใช้รวมอยู่ด้วย
- หัวข้อทั้งหมดแบ่งเป็น 10 หมวด เช่น Foundations, SEO, Accessibility, Security, Performance และแมปกับมาตรฐานที่ได้รับการยอมรับอย่างกว้างขวาง
- มี เซิร์ฟเวอร์ MCP แบบสาธารณะ, Agent Skill,
/llms.txt และการตอบกลับแบบ Markdown เพื่อให้เอเจนต์และผู้ดูแลระบบใช้ในการตรวจสอบ เรียนรู้ และปรับปรุงได้
ข้อกำหนดอิสระจากแพลตฟอร์มสำหรับเว็บไซต์ที่ดี
- The Website Specification เป็นข้อกำหนดที่สรุปความสามารถทางเทคนิคที่เว็บไซต์ที่ดีควรมีโดยไม่ขึ้นกับแพลตฟอร์ม ครอบคลุมตั้งแต่
<title> ไปจนถึง /.well-known/security.txt, ความสอดคล้องกับ WCAG และ llms.txt
- ออกแบบมาสำหรับทั้งมนุษย์และเอเจนต์ โดยแต่ละหัวข้อเชื่อมโยงกับแหล่งมาตรฐานเว็บสมัยใหม่ เช่น WHATWG, W3C, IETF RFCs, WCAG, MDN
- ไม่ว่าจะเผยแพร่ด้วย WordPress, Drupal, TYPO3, Next.js, Astro, Hugo, แอป Django หรือ HTML ล้วน ๆ ตัวข้อกำหนดเองเหมือนกันทั้งหมด ส่วนคำแนะนำในการนำไปใช้จะตามมาภายหลัง
- ทุกหน้ามีลิงก์ Edit on GitHub สามารถส่ง PR ได้ และแต่ละหน้าจะแสดงแหล่งอ้างอิงไว้
-
ขอบเขตที่ครอบคลุม
- หัวข้อทั้งหมด แบ่งเป็น 10 หมวดที่แมปกับมาตรฐานที่ได้รับการยอมรับอย่างกว้างขวาง
- Foundations: 14 รายการ ครอบคลุม HTML, head และองค์ประกอบพื้นฐานของเอกสาร
- SEO: 13 รายการ รวมองค์ประกอบสำหรับการแสดงผลในการค้นหา เช่น
robots.txt, sitemap, canonical และ structured data
- Accessibility: 20 รายการ นำเสนอกฎที่อิงตาม WCAG เพื่อให้ผู้ใช้ทุกความสามารถสามารถใช้งานเว็บไซต์ได้
- Security: 12 รายการ ครอบคลุม header, การส่งข้อมูล และนโยบายเพื่อปกป้องผู้เยี่ยมชมอย่างปลอดภัย
- Well-Known URIs: 9 รายการ สรุปเส้นทางมาตรฐานที่ตกลงร่วมกันภายใต้
/.well-known/
- Agent Readiness: 18 รายการ ครอบคลุมองค์ประกอบที่ช่วยให้ AI เอเจนต์และครอว์เลอร์อ่านเว็บไซต์ได้
- Performance: 19 รายการ ครอบคลุม Core Web Vitals, caching, รูปภาพ, ฟอนต์ และพฤติกรรมเครือข่าย
- Privacy: 6 รายการ ครอบคลุมความยินยอม สัญญาณ และการเคารพตัวเลือกของผู้เยี่ยมชม
- Resilience: 5 รายการ ครอบคลุมการล้มเหลวอย่างนุ่มนวล เช่น หน้าข้อผิดพลาด ออฟไลน์ และการรีไดเรกต์
- Internationalisation: 12 รายการ ครอบคลุมภาษา โลแคล ทิศทาง และเนื้อหาที่แปลแล้ว
วิธีใช้งานสำหรับเอเจนต์และผู้ดูแลเว็บไซต์
- ข้อกำหนดทั้งหมดให้บริการผ่านเซิร์ฟเวอร์ MCP แบบสาธารณะ ที่อ่านได้อย่างเดียวและไม่ต้องยืนยันตัวตน
- มีการเผยแพร่ Agent Skill ที่อธิบายว่าเอเจนต์ที่เข้ากันได้ควรใช้ข้อกำหนดนี้เมื่อใดและอย่างไร
- URL ของข้อกำหนดแต่ละรายการสามารถให้ Markdown รายหน้าได้ผ่าน
/llms.txt และ Accept: text/markdown
- ตัวอย่างการตั้งค่าเซิร์ฟเวอร์ MCP มีดังนี้
{
"mcpServers": {
"specification-website": {
"transport": "http",
"url": "https://mcp.specification.website/mcp"
}
}
}
-
ขั้นตอนการใช้งาน
- Audit: ไล่ดูเช็กลิสต์ และตรวจแต่ละข้อว่า “เว็บไซต์ทำสิ่งนี้หรือไม่ — ใช่/ไม่ใช่”
- Learn: ตรวจดูในแต่ละข้อว่ามันคืออะไร ทำไมจึงสำคัญ และจะนำไปใช้อย่างไร
- Improve: หากพบส่วนที่ขาด ข้อมูลที่ล้าสมัย หรือหัวข้อที่ตกหล่น สามารถแนบแหล่งอ้างอิงแล้วเปิด PR ได้
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
Agent Readiness ดูมีโอกาสจะกลายเป็นอะไรที่น่าเขินในอนาคตแบบเดียวกับ "Web 4.0 Blockchain Integration"
ไม่ใช่เพราะเอเจนต์จะหมดความหมาย แต่เพราะต่อให้มันสำคัญขึ้นมาจริง ถ้าเว็บไซต์ต้องทำข้อยกเว้นพิเศษสำหรับเอเจนต์ก็เท่ากับทำลายเจตนารมณ์เดิม
สุดท้ายคงถูกเอาไปใช้โดยผู้ไม่หวังดีเพื่อทำให้สิ่งที่เอเจนต์เห็นต่างจากสิ่งที่คนเห็น และเพราะงั้นมันก็น่าจะถูกเพิกเฉยโดยตั้งใจ
ทุกวันนี้เว็บไซต์ทุกอย่างกลายเป็นคอมโพเนนต์หมด แม้แต่ dropdown ง่าย ๆ ที่มีรายการจำกัดก็ยังมี loader ของตัวเองและยิงคำขอ fetch 10 ครั้งแบบไม่มีเหตุผล ไม่ได้พูดเกินจริง แค่ไปดูเว็บ Instagram กับ Facebook ก็พอ
อยากโยนสเปกพวกนี้ทิ้งไปให้หมด แล้วขอแค่ HTML ต้นฉบับที่ไม่ถูกทำให้อ่านยากด้วยอะไรอย่าง React ที่คอยอ้างว่า JS framework ตัวใหม่จะมาเปลี่ยนเกม
โดยพื้นฐานแล้วเว็บเป็น สภาพแวดล้อมที่เป็นปฏิปักษ์ และคนที่ดูแลเว็บไซต์จำนวนมากก็มองได้ว่าเป็นผู้ไม่หวังดีเสียเอง การทำให้สิ่งที่คนเห็นกับสิ่งที่เอเจนต์เห็นต่างกันเป็นสิ่งที่เว็บจะตั้งใจใช้ เหมือนที่เคยทำกับเสิร์ชเอนจิน
เหตุผลที่ "Agent Readiness" น่าจะไปไม่รอดคือ ผู้ดูแลเว็บจะนึกออกในไม่ช้าว่าเอเจนต์ก็คือ การทำให้การเข้าถึงเป็นอัตโนมัติ นั่นเอง ซึ่งเป็นสิ่งที่พวกเขาสู้มาตลอดและเป็นภัยต่อความสามารถในการหารายได้
แต่ก็สงสัยว่าจะเกิดขึ้นจริงไหม ปัญหาผู้ไม่หวังดีนั้นเป็นไปได้มานานแล้ว เช่นให้คอนเทนต์กับ crawler ของเสิร์ชเอนจินไม่เหมือนกับสิ่งที่ผู้ใช้เห็นหลังคลิก ถ้าจำไม่ผิดเหมือน Google เคยลงโทษเว็บแบบนี้อยู่ช่วงหนึ่ง
https://frontendchecklist.io/rules
คนต้องการเว็บที่ดูดี ซึ่งทำได้แม้ด้วย HTML ล้วน เอเจนต์ไม่ต้องการแม้แต่ระดับนั้น และในอุดมคติแค่เห็นเนื้อหาหน้าเป็น Markdown ก็พอ
แล้วทำไมจะไม่มีเวอร์ชันสำหรับเอเจนต์ล่ะ? มันช่วยประหยัดเวลาและเงินทั้งของ client agent และโฮสต์เว็บไซต์
ถ้ามีมาตรฐานอย่าง llms.txt ที่ระบุได้ว่า "เอเจนต์ควรไปเยี่ยมชม mirror นี้แทน ซึ่งเป็นเวอร์ชัน Markdown ดิบของสิ่งที่มนุษย์เห็น" ก็คงดี
ความพร้อมสำหรับเอเจนต์บางส่วนของเว็บนี้ก็คือ SEO สำหรับ AI และในทางกลับกัน ถ้าเว็บไหนไม่ต้องการให้ AI crawl ก็ใช้ทำสิ่งตรงข้ามได้ด้วย
น่าจะมี แนวปฏิบัติที่ดี สำหรับส่วนอย่างฟอร์มล็อกอิน เช่น ใช้ชื่อฟิลด์มาตรฐานที่ตัวจัดการรหัสผ่านรู้จัก ปิด autocomplete และการเปลี่ยนอักษรตัวแรกเป็นตัวพิมพ์ใหญ่โดยอัตโนมัติสำหรับช่องล็อกอิน ใช้ HTML5 input type ที่ถูกต้องถ้าเป็นอีเมล หลีกเลี่ยงฟอร์มที่ให้กรอกแค่อีเมลก่อนแล้วต้องคลิกอีกครั้งเพื่อกรอกรหัสผ่าน และทำตาม NIST SP 800-53 โดยเลี่ยง 2FA ผ่าน SMS หรือข้อบังคับเปลี่ยนรหัสผ่านเป็นระยะ/กฎการผสมรหัสผ่านแบบสุ่ม เป็นต้น
มีเว็บไซต์มากเกินไปด้วยที่ไม่ตั้งโฟกัสอัตโนมัติให้กับฟอร์มที่มีช่องกรอกเพียงช่องเดียว
https://adamsilver.io/blog/form-design-from-zero-to-hero-all...
หลังจากนั้นเขาก็เขียนเพิ่มอีกเยอะ และมันอาจเป็นหนึ่งในแหล่งข้อมูล UX บนเว็บที่ดีที่สุด
ก่อนจะรับชื่อผู้ใช้เข้ามา คุณไม่มีทางรู้ได้ว่าผู้ใช้นั้นใช้รหัสผ่านหรือใช้วิธีอื่น
https://frontendchecklist.io/rules/html/input-types
เวลาจะสร้าง UI component ตั้งแต่ต้น ชอบเว็บนี้มากจริง ๆ
https://component.gallery/
มันลิงก์ไปยังคอมโพเนนต์จากหลาย design system ซึ่งหลายอันก็ครอบคลุมแนวทางอย่าง accessibility และ internationalization ไว้อย่างลึกซึ้งด้วย ตัวอย่างที่เอกสารดีเป็นพิเศษคือ Lightning Design System ของ Salesforce และ Stacks ของ StackOverflow
https://www.lightningdesignsystem.com/2e1ef8501/p/99642e-car...
https://stackoverflow.design/system/forms/checkbox
ผลคือเว็บไซต์ส่วนใหญ่ไม่มองว่าสิ่งนี้สำคัญ หรือไม่รู้ด้วยซ้ำว่าควรต้องทำ สุดท้ายเลยออกมาเป็นสภาพแบบทุกวันนี้
ผมเลยคิดมาตลอดว่าต้องมีเหตุผลที่เว็บต่าง ๆ เปลี่ยนมาใช้แพตเทิร์นนี้ เช่น อาจช่วยเรื่องป้องกันบอตได้ดีกว่า อยากรู้เหมือนกันว่ามีใครรู้มากกว่านี้ไหม
ดูเผินๆ แล้วแทบทั้งหมดเหมือนเป็น สิ่งที่ AI สร้างขึ้น เลย ทำให้วิธีการสื่อสารอาจไม่ได้ผลนัก แต่ถ้าอ่านหลายๆ หัวข้อแล้ว นอกจากส่วน Agent ที่เหลือก็สื่อเรื่องสุขอนามัยของเว็บที่แข็งแรงได้ค่อนข้างชัดเจน เลยคิดว่าส่งต่อให้เว็บดีเวลอปเปอร์ที่เพิ่งเริ่มเติบโตก็ยังพอได้
แต่ตัวเว็บเองกลับไม่ทำตามแนวปฏิบัติที่ตัวเองบอกว่าเป็น "ข้อบังคับ" เสียด้วยซ้ำ ตรงนี้ก็น่าขันดี
https://validator.w3.org/nu/?doc=https%3A%2F%2Fspecification...
ผมไม่เข้าใจเป้าหมายของเว็บไซต์นี้เลย อวดอ้างว่าเป็นสเปก แต่ไม่รู้ว่าสุดท้ายแล้วกำลังสเปกอะไรอยู่กันแน่
ทุกหัวข้ออ้างอิง "แหล่งความจริง" อื่นทั้งหมด
"ผมเหนื่อยกับการต้องอ้างอิงแหล่งข้อมูลหกแห่งเพื่อรองรับคำแนะนำเพียงข้อเดียว HTML มาจาก WHATWG, accessibility มาจาก WCAG, headers มาจาก IETF, structured data มาจาก schema.org, ที่เหลือมาจาก MDN, web.dev และ Google Search Central
มันไม่มีสเปกเดียวที่เป็นหนึ่งเดียว มีจุดยืนชัดเจน และเป็นกลางต่อแพลตฟอร์ม ว่าเว็บไซต์สมัยใหม่ควรทำอะไรจริงๆ
เลยเขียนมันขึ้นมาเอง"
[1] https://www.linkedin.com/posts/jdevalk_the-website-specifica...
ผมสงสัยว่าสิ่งต่างๆ ในนี้มันพบได้บ่อยแค่ไหน /.well-known/change-password มีไว้ก็ดี แต่พอดู https://news.ycombinator.com/.well-known/change-password กับ google.com/.well-known/change-password แล้วดูเหมือนจะไม่ได้ทำไว้
ไม่เคยได้ยินว่ามีการใช้งานจริง
URL ของ Google อยู่ที่ https://accounts.google.com/.well-known/change-password และไม่ได้อยู่บนโดเมนหลัก
security.txtก็จะอยู่ใต้โฟลเดอร์นี้เสมอ Let's Encrypt ก็ใช้ตำแหน่งนี้สำหรับเรื่องใบรับรองหรือความล้มเหลวของการต่ออายุด้วยนี่ดูเหมือนออกมาจาก โรงงานผลิตขยะ เลย คำว่า "SEO" กับ "Agent-readiness" เนี่ย มันคือสิ่งที่เว็บไซต์ที่ดีไม่ควรทำเลย
แล้วก็ไม่ผิดคาด มันถูกทำโดยผู้เชี่ยวชาญ Wordpress ด้าน "SEO" ที่ใช้ Claude LLM และเป็นนักลงทุนรายย่อย คนที่สะสมความมั่งคั่งจากการพังอินเทอร์เน็ตที่เราเคยรักด้วยขยะโฆษณา ตอนนี้กำลังจะมาพังเศษที่เหลือด้วยขยะ LLM อีก
การจัด "stable URLs" ไปอยู่หมวด "agent readiness" ดูเป็นสัญญาณว่าผู้เขียนสนใจ AI มากกว่ามนุษย์ ผมจะใส่โดเมนนี้ลงในบล็อกลิสต์ เพราะเห็นได้แล้วว่ามันจะทำให้การค้นหาข้อมูลเว็บดีเวลอปเมนต์แย่ลง
"มันไม่ใช่ framework ไม่ใช่ guide แต่มันคือ specification — ว่าอะไรจำเป็น อะไรแนะนำ และอะไรควรหลีกเลี่ยง"
ยากจะบอกว่าส่วนไหนของเว็บนี้เป็นขยะ LLM มากน้อยแค่ไหน แต่บางถ้อยคำก็ดูเป็นแบบนั้นแน่นอน
https://specification.website/llms-full.txt
อย่างแรกคือป้ายสีเล็กๆ อย่าง required, optional, recommended
อย่างที่สองคือคอนเทนต์ยาวบ้าคลั่งที่ไม่มีใครอ่าน
อย่างที่สามคือการขยายไอเดียที่อ่อนมากให้ละเอียดจนน่าเจ็บปวด
ผมเองก็เคยคิดจะทำอะไรแบบนี้ แต่พอเอามันไปวางในแชตเอเจนต์อะไรก็ได้ มันกลับทำงานได้ดีมาก
เมื่อกี้ผมใช้โมเดลโลคัล (Qwen3.6 27B / pi) ให้ทำรายการมาตรฐานสำคัญที่ขาดไปในเว็บไซต์ Hugo เก่าๆ ของผม แล้วทำรายการงานที่ต้องทำ จากนั้นก็ให้จัดการทีละอย่าง โดยแต่ละการเปลี่ยนแปลงผมตรวจทานได้
มันยังทำ favicon ที่หายไปให้ด้วย โดยตัดสัญลักษณ์ออกจากโลโก้มาใช้ ซึ่งออกมาค่อนข้างดี
piไปมากแค่ไหนแล้ว ความรู้สึกแบบ ไร้ภาระ ของ agent/system prompt สั้นๆ นั้นดีอยู่ แต่ถ้าปล่อยให้มันทำงานสุ่มๆ เอง ผมเดาว่าคงมีทั้งการรอและการตันอยู่พอสมควรผมเปิดไซต์นี้บน MacBook แล้ว การใช้ CPU ทะลุ 50%
พอนึกว่าเว็บนี้เป็นสเปกว่าด้วยเรื่องเว็บไซต์ควรเป็นอย่างไร มันก็ยิ่งชวนขำ
บางส่วนก็ค่อนข้างดี แต่หวังว่าการทำให้มันเป็น เช็กลิสต์ 128 ข้อ จะไม่ทำให้คนกลัวการสร้างเว็บไซต์
สเปกที่ผมชอบที่สุดคือ สเปกที่หลอนขึ้นมาเอง นี่แหละ ควรบอกว่าทำได้ดีไหมนะ
เริ่มตั้งตารอ ISO ทางเลือกที่ขับเคลื่อนด้วยเอเจนต์ หรือสล็อตแมชชีนที่ควบคุมโดย LLM แล้ว