11 คะแนน โดย GN⁺ 2025-03-11 | 3 ความคิดเห็น | แชร์ทาง WhatsApp
  • MCP (Model Context Protocol) คือโปรโตคอลเปิดแบบใหม่ที่ทำให้วิธีที่โมเดล AI โต้ตอบกับเครื่องมือภายนอกและแหล่งข้อมูลเป็นมาตรฐานเดียวกัน
  • เช่นเดียวกับที่พอร์ต USB-C ทำให้การเชื่อมต่ออุปกรณ์หลายชนิดเป็นแบบเดียวกัน MCP ก็ทำให้วิธีที่ระบบ AI เชื่อมต่อกับเครื่องมือและแหล่งข้อมูลที่หลากหลายเป็นแบบเดียวกัน

เหตุผลที่ใช้ MCP แทน API แบบเดิม

  • การผสานรวม API แบบดั้งเดิมต้องเขียนโค้ดแยกสำหรับแต่ละเครื่องมือและบริการ รวมถึงต้องจัดการการยืนยันตัวตน การจัดการข้อผิดพลาด และการบำรุงรักษาแยกกัน
  • API เปรียบเหมือนกุญแจคนละดอกสำหรับแต่ละประตู
    • แต่ละบริการหรือเครื่องมือต้องมีการผสานรวมเฉพาะของตัวเอง และมีความซับซ้อนทั้งด้านเอกสาร การยืนยันตัวตน การจัดการข้อผิดพลาด และการบำรุงรักษา

ที่มาของ MCP

  • MCP เป็นโครงการที่เริ่มต้นจาก Anthropic และออกแบบมาเพื่อให้โมเดล AI อย่าง Claude โต้ตอบกับเครื่องมือและแหล่งข้อมูลได้ง่ายขึ้น
  • ปัจจุบันเปิดซอร์สแล้ว และกำลังถูกนำไปใช้โดยหลายบริษัทและนักพัฒนา
  • กำลังก้าวขึ้นเป็นมาตรฐานใหม่สำหรับการโต้ตอบระหว่าง AI กับเครื่องมือ

เปรียบเทียบ MCP กับ API แบบเดิม

  • ความพยายามในการผสานรวม: MCP ใช้มาตรฐานเดียว ส่วน API แบบเดิมต้องผสานรวมแยกแต่ละตัว
  • การสื่อสารแบบเรียลไทม์: MCP รองรับ, API แบบเดิมไม่รองรับ
  • การค้นหาแบบไดนามิก: MCP ทำได้, API แบบเดิมทำไม่ได้
  • ความสามารถในการขยาย: MCP เป็นแบบ plug-and-play, API แบบเดิมต้องเพิ่มการผสานรวม
  • ความปลอดภัยและการควบคุม: MCP รักษาความสม่ำเสมอ, API แบบเดิมแตกต่างกันไป

ความแตกต่างสำคัญระหว่าง MCP กับ API แบบเดิม

  • โปรโตคอลเดียว: เมื่อผสานรวมด้วย MCP ครั้งเดียว ก็สามารถเชื่อมต่อกับเครื่องมือและบริการหลายตัวได้
  • การค้นหาแบบไดนามิก: โมเดล AI สามารถค้นหาและโต้ตอบกับเครื่องมือที่ใช้งานได้โดยอัตโนมัติ โดยไม่ต้องเขียนโค้ดล่วงหน้า
  • การสื่อสารสองทาง: สามารถดึงข้อมูลและดำเนินงานได้แบบเรียลไทม์ (เช่นเดียวกับ WebSocket)

เหตุใดการสื่อสารสองทางของ MCP จึงสำคัญ

  • การดึงข้อมูล: โมเดล AI ค้นหาข้อมูลที่ต้องการจากเซิร์ฟเวอร์ → เช่น ตรวจสอบตารางเวลา
  • การดำเนินงาน: โมเดล AI ส่งคำสั่งให้เซิร์ฟเวอร์ทำงาน → เช่น เปลี่ยนกำหนดการประชุม, ส่งอีเมล

วิธีการทำงานของ MCP: สถาปัตยกรรม

  • MCP โฮสต์: แอปพลิเคชัน AI เช่น Claude Desktop
  • MCP ไคลเอนต์: รักษาการเชื่อมต่อกับ MCP เซิร์ฟเวอร์ และแลกเปลี่ยนคำสั่งกับข้อมูล
  • MCP เซิร์ฟเวอร์: เปิดเผยความสามารถเฉพาะและเชื่อมต่อกับแหล่งข้อมูลภายในหรือระยะไกล
  • แหล่งข้อมูลภายในเครื่อง: ไฟล์, ฐานข้อมูล เป็นต้น
  • บริการระยะไกล: API ภายนอกและบริการบนอินเทอร์เน็ต
  • MCP ไม่ได้ทำหน้าที่ประมวลผลตรรกะที่ซับซ้อน แต่ทำหน้าที่ประสานการไหลของข้อมูลระหว่างโมเดล AI กับเครื่องมือ

ตัวอย่าง MCP ไคลเอนต์จริง

  • สคริปต์ Python (client.py) ที่โต้ตอบกับ Gmail, Slack, แอปปฏิทิน เป็นต้น
  • การใช้โปรโตคอลเดียวช่วยตัดความซับซ้อนของกระบวนการผสานรวม และเพิ่มฟังก์ชันได้อย่างรวดเร็ว

ตัวอย่างการใช้งาน MCP

1. ผู้ช่วยจัดตารางการเดินทาง

  • ใช้ API แบบเดิม: ต้องเขียนโค้ดและจัดการการยืนยันตัวตนแยกสำหรับ Google Calendar, อีเมล, API การจองของสายการบิน เป็นต้น
  • ใช้ MCP: ใช้โปรโตคอล MCP เดียวเพื่อตรวจสอบตารางเวลา จองตั๋วเครื่องบิน และส่งอีเมลได้

2. IDE ขั้นสูง (ตัวแก้ไขโค้ดอัจฉริยะ)

  • ใช้ API แบบเดิม: ต้องผสานรวมแยกสำหรับระบบไฟล์ การจัดการเวอร์ชัน ตัวจัดการแพ็กเกจ เป็นต้น
  • ใช้ MCP: ผสานรวมผ่าน MCP → ให้คำแนะนำโค้ดและบริบทที่สมบูรณ์ยิ่งขึ้น

3. การวิเคราะห์ข้อมูลแบบซับซ้อน

  • ใช้ API แบบเดิม: ต้องเชื่อมต่อกับฐานข้อมูลและเครื่องมือแสดงผลแต่ละตัวด้วยตนเอง
  • ใช้ MCP: ใช้เลเยอร์ MCP เดียวเพื่อโต้ตอบกับแหล่งข้อมูลหลายแห่งได้โดยอัตโนมัติ

ข้อดีของการนำ MCP ไปใช้

  • ทำให้การพัฒนาง่ายขึ้น: เขียนครั้งเดียว ใช้ได้กับหลายเครื่องมือ
  • ความยืดหยุ่น: หากเปลี่ยนโมเดล AI หรือเครื่องมือ ก็ไม่ต้องปรับโครงสร้างใหม่อย่างซับซ้อน
  • การตอบสนองแบบเรียลไทม์: การเชื่อมต่อ MCP ยังคงทำงานอยู่ จึงรองรับการอัปเดตและการโต้ตอบแบบเรียลไทม์
  • ความปลอดภัยและการปฏิบัติตามข้อกำหนด: รักษาการควบคุมการเข้าถึงและความปลอดภัยอย่างสม่ำเสมอ
  • ความสามารถในการขยาย: เมื่อต้องการเพิ่มฟังก์ชันใหม่ ก็เชื่อมต่อ MCP เซิร์ฟเวอร์ใหม่ได้อย่างง่ายดาย

กรณีที่ API แบบเดิมเหมาะสมกว่า

  • หากต้องการการโต้ตอบที่แม่นยำและคาดการณ์ได้ API แบบเดิมจะได้เปรียบ
  • หากต้องการการเพิ่มประสิทธิภาพและการควบคุมด้านประสิทธิภาพ API แบบเดิมจะเหมาะกว่า

กรณีที่ API แบบเดิมได้เปรียบ

  • เมื่อต้องการการควบคุมอย่างละเอียดและฟังก์ชันที่จำกัด
  • เมื่อการเพิ่มประสิทธิภาพมีความสำคัญ
  • เมื่อต้องการความเป็นอิสระด้านบริบทในระดับต่ำที่สุด

เริ่มต้นใช้งาน MCP: ขั้นตอนสำคัญ

  1. กำหนดความสามารถ: กำหนดความสามารถที่ MCP เซิร์ฟเวอร์จะให้บริการ
  2. ติดตั้งเลเยอร์ MCP: พัฒนาตามข้อกำหนดของโปรโตคอล MCP
  3. เลือกวิธีการส่งข้อมูล: ตัดสินใจว่าจะใช้แบบภายในเครื่อง (Stdio) หรือระยะไกล (Server-Sent Events/WebSockets)
  4. สร้างรีซอร์ส/เครื่องมือ: พัฒนาแหล่งข้อมูลและบริการที่จะเปิดเผย
  5. ตั้งค่าไคลเอนต์: ตั้งค่าการเชื่อมต่อที่ปลอดภัยระหว่าง MCP เซิร์ฟเวอร์กับไคลเอนต์

สรุป

  • MCP: อินเทอร์เฟซมาตรฐานสำหรับให้ AI agent โต้ตอบกับเครื่องมือภายนอกและข้อมูล
  • API: ต้องผสานรวมแยกและต้องใช้การทำงานด้วยมือมากกว่า

MCP ช่วยให้โมเดล AI ผสานรวมกับเครื่องมือภายนอกและข้อมูลได้ง่าย และโต้ตอบได้แบบเรียลไทม์

บทสรุป

  • MCP มอบ เฟรมเวิร์กมาตรฐานแบบรวมศูนย์ สำหรับให้โมเดล AI โต้ตอบกับเครื่องมือภายนอกและข้อมูล
  • ไม่ใช่แค่ API แบบหนึ่งเท่านั้น แต่เป็นโซลูชันการเชื่อมต่อที่ทรงพลัง ซึ่งช่วยให้แอปพลิเคชัน AI โต้ตอบได้อย่าง ชาญฉลาด ไดนามิก และ ยึดตามบริบท มากยิ่งขึ้น

3 ความคิดเห็น

 
halfenif 2025-03-11

สงสัยว่า MCP จะสามารถเป็น JSON ได้หรือไม่

 
kakasoo 2025-03-11

ผมคิดว่า MCP นั้นไม่ใช่มาตรฐานสำหรับการสื่อสารข้อมูลที่จะกลายเป็น JSON และยังซับซ้อนเกินความจำเป็นด้วย

 
GN⁺ 2025-03-11
ความคิดเห็นจาก Hacker News
  • MCP ช่วยให้สามารถเพิ่มเครื่องมือได้ขณะรันไทม์ ทำให้ผู้ใช้เพิ่มความสามารถตามต้องการให้กับแอปพลิเคชัน LLM ได้

    • MCP มีสถานะและซับซ้อน จึงคล้ายกับ FTP มากกว่า HTTP
    • มีลิงก์ไปยังบล็อกโพสต์ที่เกี่ยวข้อง: ลิงก์บล็อก
  • สิ่งสำคัญที่สุดที่นักพัฒนาควรเข้าใจเกี่ยวกับ MCP คือมันเป็นโปรโตคอลสำหรับโหลดความสามารถเพิ่มเติมแบบไดนามิกเข้าไปในแอปพลิเคชัน AI

    • หากกำลังสร้างแอปพลิเคชันของตัวเอง สามารถใช้ "Tools APIs" ที่ LLM มีให้ได้
    • MCP จำเป็นต้องพิจารณาเฉพาะเมื่อแอปพลิเคชันต้องการการขยายความสามารถเท่านั้น
  • มีการตั้งคำถามว่า MCP แตกต่างจากความพยายามก่อนหน้านี้ในการทำ API layer อย่างไร

    • หาก AI ฉลาดพอ ๆ กับมนุษย์ในการเขียน API client ก็มีคำถามว่าทำไมจึงต้องทำให้มันอยู่ในรูปแบบที่เครื่องอ่านได้
  • MCP ถูกสร้างโดย Anthropic และกำลังได้รับการยอมรับอย่างแพร่หลาย

    • ดูเหมือนเป็นโอกาสของแพลตฟอร์มใหม่ที่คล้ายกับ Apple App Store
    • กำลังถูกนำไปใช้อย่างรวดเร็วใน GitHub, Stripe, Slack, Google Maps, AirTable เป็นต้น
  • มีการแนะนำอีกโปรโตคอลหนึ่งชื่อ ANP (AgentNetworkProtocol)

    • ANP คล้ายกับ MCP แต่ถูกออกแบบมาเพื่อแก้ปัญหาการสื่อสารระหว่างเอเจนต์
    • ANP ใช้สถาปัตยกรรม P2P และใช้การยืนยันตัวตนแบบกระจายศูนย์ผ่าน W3C DID
  • มีการคัดสรร MCP server หลายร้อยรายการเพื่อให้ผู้คนเข้าถึงและสำรวจได้

    • สามารถค้นหา MCP server และระบุความสามารถได้ผ่าน API
    • เป้าหมายคือการสร้างแพลตฟอร์มแบบครบวงจรสำหรับการเขียน ค้นพบ และโฮสต์ MCP server
  • MCP มีสถานะใกล้เคียงกับ HTML โดยประมาณ และจัดการเรื่องอย่างการค้นหา "เครื่องมือ" แบบไดนามิกได้ดี

    • การทำ client implementation อาจง่ายกว่า แต่ยังมีปัญหาเรื่องการขาดมาตรฐาน ความไม่สุกงอม และการที่มนุษย์อ่านได้ยาก
  • โมเดล AI หลักทั้งหมดสามารถเขียนโค้ดที่เชื่อมต่อกับ API ที่รู้จักกันดีได้อย่างสมบูรณ์อยู่แล้ว

    • มีความเห็นว่าสิ่งที่ต้องการมีเพียงเอกสาร API เท่านั้น
  • โปรโตคอล MCP คล้ายกับ Language Server Protocol (LSP) มาก

    • LSP เมื่อรันบนเซิร์ฟเวอร์ระยะไกลจะใช้ WebSocket แบบเชื่อมต่อค้างไว้ เพื่อให้ตอบสนองต่อคำขอขนาดเล็กได้อย่างรวดเร็ว