- เครื่องมือที่เชื่อมแอป AI เข้ากับเบราว์เซอร์ผ่าน MCP เพื่อให้สามารถทำงานอัตโนมัติบนเว็บไซต์ได้
- ตัวอย่างเช่น ทำงานอย่าง การกรอกแบบฟอร์มซ้ำๆ บนเว็บไซต์ให้เป็นอัตโนมัติ
- การทำงานอัตโนมัติของเวิร์กโฟลว์: เพิ่มความเร็วในการทำงานและทำให้เป็นอัตโนมัติเพื่อยกระดับประสิทธิภาพ
- การทดสอบอัตโนมัติ: ใช้ AI editor เพื่อรันทดสอบ end-to-end ของโค้ดโดยอัตโนมัติ ทดสอบ user flow ตรวจสอบองค์ประกอบ UI และยืนยันว่าแอปพลิเคชันทำงานได้ตามคาดในสถานการณ์ที่หลากหลาย
- งานอัตโนมัติ: ทำงานบนเว็บที่ทำซ้ำได้ง่าย เช่น การเก็บข้อมูล การกรอกแบบฟอร์ม และการทำเวิร์กโฟลว์อัตโนมัติ เพื่อประหยัดเวลาและลดข้อผิดพลาด
ข้อดีของ Browser MCP
- ความเร็ว: ระบบอัตโนมัติทำงานในเครื่อง จึงมีประสิทธิภาพดีขึ้นโดยไม่มีความหน่วงจากเครือข่าย
- ความเป็นส่วนตัว: เนื่องจากระบบอัตโนมัติทำงานในเครื่อง กิจกรรมบนเบราว์เซอร์จึงอยู่บนอุปกรณ์และไม่ถูกส่งไปยังเซิร์ฟเวอร์ระยะไกล
- คงสถานะการเข้าสู่ระบบ: ใช้โปรไฟล์เบราว์เซอร์เดิม ทำให้ยังคงล็อกอินกับทุกบริการไว้ได้
- ความแนบเนียน: ใช้ browser fingerprint จริงเพื่อหลีกเลี่ยงการตรวจจับบอตและ CAPTCHA
วิธีใช้งาน
- ติดตั้งส่วนขยาย Browser MCP: เพิ่มส่วนขยาย Browser MCP ลงในเบราว์เซอร์
- ตั้งค่า MCP server: เพิ่ม Browser MCP server ลงในแอป AI เพื่อเชื่อมต่อกับส่วนขยายของเบราว์เซอร์
- เริ่มทำงานอัตโนมัติ: สร้างเวิร์กโฟลว์อัตโนมัติและให้ผู้ช่วย AI จัดการงานที่ทำซ้ำบนเบราว์เซอร์
เครื่องมือสำหรับความสามารถด้านระบบอัตโนมัติบนเบราว์เซอร์
- นำทาง: ไปยัง URL
- ย้อนกลับ: ไปยังหน้าก่อนหน้า
- ไปข้างหน้า: ไปยังหน้าถัดไป
- รอ: รอตามเวลาที่กำหนด (วินาที)
- กดปุ่ม: กดปุ่มบนคีย์บอร์ด
- สแนปช็อต: จับภาพ accessibility snapshot ของหน้าปัจจุบัน
- คลิก: คลิกบนหน้าเว็บ
- ลากและวาง: ลากและวางระหว่างสององค์ประกอบ
- โฮเวอร์: เลื่อนเมาส์ไปวางเหนือองค์ประกอบบนหน้า
- ป้อนข้อความ: ป้อนข้อความในองค์ประกอบที่แก้ไขได้
- เลือกตัวเลือก: เลือกตัวเลือกจากดรอปดาวน์
- ดึง console log: ดึง console log ของเบราว์เซอร์
แอปพลิเคชัน MCP AI ที่รองรับ
- Cursor
- Claude
- Windsurf
- VSCode
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
เว็บไซต์อ้างว่า "ใช้ลายนิ้วมือเบราว์เซอร์จริงเพื่อหลบการตรวจจับบอตและ CAPTCHA"
ระบบนี้ดูเหมือนสำเนาแบบเก่าของ Playwright-MCP ของ Microsoft
ถ้ามีเบราว์เซอร์ที่สามารถกรองสินค้าในเว็บไซต์ช้อปปิ้งตามเงื่อนไขที่ต้องการได้ก็น่าจะมีประโยชน์
ไม่รู้ว่า MCP คืออะไร และตอนนี้ก็เริ่มกลัวที่จะถามแล้ว
งานค้นหาข้อมูลบนเว็บแล้วใส่ผลลัพธ์ลงใน Google Sheets ตอนแรกทำงานได้เกือบสมบูรณ์แบบ แต่พอลองครั้งถัดไปกลับล้มเหลว
ตอนทดสอบบน Claude Desktop มันทำงานได้ลื่นไหล และยุ่งยากน้อยกว่า Playwright
ถ้าสามารถใช้ accessibility tree ของ Chrome Developer Tools ในการนำทางหน้าเว็บได้ก็น่าจะดี
รู้สึกมีความหวังกับงานที่ต้องทำด้วยมือ โดยเฉพาะงานอย่างการยื่นขอคืนเงิน
สงสัยว่า MCP คือ RPA (Robotic Process Automation) แบบใหม่หรือเปล่า
ทำงานลักษณะคล้ายกันโดยควบคุมฮาร์ดแวร์ซินธ์ เพื่อออกแบบเสียงโดยไม่ต้องไปหมุนปุ่มจริงบนอุปกรณ์