- Claude in Chrome เป็น ส่วนขยาย AI ที่สามารถคลิกปุ่ม กรอกฟอร์ม และนำทางหน้าเว็บได้ภายในเบราว์เซอร์
- ทำงานร่วมกับ Claude Code และ Claude Desktop ภายในเบราว์เซอร์ เพื่อช่วยงานอัตโนมัติด้านการพัฒนาและงานทั่วไป
- จัดการงานซ้ำ ๆ แบบอัตโนมัติบนเว็บบริการต่าง ๆ เช่น Google Drive, ปฏิทิน, CRM, อีเมล, แดชบอร์ดวิเคราะห์ข้อมูล
- เป็น ฟีเจอร์สำหรับผู้สมัครสมาชิกแบบชำระเงินเท่านั้น และขณะนี้ยังอยู่ในเวอร์ชันเบต้า
- เน้นย้ำว่าต้องตระหนักถึง ความเสี่ยงด้านความปลอดภัย เช่น การโจมตีแบบ prompt injection และผู้ใช้ต้องตรวจสอบและอนุมัติสิทธิ์รวมถึงการกระทำต่าง ๆ ด้วยตนเอง
ภาพรวมของ Claude in Chrome
- ตอนนี้ Claude สามารถ ทำงานได้โดยตรงภายในเบราว์เซอร์ และทำงานอย่างการคลิกปุ่ม กรอกฟอร์ม และนำทางหน้าเว็บได้
- ทำงานร่วมกับ Claude Code และ Claude Desktop เพื่อรองรับเวิร์กโฟลว์ด้านการพัฒนาและการทดสอบ
- ขณะนี้ เปิดให้ผู้สมัครสมาชิกแบบชำระเงินทุกคนใช้งานในรูปแบบเบต้า
- ติดตั้งได้ผ่าน Chrome Web Store พร้อม วิดีโอเดโมและคู่มือการใช้งาน
ความสามารถหลัก
- รองรับระบบอัตโนมัติภายในเบราว์เซอร์
- Claude สามารถคลิกปุ่ม กรอกฟอร์ม และเปลี่ยนหน้าใน Chrome ได้
- ผู้ใช้สามารถควบคุมแอปและเวิร์กโฟลว์ผ่าน Claude ได้โดยไม่ต้องออกจากเบราว์เซอร์
- รันงานเบื้องหลังและงานตามกำหนดเวลา
- Claude สามารถทำงานให้เสร็จในเบื้องหลังขณะที่ผู้ใช้ทำงานอื่นอยู่
- รองรับ การทำงานอัตโนมัติรายวันและรายสัปดาห์ เช่น การสร้างรายงานและอัปเดตกำหนดการ
- การผสานรวมกับ Claude Code
- นักพัฒนาสามารถทดสอบโค้ดและทำงานซ้ำ ๆ ได้โดยตรงภายใน Chrome
กรณีการใช้งาน
- ดึงข้อมูลจากแดชบอร์ดวิเคราะห์: Claude นำทางไปยังหน้าวิเคราะห์และสรุปตัวเลขที่ต้องการ
- จัดระเบียบ Google Drive: สร้างโครงสร้างโฟลเดอร์ ย้ายไฟล์ และทำเครื่องหมายไฟล์ซ้ำเพื่อจัดระเบียบอัตโนมัติ
- เตรียมงานตามกำหนดการจากปฏิทิน: อ่านบริบทการประชุมจากเธรดอีเมลและระบุการประชุมที่ต้องเตรียมตัว
- ทำผลิตภัณฑ์เปรียบเทียบแบบอัตโนมัติ: อ่านสเปกสินค้าจากหลายเว็บไซต์และสร้างตารางเปรียบเทียบใน Google Sheets
- เขียนบันทึก CRM: จับคู่ข้อมูลผู้เข้าร่วมจากปฏิทินกับ Salesforce เพื่อร่างบันทึกกิจกรรม
- จัดการอีเมลโปรโมชัน: ระบุอีเมลการตลาดและจดหมายข่าว จากนั้นลบเป็นชุดหลังตรวจสอบ
ความปลอดภัยและแนวทางการใช้งานอย่างปลอดภัย
- เนื่องจาก AI ทำงานโดยตรงภายในเบราว์เซอร์ จึงมี ความเสี่ยงด้านความปลอดภัย จากผู้ไม่หวังดี
- อาจเกิดพฤติกรรมที่ไม่ตั้งใจจาก การโจมตีแบบ prompt injection เป็นต้น
- มีการกล่าวถึงความเป็นไปได้ที่ Claude จะเกิด อาการหลอน (hallucination) และทำงานต่างจากที่ผู้ใช้ตั้งใจ
- แนวทางการใช้งานอย่างปลอดภัย
- ให้สิทธิ์เฉพาะกับเว็บไซต์ที่เชื่อถือได้เท่านั้น
- หลีกเลี่ยงงานที่เกี่ยวข้องกับการเงินหรือข้อมูลส่วนบุคคล และต้องตรวจสอบก่อนทำการกระทำสำคัญเสมอ
- หาก Claude แสดงพฤติกรรมที่ไม่คาดคิด ให้หยุดทันทีและตรวจสอบ
- หากเกิดปัญหา ให้รายงานผ่านฟีเจอร์ส่งข้อเสนอแนะ
ประเด็นสำคัญใน FAQ
- การเชื่อมต่อส่วนขยาย Chrome ของ Claude Code: นักพัฒนาสามารถใช้ Claude Code เพื่อบิลด์และทดสอบบน Chrome ได้โดยตรง ช่วยเพิ่มความเร็วของงานซ้ำ ๆ ในโปรเจกต์ที่ทำงานผ่านเบราว์เซอร์
- การเชื่อมต่อกับ Claude Desktop: สามารถเริ่มงานจากแอปเดสก์ท็อปแล้วทำต่อในเบราว์เซอร์ได้
- กิจกรรมที่ไม่แนะนำ: ห้ามใช้กับธุรกรรมการเงิน การจัดการรหัสผ่าน และการจัดการข้อมูลส่วนบุคคลที่ละเอียดอ่อน
- การควบคุมสิทธิ์: ผู้ใช้ต้องอนุมัติสิทธิ์การเข้าถึงของ Claude ล่วงหน้าก่อนใช้งาน และจะมีการขอให้ยืนยันอีกครั้งก่อนการกระทำที่ ย้อนกลับไม่ได้ เช่น การสั่งซื้อ
- ความเสี่ยงด้านความปลอดภัย: ผู้โจมตีอาจหลอก Claude ให้เปิดเผยข้อมูลธนาคารหรือลบไฟล์ได้ แม้จะมีระบบป้องกัน แต่ก็ไม่สมบูรณ์แบบ
การมีส่วนร่วมของผู้ใช้และการปรับปรุง
- หากผู้ใช้ ส่งข้อเสนอแนะ ก็จะถูกนำไปใช้ปรับปรุงความสามารถของ Claude โดยตรง
- ส่วนขยาย Chrome ปฏิบัติตาม นโยบาย Google API และ ข้อกำหนดการใช้ข้อมูลผู้ใช้อย่างจำกัด
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ตลอดหลายปีที่ผ่านมาเราพยายามอุด ช่องโหว่ความปลอดภัยของ V8, แยกเบราว์เซอร์เป็นรายโปรเซส และปรับปรุง sandboxing กันมาตลอด แต่ตอนนี้กลับมีไอเดียว่าจะเสียบ LLM ที่เปิดโหมดดีบักไว้เข้าไปใน Chrome ตรงๆ เสียอย่างนั้น ฟังดูประชดประชันดี
ครั้งก่อนที่มี “ไอเดียดีๆ” แบบนี้ ผลลัพธ์ก็คือ น้ำมันเบนซินผสมตะกั่ว
อีกสัก 20 ปีข้างหน้า Gemini น่าจะถูก bundle มาแบบสะดวกเกินไปจนโดนฟ้องผูกขาด
เอกสารที่เกี่ยวข้อง: Chrome Built-in AI APIs
พูดเล่นก็ส่วนพูดเล่น แต่ก็ต้องยอมรับที่ CEO ของ Anthropic ยังยึดแนวทางแบบยึดหลักการ โดยเฉพาะการทำ เอเจนต์เขียนโค้ดบนเทอร์มินัล ออกมาได้น่าสนใจมาก
ไม่ได้พูดเล่นนะ ช็อกจริงๆ
ตอนนี้ยังเป็นระดับอัลฟาเลยต้องมีคำเตือนแปะไว้ และโมเดลความปลอดภัยก็น่าจะค่อยไปทำทีหลัง
ดูเหมือน Claude จะมี สิทธิ์เข้าถึงเครื่องมือ ที่ทำให้รัน JS บนเว็บเพจผ่าน Chrome debugger ได้
แต่ไม่ต้องห่วงนะ เขามี ตัวกรอง regex กันข้อมูลลับรั่วไหล
const r = [/password/i, /token/i, /secret/i, ...]ความกังวลด้านความปลอดภัยนั้นสมเหตุสมผล แต่ในความเป็นจริงเราก็ ข้าม Rubicon กันมาแล้วด้วยเครื่องมืออย่าง Claude Code หรือ Playwright MCP
ผมใช้ Claude Code แบบให้ เข้าถึงทั้งระบบ มาหลายเดือนแล้ว
มันอ่านไฟล์ได้ รัน bash ได้ ไปจนถึง git push ได้เลย ระบบอัตโนมัติบนเบราว์เซอร์จริงๆ แล้วเสี่ยงน้อยกว่าอีก
คำถามที่แท้จริงไม่ใช่ว่า “จะให้ AI เข้าถึงไหม?” แต่คือ “จะออกแบบให้มนุษย์เป็นคนอนุมัติการตัดสินใจสำคัญเองไหม?”
ผมตั้งงานเกี่ยวกับ credential หรือการจ่ายเงินไว้ให้อนุมัติด้วยมือ และใช้มันกับ QA testing หรืองานกรอกฟอร์มซ้ำๆ
แบบเอา LLM ไปผูกกับหน้าต่าง QubesOS เพื่อให้พฤติกรรมที่ไม่กำหนดแน่ชัดส่งผลได้แค่ในพื้นที่จำกัด
ถ้าไม่มีระบบ backup, rollback, recovery ที่ชัดเจนก็เสี่ยงมาก
แบบอุดมคติคือ push ZFS snapshot ไปที่ rsync.net แต่ก็ยังสงสัยว่าโซลูชันง่ายๆ อย่าง Time Machine ยังมีอยู่ไหม
ยังมีคนอีกมากที่ยังไม่ใช้เครื่องมือ AI เลย และถ้ามันถูกติดมากับ Chrome เป็นค่าปริยายก็จะเลี่ยงได้ยากขึ้น
เมื่อวานผมลองให้ Claude วิเคราะห์รายการบันทึก Zillow 70 รายการ แต่ดันสรุป การลดราคาบ้าน ได้ไม่ดีเลย
มันเหมือนทำเป็นไล่อ่านทั้งหน้า แต่จริงๆ แล้วไม่ได้ทำ
ดูเหมือนจะเป็น การวิเคราะห์จากภาพหน้าจอ ไม่ได้อ่าน DOM ตรงๆ น่าจะเป็นการประนีประนอมเพื่อประหยัดโทเค็น
ต่อให้ผมเป็นคนที่เคยสงสัยใน AI ก็ยังเห็นศักยภาพนะ แต่ตัวนี้ตามหลังผลิตภัณฑ์อื่นของ Anthropic อยู่มาก
จัดการ HTML เป็น XML แล้วให้ดึงเฉพาะข้อมูลที่ต้องการด้วย XPath query จะดีกว่ามาก
เพราะงั้น UX แบบข้อความ/CLI ถึงดีกว่า และวิธีแบบ std in/out ก็น่าจะเหมาะที่สุด
พอ Claude Code หางานใน CLI หรือ public API ไม่เจอ มันก็เลยเปิดแอปผ่าน ฟีเจอร์เชื่อมกับ Chrome
แล้วดึง access token จากคุกกี้ เพื่อเข้า private API โดยตรง
เป็นยุคสมัยที่น่าทึ่งจริงๆ
มันไม่พล่ามหรือยอมแพ้ แต่ใช้เครื่องมือที่มีอยู่แบบสร้างสรรค์
ทั้งที่เน้นเรื่องความปลอดภัย แต่กลับใช้ สิทธิ์ Debugger จนทำให้อุปกรณ์ช้าลง เปิดช่องโหว่ และเจอปัญหา CAPTCHA
ผมกำลังพัฒนาส่วนขยายคู่แข่งชื่อ rtrvr.ai และออกแบบมาให้ หลีกเลี่ยงสิทธิ์อ่อนไหว
ถ้า Claude จะปล่อยให้ผู้ใช้ทั่วไปใช้ ก็ต้องมีแนวทางแบบนี้
ตอนนี้ Google ให้ฟีเจอร์นี้กับผู้สมัครใช้บริการแบบทดลอง เดือนละ 125 ดอลลาร์
ดูได้ที่ Google Labs Mariner
ทำ browser automation ผ่าน Gemini CLI ก็ได้เหมือนกัน แต่ ความโต้ตอบ จะด้อยกว่าและเข้าถึง main profile ได้จำกัดกว่า
สร้าง workspace เปล่าๆ แล้วบอกว่า “ช่วยทำ X บนเบราว์เซอร์ให้หน่อย” มันก็จะเปิด Chrome แล้วคลิก เลื่อน ฯลฯ ให้
Claude Code ทำตัวเหมือนผู้ใช้จริงและอ่านแม้กระทั่ง console output ได้
ไม่ได้เอาไว้ใช้โต้ตอบกับเว็บไซต์คนอื่น แต่สำหรับงานพัฒนานี่เยี่ยมมาก
การเอา Claude ใส่เข้าไปในเบราว์เซอร์โดยตรงนั้นสะดวกก็จริง แต่ ส่วนขยายเบราว์เซอร์เป็นชั้นที่อ่อนไหวมาก
พอ AI ทำงานในรูปแบบส่วนขยาย คำถามสำคัญก็ไม่ใช่ “มีประโยชน์แค่ไหน” แต่คือ “มันเข้าถึงข้อมูลอะไรได้บ้าง”
ต้องชัดเจนว่ามันอ่านเนื้อหาในหน้าไหนได้บ้าง ประมวลผลพรอมป์ต์/คำตอบอย่างไร และยังเก็บข้อมูลไว้หลังจบเซสชันหรือไม่
สำหรับเบราว์เซอร์แล้ว ความโปร่งใสและหลักสิทธิ์ขั้นต่ำ คือหัวใจสำคัญ
นี่แทบจะเป็นแนวคิดที่มาแทน Chrome DevTools MCP แต่ รีวิวบน Chrome Web Store ไม่ค่อยดีเท่าไร
ปกติเราเองยังไม่ให้มนุษย์มี สิทธิ์เข้าถึงเบราว์เซอร์ ระดับนี้เลย แล้วทำไมถึงอยากให้ AI มี?
มันยังห่างไกลจากจิตสำนึกแบบมนุษย์ แต่ก็อาจมองได้ว่าเป็นวิวัฒนาการขั้นถัดไปของเครื่องคิดเลข
เพราะงั้นสิทธิ์เข้าถึงที่อันตรายสำหรับมนุษย์ เราอาจยอมให้ LLM ได้
คล้ายแนวคิดเรื่อง โกลัม (Golem) สิ่งที่มนุษย์จินตนาการถึงมานานแต่สร้างจริงไม่ได้เสียที
ดู บทความวิกิของ Golem