2 คะแนน โดย GN⁺ 2025-12-22 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Claude in Chrome เป็น ส่วนขยาย AI ที่สามารถคลิกปุ่ม กรอกฟอร์ม และนำทางหน้าเว็บได้ภายในเบราว์เซอร์
  • ทำงานร่วมกับ Claude Code และ Claude Desktop ภายในเบราว์เซอร์ เพื่อช่วยงานอัตโนมัติด้านการพัฒนาและงานทั่วไป
  • จัดการงานซ้ำ ๆ แบบอัตโนมัติบนเว็บบริการต่าง ๆ เช่น Google Drive, ปฏิทิน, CRM, อีเมล, แดชบอร์ดวิเคราะห์ข้อมูล
  • เป็น ฟีเจอร์สำหรับผู้สมัครสมาชิกแบบชำระเงินเท่านั้น และขณะนี้ยังอยู่ในเวอร์ชันเบต้า
  • เน้นย้ำว่าต้องตระหนักถึง ความเสี่ยงด้านความปลอดภัย เช่น การโจมตีแบบ prompt injection และผู้ใช้ต้องตรวจสอบและอนุมัติสิทธิ์รวมถึงการกระทำต่าง ๆ ด้วยตนเอง

ภาพรวมของ Claude in Chrome

  • ตอนนี้ Claude สามารถ ทำงานได้โดยตรงภายในเบราว์เซอร์ และทำงานอย่างการคลิกปุ่ม กรอกฟอร์ม และนำทางหน้าเว็บได้
    • ทำงานร่วมกับ Claude Code และ Claude Desktop เพื่อรองรับเวิร์กโฟลว์ด้านการพัฒนาและการทดสอบ
    • ขณะนี้ เปิดให้ผู้สมัครสมาชิกแบบชำระเงินทุกคนใช้งานในรูปแบบเบต้า
  • ติดตั้งได้ผ่าน Chrome Web Store พร้อม วิดีโอเดโมและคู่มือการใช้งาน

ความสามารถหลัก

  • รองรับระบบอัตโนมัติภายในเบราว์เซอร์
    • Claude สามารถคลิกปุ่ม กรอกฟอร์ม และเปลี่ยนหน้าใน Chrome ได้
    • ผู้ใช้สามารถควบคุมแอปและเวิร์กโฟลว์ผ่าน Claude ได้โดยไม่ต้องออกจากเบราว์เซอร์
  • รันงานเบื้องหลังและงานตามกำหนดเวลา
    • Claude สามารถทำงานให้เสร็จในเบื้องหลังขณะที่ผู้ใช้ทำงานอื่นอยู่
    • รองรับ การทำงานอัตโนมัติรายวันและรายสัปดาห์ เช่น การสร้างรายงานและอัปเดตกำหนดการ
  • การผสานรวมกับ Claude Code
    • นักพัฒนาสามารถทดสอบโค้ดและทำงานซ้ำ ๆ ได้โดยตรงภายใน Chrome

กรณีการใช้งาน

  • ดึงข้อมูลจากแดชบอร์ดวิเคราะห์: Claude นำทางไปยังหน้าวิเคราะห์และสรุปตัวเลขที่ต้องการ
  • จัดระเบียบ Google Drive: สร้างโครงสร้างโฟลเดอร์ ย้ายไฟล์ และทำเครื่องหมายไฟล์ซ้ำเพื่อจัดระเบียบอัตโนมัติ
  • เตรียมงานตามกำหนดการจากปฏิทิน: อ่านบริบทการประชุมจากเธรดอีเมลและระบุการประชุมที่ต้องเตรียมตัว
  • ทำผลิตภัณฑ์เปรียบเทียบแบบอัตโนมัติ: อ่านสเปกสินค้าจากหลายเว็บไซต์และสร้างตารางเปรียบเทียบใน Google Sheets
  • เขียนบันทึก CRM: จับคู่ข้อมูลผู้เข้าร่วมจากปฏิทินกับ Salesforce เพื่อร่างบันทึกกิจกรรม
  • จัดการอีเมลโปรโมชัน: ระบุอีเมลการตลาดและจดหมายข่าว จากนั้นลบเป็นชุดหลังตรวจสอบ

ความปลอดภัยและแนวทางการใช้งานอย่างปลอดภัย

  • เนื่องจาก AI ทำงานโดยตรงภายในเบราว์เซอร์ จึงมี ความเสี่ยงด้านความปลอดภัย จากผู้ไม่หวังดี
    • อาจเกิดพฤติกรรมที่ไม่ตั้งใจจาก การโจมตีแบบ prompt injection เป็นต้น
    • มีการกล่าวถึงความเป็นไปได้ที่ Claude จะเกิด อาการหลอน (hallucination) และทำงานต่างจากที่ผู้ใช้ตั้งใจ
  • แนวทางการใช้งานอย่างปลอดภัย
    • ให้สิทธิ์เฉพาะกับเว็บไซต์ที่เชื่อถือได้เท่านั้น
    • หลีกเลี่ยงงานที่เกี่ยวข้องกับการเงินหรือข้อมูลส่วนบุคคล และต้องตรวจสอบก่อนทำการกระทำสำคัญเสมอ
    • หาก Claude แสดงพฤติกรรมที่ไม่คาดคิด ให้หยุดทันทีและตรวจสอบ
    • หากเกิดปัญหา ให้รายงานผ่านฟีเจอร์ส่งข้อเสนอแนะ

ประเด็นสำคัญใน FAQ

  • การเชื่อมต่อส่วนขยาย Chrome ของ Claude Code: นักพัฒนาสามารถใช้ Claude Code เพื่อบิลด์และทดสอบบน Chrome ได้โดยตรง ช่วยเพิ่มความเร็วของงานซ้ำ ๆ ในโปรเจกต์ที่ทำงานผ่านเบราว์เซอร์
  • การเชื่อมต่อกับ Claude Desktop: สามารถเริ่มงานจากแอปเดสก์ท็อปแล้วทำต่อในเบราว์เซอร์ได้
  • กิจกรรมที่ไม่แนะนำ: ห้ามใช้กับธุรกรรมการเงิน การจัดการรหัสผ่าน และการจัดการข้อมูลส่วนบุคคลที่ละเอียดอ่อน
  • การควบคุมสิทธิ์: ผู้ใช้ต้องอนุมัติสิทธิ์การเข้าถึงของ Claude ล่วงหน้าก่อนใช้งาน และจะมีการขอให้ยืนยันอีกครั้งก่อนการกระทำที่ ย้อนกลับไม่ได้ เช่น การสั่งซื้อ
  • ความเสี่ยงด้านความปลอดภัย: ผู้โจมตีอาจหลอก Claude ให้เปิดเผยข้อมูลธนาคารหรือลบไฟล์ได้ แม้จะมีระบบป้องกัน แต่ก็ไม่สมบูรณ์แบบ

การมีส่วนร่วมของผู้ใช้และการปรับปรุง

  • หากผู้ใช้ ส่งข้อเสนอแนะ ก็จะถูกนำไปใช้ปรับปรุงความสามารถของ Claude โดยตรง
  • ส่วนขยาย Chrome ปฏิบัติตาม นโยบาย Google API และ ข้อกำหนดการใช้ข้อมูลผู้ใช้อย่างจำกัด

1 ความคิดเห็น

 
GN⁺ 2025-12-22
ความคิดเห็นจาก Hacker News
  • ตลอดหลายปีที่ผ่านมาเราพยายามอุด ช่องโหว่ความปลอดภัยของ V8, แยกเบราว์เซอร์เป็นรายโปรเซส และปรับปรุง sandboxing กันมาตลอด แต่ตอนนี้กลับมีไอเดียว่าจะเสียบ LLM ที่เปิดโหมดดีบักไว้เข้าไปใน Chrome ตรงๆ เสียอย่างนั้น ฟังดูประชดประชันดี
    ครั้งก่อนที่มี “ไอเดียดีๆ” แบบนี้ ผลลัพธ์ก็คือ น้ำมันเบนซินผสมตะกั่ว

    • สุดท้ายแล้วดูเหมือนเป้าหมายปลายทางคือการ ฝัง AI ลงใน Chrome โดยตรง
      อีกสัก 20 ปีข้างหน้า Gemini น่าจะถูก bundle มาแบบสะดวกเกินไปจนโดนฟ้องผูกขาด
      เอกสารที่เกี่ยวข้อง: Chrome Built-in AI APIs
    • แนวคิดนี้ทำให้นึกถึงช่วงที่เอา ‘Full Autopilot’ มาทดสอบแบบเบตากับมนุษย์จริงๆ
      พูดเล่นก็ส่วนพูดเล่น แต่ก็ต้องยอมรับที่ CEO ของ Anthropic ยังยึดแนวทางแบบยึดหลักการ โดยเฉพาะการทำ เอเจนต์เขียนโค้ดบนเทอร์มินัล ออกมาได้น่าสนใจมาก
    • อันนี้ทำให้นึกถึงมีม “วงจรนี้ไม่มีวันจบ” ใน xkcd 2044
    • นี่หมายความว่าอาจกำลังรันเครื่องมืออย่าง Claude Code บนบัญชีส่วนตัวหรือบัญชีบริษัทแบบตรงๆ โดยไม่มี VM แยกขาด งั้นเหรอ?
      ไม่ได้พูดเล่นนะ ช็อกจริงๆ
    • ความเร็วของนวัตกรรม ในระยะสั้นอาจกลบความกังวลด้านความปลอดภัยระยะยาวได้
      ตอนนี้ยังเป็นระดับอัลฟาเลยต้องมีคำเตือนแปะไว้ และโมเดลความปลอดภัยก็น่าจะค่อยไปทำทีหลัง
  • ดูเหมือน Claude จะมี สิทธิ์เข้าถึงเครื่องมือ ที่ทำให้รัน JS บนเว็บเพจผ่าน Chrome debugger ได้
    แต่ไม่ต้องห่วงนะ เขามี ตัวกรอง regex กันข้อมูลลับรั่วไหล
    const r = [/password/i, /token/i, /secret/i, ...]

    • ถ้าบอกว่า “ช่วยอย่าให้รหัสผ่านหรือโทเค็นหลุดนะ” ก็คงตอบว่า “ได้เลย! นี่ regex ครับ”
    • ก่อนหน้านี้มันก็สร้างคำสั่ง curl ได้อยู่แล้ว อันนี้อันตรายกว่าจริงเหรอ?
    • คำว่า “comprehensive” นี่ชวนขำอย่างเดียว
  • ความกังวลด้านความปลอดภัยนั้นสมเหตุสมผล แต่ในความเป็นจริงเราก็ ข้าม Rubicon กันมาแล้วด้วยเครื่องมืออย่าง Claude Code หรือ Playwright MCP
    ผมใช้ Claude Code แบบให้ เข้าถึงทั้งระบบ มาหลายเดือนแล้ว
    มันอ่านไฟล์ได้ รัน bash ได้ ไปจนถึง git push ได้เลย ระบบอัตโนมัติบนเบราว์เซอร์จริงๆ แล้วเสี่ยงน้อยกว่าอีก
    คำถามที่แท้จริงไม่ใช่ว่า “จะให้ AI เข้าถึงไหม?” แต่คือ “จะออกแบบให้มนุษย์เป็นคนอนุมัติการตัดสินใจสำคัญเองไหม?
    ผมตั้งงานเกี่ยวกับ credential หรือการจ่ายเงินไว้ให้อนุมัติด้วยมือ และใช้มันกับ QA testing หรืองานกรอกฟอร์มซ้ำๆ

    • ผมเองก็รันเครื่องมือพัฒนาทุกตัวแบบ แยกใน VM มาตั้งแต่ปี 2003 แล้ว
    • ส่วนตัวรู้สึกว่า แนวทาง container-first ปลอดภัยกว่า
      แบบเอา LLM ไปผูกกับหน้าต่าง QubesOS เพื่อให้พฤติกรรมที่ไม่กำหนดแน่ชัดส่งผลได้แค่ในพื้นที่จำกัด
      ถ้าไม่มีระบบ backup, rollback, recovery ที่ชัดเจนก็เสี่ยงมาก
      แบบอุดมคติคือ push ZFS snapshot ไปที่ rsync.net แต่ก็ยังสงสัยว่าโซลูชันง่ายๆ อย่าง Time Machine ยังมีอยู่ไหม
    • จะบอกว่า “เราข้าม Rubicon มาแล้ว” ก็จริง แต่ ‘เรา’ ไม่ได้หมายถึงทุกคน
      ยังมีคนอีกมากที่ยังไม่ใช้เครื่องมือ AI เลย และถ้ามันถูกติดมากับ Chrome เป็นค่าปริยายก็จะเลี่ยงได้ยากขึ้น
    • อยากรู้ว่าส่วนใหญ่คุณเอาไปใช้ทำอะไรบ้าง
  • เมื่อวานผมลองให้ Claude วิเคราะห์รายการบันทึก Zillow 70 รายการ แต่ดันสรุป การลดราคาบ้าน ได้ไม่ดีเลย
    มันเหมือนทำเป็นไล่อ่านทั้งหน้า แต่จริงๆ แล้วไม่ได้ทำ
    ดูเหมือนจะเป็น การวิเคราะห์จากภาพหน้าจอ ไม่ได้อ่าน DOM ตรงๆ น่าจะเป็นการประนีประนอมเพื่อประหยัดโทเค็น
    ต่อให้ผมเป็นคนที่เคยสงสัยใน AI ก็ยังเห็นศักยภาพนะ แต่ตัวนี้ตามหลังผลิตภัณฑ์อื่นของ Anthropic อยู่มาก

    • ถ้าในพรอมป์ต์ระบุ ชื่อเครื่องมือ ไปตรงๆ อย่าง “ดึงด้วย WebFetch” มันจะทำงานดีกว่า
    • กลยุทธ์การป้อนภาพหน้าจอให้มันนี่ไม่มีประสิทธิภาพ
      จัดการ HTML เป็น XML แล้วให้ดึงเฉพาะข้อมูลที่ต้องการด้วย XPath query จะดีกว่ามาก
    • น่าจะน่าสนใจถ้าลองผ่าน Playwright MCP ด้วย API ควบคุมเบราว์เซอร์ระยะไกลที่มีอยู่เดิม
    • ถ้าจะบอกว่า “ตามหลังเป็นปีแสง” สำหรับวงการ AI ก็อาจแปลว่า อีก 3 เดือนก็ตามทัน
    • LLM มี แนวคิดเรื่องเวลา อ่อนมาก เลยไม่เก่งกับงานที่ต้องซิงก์จังหวะ
      เพราะงั้น UX แบบข้อความ/CLI ถึงดีกว่า และวิธีแบบ std in/out ก็น่าจะเหมาะที่สุด
  • พอ Claude Code หางานใน CLI หรือ public API ไม่เจอ มันก็เลยเปิดแอปผ่าน ฟีเจอร์เชื่อมกับ Chrome
    แล้วดึง access token จากคุกกี้ เพื่อเข้า private API โดยตรง
    เป็นยุคสมัยที่น่าทึ่งจริงๆ

    • มีความเสี่ยงด้านความปลอดภัยอยู่ก็จริง แต่ ความสามารถในการแก้ปัญหา นี่สุดยอด
      มันไม่พล่ามหรือยอมแพ้ แต่ใช้เครื่องมือที่มีอยู่แบบสร้างสรรค์
    • ผลลัพธ์แบบนี้เจ๋งจริง
  • ทั้งที่เน้นเรื่องความปลอดภัย แต่กลับใช้ สิทธิ์ Debugger จนทำให้อุปกรณ์ช้าลง เปิดช่องโหว่ และเจอปัญหา CAPTCHA
    ผมกำลังพัฒนาส่วนขยายคู่แข่งชื่อ rtrvr.ai และออกแบบมาให้ หลีกเลี่ยงสิทธิ์อ่อนไหว
    ถ้า Claude จะปล่อยให้ผู้ใช้ทั่วไปใช้ ก็ต้องมีแนวทางแบบนี้

    • ทั้งที่สั่งงานที่ไม่ต้องแตะสเปรดชีตเลย แต่มันก็ยังร้องขอ สิทธิ์เข้าถึง Google Drive อยู่เรื่อยๆ
    • กลิ่นโฆษณามาเต็ม แต่ชื่อบริษัทแบบ สไตล์ปี 2004 ที่ไม่มีสระ ก็ตลกดี
  • ตอนนี้ Google ให้ฟีเจอร์นี้กับผู้สมัครใช้บริการแบบทดลอง เดือนละ 125 ดอลลาร์
    ดูได้ที่ Google Labs Mariner
    ทำ browser automation ผ่าน Gemini CLI ก็ได้เหมือนกัน แต่ ความโต้ตอบ จะด้อยกว่าและเข้าถึง main profile ได้จำกัดกว่า

    • แบบฟรีก็ทำอะไรคล้ายๆ กันได้
      สร้าง workspace เปล่าๆ แล้วบอกว่า “ช่วยทำ X บนเบราว์เซอร์ให้หน่อย” มันก็จะเปิด Chrome แล้วคลิก เลื่อน ฯลฯ ให้
    • ผมใช้ Chrome DevTools MCP กับงานพัฒนาเว็บและงานทดสอบได้ดีมาก
      Claude Code ทำตัวเหมือนผู้ใช้จริงและอ่านแม้กระทั่ง console output ได้
      ไม่ได้เอาไว้ใช้โต้ตอบกับเว็บไซต์คนอื่น แต่สำหรับงานพัฒนานี่เยี่ยมมาก
  • การเอา Claude ใส่เข้าไปในเบราว์เซอร์โดยตรงนั้นสะดวกก็จริง แต่ ส่วนขยายเบราว์เซอร์เป็นชั้นที่อ่อนไหวมาก
    พอ AI ทำงานในรูปแบบส่วนขยาย คำถามสำคัญก็ไม่ใช่ “มีประโยชน์แค่ไหน” แต่คือ “มันเข้าถึงข้อมูลอะไรได้บ้าง
    ต้องชัดเจนว่ามันอ่านเนื้อหาในหน้าไหนได้บ้าง ประมวลผลพรอมป์ต์/คำตอบอย่างไร และยังเก็บข้อมูลไว้หลังจบเซสชันหรือไม่
    สำหรับเบราว์เซอร์แล้ว ความโปร่งใสและหลักสิทธิ์ขั้นต่ำ คือหัวใจสำคัญ

  • นี่แทบจะเป็นแนวคิดที่มาแทน Chrome DevTools MCP แต่ รีวิวบน Chrome Web Store ไม่ค่อยดีเท่าไร

  • ปกติเราเองยังไม่ให้มนุษย์มี สิทธิ์เข้าถึงเบราว์เซอร์ ระดับนี้เลย แล้วทำไมถึงอยากให้ AI มี?

    • บางทีเราอาจกำลัง ทำให้ LLM ดูเป็นมนุษย์ ทั้งที่จริงๆ แล้วมันอาจเป็นแค่ เครื่องคิดเลขขั้นสูง
      มันยังห่างไกลจากจิตสำนึกแบบมนุษย์ แต่ก็อาจมองได้ว่าเป็นวิวัฒนาการขั้นถัดไปของเครื่องคิดเลข
      เพราะงั้นสิทธิ์เข้าถึงที่อันตรายสำหรับมนุษย์ เราอาจยอมให้ LLM ได้
      คล้ายแนวคิดเรื่อง โกลัม (Golem) สิ่งที่มนุษย์จินตนาการถึงมานานแต่สร้างจริงไม่ได้เสียที
      ดู บทความวิกิของ Golem