Project Mariner ของ Google DeepMind - เครื่องมืออัตโนมัติสำหรับเบราว์เซอร์

xguru · 2024-12-18T11:07:01+09:00

วิธีใหม่ในการใช้งานเบราว์เซอร์ ทำงานอัตโนมัติกับงานบนเบราว์เซอร์โดยอาศัยความสามารถด้านความเข้าใจและการให้เหตุผลแบบมัลติโหมดอันทรงพลังที่ขับเคลื่อนด้วย Gemini 2.0 เข้าใจและให้เหตุผลกับทุกองค์ประกอบบนหน้าจอเบราว์เซอร์ ไม่ว่าจะเป็นพิกเซล ข้อความ โค้ด รูปภาพ ฟอร์ม ฯลฯ Native Multimodality : เข้าใจและให้เหตุผลกับคอนเทนต์ทั้งหมดบนเบราว์เซอร์ วิเคราะห์องค์ประกอบที่ซับซ้อนของเว็บไซต์ เช่น ข้อความ โค้ด รูปภาพ เป็นต้น ตอบสนองต่อคำสั่งเสียง และแสดงผลตอบกลับด้วยภาพเกี่ยวกับความคืบหน้าของงาน Browser Interaction : เข้าใจและนำทางเว็บไซต์ที่ซับซ้อนแบบเรียลไทม์ โต้ตอบกับเว็บไซต์แทนผู้ใช้ ทำงานซ้ำ ๆ ให้เป็นอัตโนมัติเพื่อประหยัดเวลา หากไม่เข้าใจคำสั่ง จะขอคำอธิบายเพิ่มเติมอย่างชัดเจน Reasoning : เข้าใจคำสั่งที่ซับซ้อนและแยกออกเป็นขั้นตอนที่สามารถนำไปปฏิบัติได้เพื่อดำเนินการ ทำความเข้าใจความสัมพันธ์และหน้าที่ขององค์ประกอบต่าง ๆ บนเว็บ แสดงแผนงานและกระบวนการดำเนินการอย่างโปร่งใส เพื่อให้ผู้ใช้เข้าใจกระบวนการตัดสินใจได้ ขณะนี้เปิดให้ใช้งานเฉพาะกับกลุ่มทดสอบแบบจำกัดที่เชื่อถือได้เท่านั้น : หากต้องการเข้าร่วมการทดสอบ ต้องลงทะเบียนในรายชื่อรอ

(deepmind.google)

8 คะแนน โดย xguru 2024-12-18 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

วิธีใหม่ในการใช้งานเบราว์เซอร์
ทำงานอัตโนมัติกับงานบนเบราว์เซอร์โดยอาศัยความสามารถด้านความเข้าใจและการให้เหตุผลแบบมัลติโหมดอันทรงพลังที่ขับเคลื่อนด้วย Gemini 2.0
เข้าใจและให้เหตุผลกับทุกองค์ประกอบบนหน้าจอเบราว์เซอร์ ไม่ว่าจะเป็นพิกเซล ข้อความ โค้ด รูปภาพ ฟอร์ม ฯลฯ
Native Multimodality : เข้าใจและให้เหตุผลกับคอนเทนต์ทั้งหมดบนเบราว์เซอร์
- วิเคราะห์องค์ประกอบที่ซับซ้อนของเว็บไซต์ เช่น ข้อความ โค้ด รูปภาพ เป็นต้น
- ตอบสนองต่อคำสั่งเสียง และแสดงผลตอบกลับด้วยภาพเกี่ยวกับความคืบหน้าของงาน
Browser Interaction : เข้าใจและนำทางเว็บไซต์ที่ซับซ้อนแบบเรียลไทม์
- โต้ตอบกับเว็บไซต์แทนผู้ใช้
- ทำงานซ้ำ ๆ ให้เป็นอัตโนมัติเพื่อประหยัดเวลา
- หากไม่เข้าใจคำสั่ง จะขอคำอธิบายเพิ่มเติมอย่างชัดเจน
โฆษณา
Reasoning : เข้าใจคำสั่งที่ซับซ้อนและแยกออกเป็นขั้นตอนที่สามารถนำไปปฏิบัติได้เพื่อดำเนินการ
- ทำความเข้าใจความสัมพันธ์และหน้าที่ขององค์ประกอบต่าง ๆ บนเว็บ
- แสดงแผนงานและกระบวนการดำเนินการอย่างโปร่งใส เพื่อให้ผู้ใช้เข้าใจกระบวนการตัดสินใจได้
ขณะนี้เปิดให้ใช้งานเฉพาะกับกลุ่มทดสอบแบบจำกัดที่เชื่อถือได้เท่านั้น : หากต้องการเข้าร่วมการทดสอบ ต้องลงทะเบียนในรายชื่อรอ

1 ความคิดเห็น

iolothebard 2024-12-18

เบราว์เซอร์แบบ headless ที่ปรับให้เหมาะกับ AI กำลังจะออกมา…
เว็บเซิร์ฟเวอร์ก็จะส่งการตอบสนองที่ปรับให้เหมาะกับเบราว์เซอร์นั้น…
วันที่พวกมัน(?)คุยกันเองคงอีกไม่นาน…

Project Mariner ของ Google DeepMind - เครื่องมืออัตโนมัติสำหรับเบราว์เซอร์

บทความที่เกี่ยวข้อง

1 ความคิดเห็น