- วิธีใหม่ในการใช้งานเบราว์เซอร์
- ทำงานอัตโนมัติกับงานบนเบราว์เซอร์โดยอาศัยความสามารถด้านความเข้าใจและการให้เหตุผลแบบมัลติโหมดอันทรงพลังที่ขับเคลื่อนด้วย Gemini 2.0
- เข้าใจและให้เหตุผลกับทุกองค์ประกอบบนหน้าจอเบราว์เซอร์ ไม่ว่าจะเป็นพิกเซล ข้อความ โค้ด รูปภาพ ฟอร์ม ฯลฯ
- Native Multimodality : เข้าใจและให้เหตุผลกับคอนเทนต์ทั้งหมดบนเบราว์เซอร์
- วิเคราะห์องค์ประกอบที่ซับซ้อนของเว็บไซต์ เช่น ข้อความ โค้ด รูปภาพ เป็นต้น
- ตอบสนองต่อคำสั่งเสียง และแสดงผลตอบกลับด้วยภาพเกี่ยวกับความคืบหน้าของงาน
- Browser Interaction : เข้าใจและนำทางเว็บไซต์ที่ซับซ้อนแบบเรียลไทม์
- โต้ตอบกับเว็บไซต์แทนผู้ใช้
- ทำงานซ้ำ ๆ ให้เป็นอัตโนมัติเพื่อประหยัดเวลา
- หากไม่เข้าใจคำสั่ง จะขอคำอธิบายเพิ่มเติมอย่างชัดเจน
- Reasoning : เข้าใจคำสั่งที่ซับซ้อนและแยกออกเป็นขั้นตอนที่สามารถนำไปปฏิบัติได้เพื่อดำเนินการ
- ทำความเข้าใจความสัมพันธ์และหน้าที่ขององค์ประกอบต่าง ๆ บนเว็บ
- แสดงแผนงานและกระบวนการดำเนินการอย่างโปร่งใส เพื่อให้ผู้ใช้เข้าใจกระบวนการตัดสินใจได้
- ขณะนี้เปิดให้ใช้งานเฉพาะกับกลุ่มทดสอบแบบจำกัดที่เชื่อถือได้เท่านั้น : หากต้องการเข้าร่วมการทดสอบ ต้องลงทะเบียนในรายชื่อรอ
1 ความคิดเห็น
เบราว์เซอร์แบบ headless ที่ปรับให้เหมาะกับ AI กำลังจะออกมา…
เว็บเซิร์ฟเวอร์ก็จะส่งการตอบสนองที่ปรับให้เหมาะกับเบราว์เซอร์นั้น…
วันที่พวกมัน(?)คุยกันเองคงอีกไม่นาน…