8 คะแนน โดย xguru 2024-12-18 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • วิธีใหม่ในการใช้งานเบราว์เซอร์
  • ทำงานอัตโนมัติกับงานบนเบราว์เซอร์โดยอาศัยความสามารถด้านความเข้าใจและการให้เหตุผลแบบมัลติโหมดอันทรงพลังที่ขับเคลื่อนด้วย Gemini 2.0
  • เข้าใจและให้เหตุผลกับทุกองค์ประกอบบนหน้าจอเบราว์เซอร์ ไม่ว่าจะเป็นพิกเซล ข้อความ โค้ด รูปภาพ ฟอร์ม ฯลฯ
  • Native Multimodality : เข้าใจและให้เหตุผลกับคอนเทนต์ทั้งหมดบนเบราว์เซอร์
    • วิเคราะห์องค์ประกอบที่ซับซ้อนของเว็บไซต์ เช่น ข้อความ โค้ด รูปภาพ เป็นต้น
    • ตอบสนองต่อคำสั่งเสียง และแสดงผลตอบกลับด้วยภาพเกี่ยวกับความคืบหน้าของงาน
  • Browser Interaction : เข้าใจและนำทางเว็บไซต์ที่ซับซ้อนแบบเรียลไทม์
    • โต้ตอบกับเว็บไซต์แทนผู้ใช้
    • ทำงานซ้ำ ๆ ให้เป็นอัตโนมัติเพื่อประหยัดเวลา
    • หากไม่เข้าใจคำสั่ง จะขอคำอธิบายเพิ่มเติมอย่างชัดเจน
    โฆษณา
  • Reasoning : เข้าใจคำสั่งที่ซับซ้อนและแยกออกเป็นขั้นตอนที่สามารถนำไปปฏิบัติได้เพื่อดำเนินการ
    • ทำความเข้าใจความสัมพันธ์และหน้าที่ขององค์ประกอบต่าง ๆ บนเว็บ
    • แสดงแผนงานและกระบวนการดำเนินการอย่างโปร่งใส เพื่อให้ผู้ใช้เข้าใจกระบวนการตัดสินใจได้
  • ขณะนี้เปิดให้ใช้งานเฉพาะกับกลุ่มทดสอบแบบจำกัดที่เชื่อถือได้เท่านั้น : หากต้องการเข้าร่วมการทดสอบ ต้องลงทะเบียนในรายชื่อรอ

1 ความคิดเห็น

 
iolothebard 2024-12-18

เบราว์เซอร์แบบ headless ที่ปรับให้เหมาะกับ AI กำลังจะออกมา…
เว็บเซิร์ฟเวอร์ก็จะส่งการตอบสนองที่ปรับให้เหมาะกับเบราว์เซอร์นั้น…
วันที่พวกมัน(?)คุยกันเองคงอีกไม่นาน…