- CLI สำหรับการทำเบราว์เซอร์อัตโนมัติแบบ headless สำหรับ AI เอเจนต์
- เปลี่ยนจากโครงสร้างเดิมแบบ node.js + playwright + CDP ให้ Rust binary เรียก CDP โดยตรง
- เป็นเดมอนแบบสแตนด์อโลน จึงไม่มีโปรเซส Node.js ในรันไทม์ ทำให้ใช้หน่วยความจำน้อยลงและมี footprint เล็กลง
- คำสั่งเวิร์กโฟลว์ที่เป็นมิตรกับ AI
- คำสั่ง
snapshot ใช้ดึง accessibility tree และสร้าง ref ที่ไม่ซ้ำกัน (@e1, @e2) เพื่อทำงานบนพื้นฐานนี้ (ยังรองรับ selector แบบดั้งเดิม)
- การนำทางหน้า (
open, goto), การคลิก·ป้อนข้อมูล (click, fill, type, hover, check, ..), การสร้างภาพหน้าจอ·PDF (screenshot, pdf)
- การดูสถานะ (
get text, get attr), การตรวจสอบสถานะ (is), การรอ (wait), การควบคุมเมาส์·คีย์บอร์ด (mouse, keyboard)
- การค้นหาองค์ประกอบ (
find), การตั้งค่าเบราว์เซอร์ (set), แท็บ/หน้าต่าง/เฟรม/ไดอะล็อก (tab, window, frame, dialog)
- การเปรียบเทียบ (
diff) : เปรียบเทียบด้วย snapshot/ภาพหน้าจอ/URL เป็นต้น
- รองรับการจัดการเซสชัน·สตอเรจ·คุกกี้ (
cookie, storage), การดักจับและม็อก network request (network route)
- รัน อินสแตนซ์เบราว์เซอร์แบบแยกกัน ด้วย
--session
- คงสถานะ การล็อกอิน·สตอเรจ ด้วย
--profile หรือ --session-name
- รองรับการสร้าง ภาพหน้าจอแบบมีคำอธิบายประกอบพร้อมหมายเลของค์ประกอบ ด้วยออปชัน
--annotate
- มี Rust binary สำหรับ macOS, Linux, Windows โดยเฉพาะ และรองรับ Node.js fallback
- ไลเซนส์ Apache-2.0
2 ความคิดเห็น
ผมใช้งานอยู่แบบดีมากจริง ๆ ประสิทธิภาพการใช้โทเคนก็ดีด้วย
เหมือนผมยังไม่เคยแนะนำ
agent-browserเลยนะ ช่วงนี้มีอะไรเยอะเกินไปจนคงหลุดไป 555มีการเพิ่มอาร์กิวเมนต์
--nativeแบบ experimental เข้ามาใหม่ ทำให้มันเล็กลงและเร็วขึ้นhttps://x.com/ctatedev/status/2028960626685386994
เป็นอีกหนึ่งโปรเจ็กต์ของ Chris Tate ผู้สร้าง portless - เครื่องมือแทนที่หมายเลขพอร์ตด้วย URL
.localhostตามชื่อ ครับ