16 คะแนน โดย GN⁺ 2025-01-10 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Stagehand เป็นเฟรมเวิร์ก AI สำหรับการท่องเว็บที่เรียบง่ายและขยายต่อได้ และเข้ากันได้กับ Playwright อย่างสมบูรณ์
    • มี AI API แบบเรียบง่าย 3 ตัว ได้แก่ act, extract, observe ที่ช่วยให้ทำงานอัตโนมัติบนเว็บผ่านภาษาธรรมชาติได้
    • ช่วยให้ผู้ใช้ที่ไม่ใช่สายเทคนิคเข้าถึงได้ง่ายขึ้น และมีความเปราะบางต่อการเปลี่ยนแปลงเล็กน้อยของ UI/DOM น้อยลง
    • ตัวอย่าง: ดึงข่าวยอดนิยมจาก Hacker News, ค้นหาและซื้อ AirPods บน Amazon, ค้นหาสถิติ 10 เกมล่าสุดของ Steph Curry บน ESPN
  • สามารถเขียนโค้ดทำงานอัตโนมัติบนเบราว์เซอร์ที่ทนทานและมีประสิทธิภาพได้อย่างง่ายดาย
  • เมื่อใช้งานร่วมกับ Browserbase จะมีเครื่องมือดีบักที่ยอดเยี่ยม เช่น การเล่นซ้ำเซสชันและการดีบักทีละขั้นตอน
  • Stagehand ยังอยู่ในสถานะรีลีสเริ่มต้น และกำลังรวบรวมฟีดแบ็กจากชุมชนอย่างจริงจัง
  • ใบอนุญาต MIT

1 ความคิดเห็น

 
GN⁺ 2025-01-10
ความคิดเห็นจาก Hacker News
  • มีความเห็นว่าหากใช้ Stagehand เพื่อดึงข้อมูลจากหน้าเว็บ คงจะดีถ้าสามารถคืนค่าองค์ประกอบ xpath ที่ใช้สแครปหน้าเดิมได้อีกครั้งโดยไม่ต้องใช้ LLM

    • ตอนสแครปหน้าใหม่สามารถใช้เครื่องมือ LLM ที่ไม่เป็นเชิงกำหนดได้ และตอนสแครปซ้ำเพื่ออัปเดตเนื้อหาสามารถใช้วิธีสแครปแบบดั้งเดิมได้
    • มีข้อสงสัยว่าการเปลี่ยนจากเวอร์ชัน LLM ไปเป็นเวอร์ชัน xcode จะเสถียรแค่ไหน และถ้าสคริปต์ xcode ล้มเหลวจะสามารถย้อนกลับไปใช้เวอร์ชัน LLM ได้หรือไม่
    • มีความเห็นว่าการใช้เครื่องมืออัจฉริยะสแครปก่อน แล้วค่อย ๆ สร้างไลบรารีสคริปต์สแครปแบบง่ายขึ้นตามเวลา น่าจะมีประโยชน์
  • ไม่เห็นด้วยกับแนวคิดที่ว่า Stagehand ควรมาแทนที่ Playwright เป็นต้น

    • โดยส่วนตัวอยากใช้มันเป็นเวิร์กโฟลว์ขั้นกลางสำหรับสร้างโค้ด Playwright แบบกำหนดผลได้ แต่เครื่องมือนี้ดูเหมือนถูกออกแบบมาเพื่อรันโดยตรง
    • มีความเห็นว่าการใช้ LLM ตอนรันไทม์ในเทสต์สวีตที่กำลังทำงานอยู่นั้นน่าจะเป็นเรื่องยากที่จะโน้มน้าวให้ยอมรับ
  • เคยพยายามทำ workflow automation โดยใช้เฟรมเวิร์กที่คล้ายกัน แต่ต้องหยุดเพราะ invisible captcha

    • อินสแตนซ์ Playwright อาจถูกตรวจจับได้จากวิธีที่มันโต้ตอบกับ DOM
    • มองว่าการ crawling และ scraping กำลังกลายเป็นสิ่งที่ควบคุมไม่ได้ และมีโอกาสจะกลายเป็นมาตรฐาน
  • มีความเห็นว่าชื่อ "create-browser-app" ทั่วไปเกินไป และควรตั้งชื่อว่า "stagehand"

  • ก่อนสร้างแพลตฟอร์มทดสอบสำหรับ testdriver.ai เคยทำ SDK ที่คล้ายกันชื่อ Goodlooks แต่ไม่ได้รับกระแสตอบรับมากนัก

    • แชร์ลิงก์ไว้สำหรับผู้ที่สนใจ
  • หลังจากลองใช้ Stagehand แล้ว พบว่าเป็น abstraction ที่มีประโยชน์

    • มีประโยชน์ในการสร้างสแครปเปอร์สำหรับเว็บไซต์ที่ตั้งใจขัดขวาง เพราะมีพร็อกซีและแคปชาฝังมาให้ในตัว
    • สงสัยว่ามีแผนจะทำ abstraction ที่คล้ายกันสำหรับ MCP และการใช้งานคอมพิวเตอร์หรือไม่
  • ชอบที่ Stagehand มุ่งทำให้ browser automation ทนต่อการเปลี่ยนแปลงของ DOM มากขึ้น

    • เมธอด act, extract, observe สะอาดมาก
    • แนะนำ Lightpanda ซึ่งเป็นเบราว์เซอร์ headless แบบ lightweight และโอเพนซอร์ส
  • สงสัยว่ามีความเป็นไปได้ที่จะทำ automation กับแท็บเบราว์เซอร์ที่เปิดอยู่เดิมได้หรือไม่

  • กำลังติดตามความเร็วอันน่าทึ่งของทีมนี้ในการพัฒนาผลิตภัณฑ์บน Slack และตั้งตารอความคืบหน้าต่อไป

  • สงสัยว่ามันทำงานโดยแปลง AI methods ให้เป็น sub-methods ของ Playwright หรือไม่ และสามารถดีบักเมธอดจริงที่ถูกแปลงแล้วได้หรือไม่

    • มีข้อสงสัยว่าในการรันเทสต์แต่ละครั้งจะได้คำสั่งที่ต่างกันหรือไม่ หรือมีพฤติกรรมแบบกำหนดผลได้