เมื่อเข้าเว็บด้วย Playwright มักจะโดนระบบตรวจจับบอตบล็อกทันทีบ่อยมาก ผมเลยลองเอาสนิปเพ็ต "stealth" ที่ลอยอยู่ตามอินเทอร์เน็ตมาติดดู ปรากฏว่าบางอันกลับถูกจับได้ง่ายขึ้นเสียอีก เลยไปวัดผลเองกับตัวตรวจจับ 8 ตัว แล้วคัดเฉพาะชุดที่ผ่านได้จริงมาทำเป็นทักษะนี้

การติดตั้ง / การใช้งาน

  • ติดตั้ง: npx skills add greekr4/playwright-bot-bypass
  • ใช้งาน: เรียก playwright-bot-bypass

จุดที่ค่อนข้างน่าแปลกใจ

  • การปลอม navigator ที่นิยมใช้กันบ่อย ๆ (ปลั๊กอินปลอม, canvas noise, ลบ webdriver ฯลฯ) กลับไม่ตรงกับ Chrome จริงแบบละเอียด ทำให้ยิ่งกลายเป็นสัญญาณให้ตรวจจับได้ง่ายขึ้น หนึ่งในนั้นถึงขั้นทำให้ Chrome จริงแครชด้วย
  • เพราะอย่างนั้นเลยตัดการปลอมทั้งหมดออก แล้วปล่อยให้ Chrome จริง (headed) จัดการแทน พร้อมลบร่องรอยของ Playwright แค่ 2 จุด (__pwInitScripts ออก + ปิดกั้นการรั่วของ CDP จาก rebrowser)
  • สรุปคือ "ยิ่งแต่งน้อย ยิ่งไม่โดนจับ"

ยินดีรับฟีดแบ็ก — โดยเฉพาะรายงานแบบ "ตัวตรวจจับนี้ยังทะลุไม่ได้" จะนำไปปรับปรุงครับ

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น