ทักษะสำหรับหลบเลี่ยงการตรวจจับบอตของ Playwright
(github.com/greekr4)เมื่อเข้าเว็บด้วย Playwright มักจะโดนระบบตรวจจับบอตบล็อกทันทีบ่อยมาก ผมเลยลองเอาสนิปเพ็ต "stealth" ที่ลอยอยู่ตามอินเทอร์เน็ตมาติดดู ปรากฏว่าบางอันกลับถูกจับได้ง่ายขึ้นเสียอีก เลยไปวัดผลเองกับตัวตรวจจับ 8 ตัว แล้วคัดเฉพาะชุดที่ผ่านได้จริงมาทำเป็นทักษะนี้
การติดตั้ง / การใช้งาน
- ติดตั้ง:
npx skills add greekr4/playwright-bot-bypass - ใช้งาน: เรียก
playwright-bot-bypass
จุดที่ค่อนข้างน่าแปลกใจ
- การปลอม
navigatorที่นิยมใช้กันบ่อย ๆ (ปลั๊กอินปลอม, canvas noise, ลบwebdriverฯลฯ) กลับไม่ตรงกับ Chrome จริงแบบละเอียด ทำให้ยิ่งกลายเป็นสัญญาณให้ตรวจจับได้ง่ายขึ้น หนึ่งในนั้นถึงขั้นทำให้ Chrome จริงแครชด้วย - เพราะอย่างนั้นเลยตัดการปลอมทั้งหมดออก แล้วปล่อยให้ Chrome จริง (headed) จัดการแทน พร้อมลบร่องรอยของ Playwright แค่ 2 จุด (
__pwInitScriptsออก + ปิดกั้นการรั่วของ CDP จาก rebrowser) - สรุปคือ "ยิ่งแต่งน้อย ยิ่งไม่โดนจับ"
ยินดีรับฟีดแบ็ก — โดยเฉพาะรายงานแบบ "ตัวตรวจจับนี้ยังทะลุไม่ได้" จะนำไปปรับปรุงครับ
ยังไม่มีความคิดเห็น