- พัฒนาบอทครอว์ลิงที่ใช้ ChatGPT เพื่อรวบรวมข้อมูลสินค้าจาก Coupang
- คอลัมน์ที่จะเก็บมี ชื่อสินค้า, ราคาปกติ, ราคาขาย, คะแนนดาว, จำนวนรีวิว, ข้อมูลส่วนลดบัตร, ข้อมูลการสะสมแต้ม, ข้อมูลการจัดส่ง
- วิธีลดขนาด HTML เพื่อหลีกเลี่ยงข้อจำกัดจำนวนโทเค็น และข้อควรคำนึงเมื่อเขียนพรอมป์ต์
- ข้ามสินค้าที่เป็นโฆษณา
- จัดการกรณียกเว้นเมื่อโครงสร้าง DOM แตกต่างกัน
- ตรวจสอบคอลัมน์ที่จำเป็น (ชื่อสินค้า, ราคา)
- ChatGPT เป็นเครื่องมือที่มีประโยชน์มาก แต่ยังต้องมีการดีบักและปรับแก้เล็กน้อย (สุดท้ายแล้วผู้เชี่ยวชาญจะได้รับประโยชน์มากกว่า)
- หากต้องการเก็บข้อมูลจำนวนมาก ต้องพิจารณาเรื่องการหลบเลี่ยงการบล็อก
5 ความคิดเห็น
ดูเหมือนว่าแม้แต่โพสต์นี้เองก็เขียนด้วย GPT ทั้งหมดเลยนะ
ดูเหมือนว่าจะสรุปได้แบบนี้นะครับ..
กำลังสร้างครอว์เลอร์ด้วย ChatGPT อยู่ และได้รับความช่วยเหลืออย่างมากในเรื่องการพาร์สและการดึง XPath
เป็นบทความเกี่ยวกับการทำครอว์ลิงด้วย GPT ก็จริง แต่สุดท้ายก็เป็นโฆษณา HashScraper นี่เอง
บล็อกเทคก็เป็นแบบนี้กันทั้งนั้นไม่ใช่เหรอครับ.. ฮ่าๆ