อ่านแล้วสนุกดี ให้ความรู้สึกเหมือนบทความที่เอาระเบิดกลิตเตอร์ไปให้โจรขโมยพัสดุ :)

 

ก็แค่มีวิธีแบบนี้อยู่ด้วยเท่านั้นเองมั้ง..

 

ว้าว.. สุดยอดมากจริงๆ.. เป็นธรรมชาติมากขนาดนี้เลย

 

ช่วงนี้มีให้เห็นเป็นระยะถึงกรณีความเสียหายจากทราฟฟิกที่มากเกินไปซึ่งมาจากบริการที่เชื่อมกับ LLM และจริง ๆ แล้วก็ดูเหมือนจะมองได้ว่าเป็นมาตรการรับมือสำหรับปัญหาประเภทนั้นเช่นกัน ตัวอย่างเช่น หากดูฟังก์ชันค้นหาเว็บของ ChatGPT เป็นต้น ด้วยลักษณะของกลุ่มผู้ใช้ จึงมีความเป็นไปได้สูงที่จะเกิดทราฟฟิกมากเกินไปแบบ “ไม่ได้มีเจตนาร้าย” และได้ยินมาว่าพวกนี้สามารถคัดกรองออกได้ง่ายด้วยการจับคู่เอเจนต์แบบพื้นฐาน ถ้านี่คือเจตนาที่แท้จริง ก็มีแต่จะสิ้นเปลืองค่าเซิร์ฟเวอร์ของ OpenAI (และชื่อเสียง?) ไปเปล่า ๆ นะครับ..

 

ข้อมูลก็ซึมเข้าหูได้อย่างง่ายดายเลย...

 

ในเชิงจริยธรรมก็คงไม่ใช่วิธีที่ดีนัก และก็ไม่ใช่วิธีแก้ปัญหาที่ต้นตอด้วย

 

เป็นบทความที่น่าสนุกดีนะ! เป็นวิธีที่คาดไม่ถึงจริง ๆ ขอบคุณที่บอกให้รู้ครับ!

 

ช่วงนี้ดูเหมือนว่าไม่ใช่แค่ประสิทธิภาพของ foundation model ของ Google ที่ดีขึ้นเท่านั้น แต่ส่วนที่นำไปผสานเข้ากับบริการต่าง ๆ ก็ดีมากเช่นกันครับ

 

https://freederia.com/researcharchive/
เป็นเว็บไซต์นักวิทยาศาสตร์ AI
ทิศทางแบบนี้จะยิ่งส่งเสริมความหลากหลายของแนวทางต่าง ๆ มากขึ้น

 

ประโยคที่ว่า เมื่อรางวัลละเมิดความเป็นอิสระของบุคคล ก็จะบั่นทอนแรงจูงใจภายใน โดนใจมากเลยครับ

 

ผมเห็นด้วยว่าทั้ง User-Agent ที่คุณพูดถึงหรือการตรวจจับตาม IP ที่กล่าวถึงในต้นฉบับนั้น ข้อมูลระบุตัวตนสามารถปลอมแปลงได้ จึงยากจะฟันธงว่าเป็นอันตรายจริงหรือไม่ บอตที่มีเจตนาร้ายจริง ๆ ก็น่าจะเข้ามาอย่างแนบเนียนกว่านี้
ส่วนตัวผมคิดว่าแทนที่จะรับมือกับการโจมตีแบบนี้ การเปิดให้มี crawling API ที่จำกัดโหลดน่าจะเป็น "แรงจูงใจ" ที่สมจริงกว่าคือ อนุญาตให้มีการเข้าถึงอัตโนมัติที่ถูกต้องตามกฎหมายได้ ขณะเดียวกันก็ปกป้องทรัพยากรของเซิร์ฟเวอร์ด้วย 555

 

สุดยอดไปเลยครับ.. คุณภาพดีจนถึงขั้นต่อให้เปลี่ยนเป็นแบบเสียเงินก็ยอมจ่ายใช้
พอได้ฟังหัวข้อที่ตัวเองสนใจในรูปแบบพอดแคสต์ ก็ยิ่งทำให้รับข้อมูลได้อย่างสนใจมากขึ้น
ดีมากจริง ๆ

 

เคยลองแล้ว บอกได้เลยว่าสุดยอดจริงๆ....

ถ้าต้องจ่ายเงินใช้ คงเลือกใช้แค่ตัวนี้ตัวเดียวเลย บริการที่คล้ายกันน่าจะได้รับผลกระทบหนักทีเดียว

 

แน่นอนว่าเพราะไม่ใช่พื้นที่สาธารณะ ก็อาจเป็นแค่โพสต์ที่เขียนขึ้นมาแบบไม่ได้คิดอะไรมากก็ได้
เหมือนกับที่ในคอมมูนิตี้คนอาจคอมเมนต์แบบไม่ได้คิดอะไรมากเช่นกัน
ผมคงไม่สามารถบล็อกครอว์เลอร์ได้ทั้งหมดอยู่แล้ว ดังนั้นการไม่รับแม้แต่ความพยายามเข้ามาน่าจะดีที่สุด แต่ผมก็สงสัยว่าเจตนาที่อยากเรียกความสนใจนั้นคืออะไร

 

ก็เป็นบล็อกส่วนตัวนี่นา จะเขียนอะไรก็ไม่ได้เหรอ? 🤔

 

แล้วรับมือกับการเปลี่ยนเวอร์ชันอย่างไร?

 

จุดประสงค์ของการโพสต์บทความแบบนี้คืออะไรกันแน่?
ผมคิดว่าในความเป็นจริง แทบไม่มีโอกาสเลยที่บริษัทที่รันครอว์เลอร์จะมาอ่านบทความนี้แล้วถึงขั้นยกเว้นไม่เก็บข้อมูลจากเว็บนี้
ถ้าอย่างนั้น บทความนี้เขียนขึ้นมาเพื่อผู้อ่านกลุ่มไหนกัน?
เป็นบทความแนะนำเพื่อบอกคนที่ทำบล็อกเหมือนกันว่ามีวิธีแบบนี้อยู่
หรือเป็นการยั่วประมาณว่า บล็อกของฉันแน่นเรื่องความปลอดภัยขนาดนี้ ถ้าแน่จริงก็ลองครอว์ลดูสิ?
ผมสงสัยจริง ๆ ว่าการโพสต์บทความนี้แล้วจะได้อะไร