- มีรายงานกรณีที่บริษัทบางแห่งซึ่งสมัครเข้าร่วม Y Combinator (ต่อไปนี้จะเรียกว่า YC) เก็บรวบรวมข้อมูลกิจกรรมของผู้ใช้ GitHub แบบอัตโนมัติ เพื่อนำไปส่งอีเมลการตลาด
- ผู้โพสต์ชี้ว่าปัญหาคือการได้รับ อีเมลโดยไม่ได้ให้ความยินยอม โดยอิงจาก กิจกรรมคอมมิตและรีโพซิทอรีในโปรไฟล์ GitHub
- มีการระบุว่าอีเมลดังกล่าวถูกส่งไปเพื่อ โปรโมตผลิตภัณฑ์หรือชักชวนให้สมัครใช้บริการ
- ในชุมชนมีเสียงวิจารณ์เกี่ยวกับ ความเป็นส่วนตัวและแนวปฏิบัติด้านการตลาดที่มีจริยธรรม
- เรื่องนี้เป็นอีกจุดเริ่มต้นให้เกิดการถกเถียงอีกครั้งเรื่อง เส้นแบ่งระหว่างการใช้ข้อมูลกับความยินยอมของผู้ใช้ ในระบบนิเวศสตาร์ตอัป
การเก็บข้อมูลกิจกรรมบน GitHub และการส่งอีเมล
- มีรายงานว่าบางสตาร์ตอัปที่เกี่ยวข้องกับ YC สแครปข้อมูลกิจกรรมสาธารณะของผู้ใช้ GitHub เพื่อให้ได้มาซึ่งที่อยู่อีเมล
- ผู้โพสต์อธิบายว่าตน ได้รับอีเมลโปรโมตจากบริษัท YC แห่งหนึ่งหลังจากมีกิจกรรมบน GitHub
- เนื้อหาอีเมลเน้นไปที่ การแนะนำผลิตภัณฑ์และชักชวนให้ใช้งาน
- การกระทำดังกล่าวถูกชี้ว่าเป็นปัญหาเพราะเป็น การนำข้อมูลที่เก็บมาโดยไม่ได้รับความยินยอมจากผู้ใช้ไปใช้ประโยชน์
ปฏิกิริยาจากชุมชนและประเด็นจริยธรรม
- ผู้ใช้ Hacker News วิจารณ์ในเชิงลบ โดยมองว่า การส่งอีเมลโดยไม่ได้รับความยินยอมเป็นการสแปม
- บางคนแย้งว่า แม้จะเป็นข้อมูลสาธารณะ การเก็บรวบรวมอัตโนมัติเพื่อการตลาดก็ไม่เหมาะสม
- การถกเถียงได้ขยายไปสู่ประเด็น ความสมดุลระหว่างกลยุทธ์การเติบโตของสตาร์ตอัปกับการคุ้มครองความเป็นส่วนตัว
- โดยเฉพาะอย่างยิ่ง เนื่องจากเป็นบริษัท YC จึงมีความเห็นว่าควร ถูกคาดหวังในมาตรฐานด้านจริยธรรมที่สูงกว่า
ประเด็นเรื่องการใช้ข้อมูลและความยินยอมของผู้ใช้
- แม้ว่าข้อมูลสาธารณะบน GitHub จะเข้าถึงได้ แต่ก็มีการเน้นย้ำถึงมุมมองที่ว่า หากนำไปใช้เชิงพาณิชย์ ควรต้องมีความยินยอมอย่างชัดเจน
- ชุมชนชี้ว่าจำเป็นต้องมีนโยบายการใช้ข้อมูลอย่างโปร่งใส เพื่อ รักษาความไว้วางใจในระบบนิเวศนักพัฒนา
- กรณีนี้ถูกมองว่าเป็นเหตุการณ์ที่ปลุกให้ตระหนักถึง แนวปฏิบัติการทำการตลาดอัตโนมัติของสตาร์ตอัป
1 ความคิดเห็น
ความเห็นจาก Hacker News
ผมคือ Martin จาก GitHub การกระทำแบบ ขูดข้อมูล นี้ถือว่าละเมิดข้อกำหนดการให้บริการของ GitHub อย่างชัดเจน
หากตรวจพบ เราก็ดำเนินการ เช่น ระงับบัญชี แต่ปัญหานี้ก็ยังเกิดซ้ำเหมือน เกมตีตัวตุ่น
ด้วยโครงสร้างของ Git การดึงข้อมูลจากรีโพซิทอรีโอเพนซอร์สจึงไม่ใช่เรื่องยากในทางเทคนิค เพราะในคอมมิตมีทั้งชื่อและอีเมลรวมอยู่ด้วย
เรามีฟีเจอร์ที่อยู่
no-replyเพื่อให้ผู้ใช้ใช้งาน ที่อยู่อีเมลแบบไม่ระบุตัวตน ตอนคอมมิตวิธีตั้งค่าโดยละเอียดอยู่ในเอกสารทางการ
การรักษาความเปิดกว้างของโอเพนซอร์สไปพร้อมกับการป้องกันสแปมเป็นเรื่องที่หาสมดุลได้ยาก เรายังมีการจำกัด API อยู่ด้วย แต่ก็มีเสียงบ่นมากเช่นกัน อยากฟังความเห็นจากชุมชน
ผมรายงานสแปมเมอร์ไปเมื่อเดือนกรกฎาคม 2025 แต่ไม่ได้รับคำตอบ และบัญชีก็ยังใช้งานอยู่จนถึงตอนนี้
เหตุผลที่ผมเปิดเผยอีเมลไว้ก็เพราะคาดหวังว่าข้อกำหนดจะได้รับการบังคับใช้ ถ้า GitHub ปล่อยสแปมเมอร์ไว้ ก็ยิ่งทำให้รักษาช่องทางติดต่อสาธารณะไว้ได้ยาก
ผมสรุปกรณีที่บริษัทใน YC ส่งสแปมมาที่อีเมล GitHub ของผมไว้ในบล็อกของผม
ผู้ใช้ส่วนใหญ่ไม่ได้ใส่ใจเรื่องความเป็นส่วนตัวมากนัก ดังนั้นกลไกป้องกันแบบนี้จึงมีประโยชน์
เพราะงั้นตอนนี้ผมเลย ไม่กดดาว ให้รีโพซิทอรีไหนอีกเลย
ผมก็ได้รับอีเมลฉบับเดียวกัน
เป็นอีเมลจากทีม RunanywhereAI ที่แนะนำ on-device LLM SDK
พอได้คุยกับทีมจริง ๆ ก็พบว่าพวกเขารับฟังฟีดแบ็กอย่างจริงจัง และก็ปรับปรุง Flutter SDK ได้รวดเร็วมาก
ถึงขั้นเพิ่มการใช้งาน RAG ได้ภายในหนึ่งสัปดาห์เลย การลองใช้ดูก่อนอาจดีกว่าการประณามต่อสาธารณะ
ผมรู้ว่า YC ลงทุนใน Flock แต่ก็สงสัยว่า “ปัญหาด้านจริยธรรมของ YC” ที่ว่าคืออะไรกันแน่
ผมทำการตลาดที่เจาะกลุ่มนักพัฒนามานาน และการ ส่งสแปมไปยังอีเมล GitHub ก็เป็นหนึ่งในวิธีการตลาดที่แย่ที่สุด
การส่งอีเมลหาคนที่ไม่รู้จักให้กับนักพัฒนาแทบไม่ได้ผล และยังทำลายความเชื่อมั่นต่อแบรนด์อีกด้วย
มันต่างจากสแปมอัตโนมัติธรรมดาอย่างสิ้นเชิง
มีเหตุผลที่ YC ถามในใบสมัครว่า “คุณเคยแฮกระบบเพื่อหาประโยชน์ไหม”
เพราะพวกเขาชอบผู้ก่อตั้งที่รู้วิธีใช้ประโยชน์จาก พื้นที่สีเทาทางกฎหมาย
Airbnb เติบโตโดยฝ่าฝืนข้อกำหนดของ Craigslist, Reddit ขโมยคอนเทนต์จาก Digg, และ OpenAI ก็ฝึกโมเดลด้วยเนื้อหาที่มีลิขสิทธิ์
ผมก็ได้รับ อีเมลสแปมที่ไม่ต้องการ จาก Vincent Jiang ของบริษัท YC ชื่อ Aden
เนื้อหาเป็นการชวนเข้าคอมมูนิตี้สำหรับการพัฒนา AI agent
ผมทำเครื่องหมายฉบับแรกเป็นสแปมแล้ว แต่ก็ยังมีอีเมลตามมาอีกว่า “ขอเช็กเป็นครั้งสุดท้าย”
บริษัทแบบนี้ผมจะไม่ใช้อีกเลย
พอตอบกลับไปก็ได้รับแต่ข้อความตอบกลับอัตโนมัติ
วันนี้ผมก็ยังได้รับสแปมผ่านอีเมล GitHub จากบริษัทที่เกี่ยวข้องกับ YC ชื่อ Cactus Compute
พวกเขาแนะนำเอนจินโมเดลเสียงแบบ on-device และส่งลิงก์รีโพซิทอรี GitHub cactus-compute/cactus มาให้
ประเด็นนี้เป็นหัวข้อที่ถูกพูดถึงมาหลายครั้งแล้วในอดีต
มีการพูดถึงแบบเดียวกันนี้เมื่อ 11 ปีก่อน, 7 ปีก่อน, 5 ปีก่อน, และ 4 ปีก่อน
เป็น ปัญหาเรื้อรัง ที่เกิดซ้ำ
ระหว่างที่อ่านเธรดนี้อยู่ ผมก็ได้รับอีเมลสแปมจาก GitHub scraper เหมือนกัน
ผู้ส่งคือ james@techglobal.website และเป็นอีเมลที่ปลอมตัวเป็นข้อเสนอความร่วมมือกับวิศวกรในสหรัฐฯ
จากประสบการณ์ของผม อีเมลประเภทนี้มีโอกาสสูงที่จะเป็น ความพยายามหลอกลวงจากเกาหลีเหนือ
เผื่อไว้เป็นข้อมูล อีเมลโฆษณาแบบ ไม่ได้รับอนุญาต พวกนี้ถือว่าผิดกฎหมายในยุโรป
ข้ออ้างว่า “ไม่รู้” ใช้ไม่ได้ เพราะใน GitHub profile มักจะมีข้อมูลสถานที่ระบุไว้อยู่แล้ว
สตาร์ตอัปที่เริ่มต้นจากการทำผิดกฎหมายก็ถือว่าติดลบด้าน ความน่าเชื่อถือ ไปแล้ว