การฝึกโมเดล AI ของตนเอง
(posthog.com)- PostHog กำลังทดลองฝึกโมเดลด้วยข้อมูลภายใน เพื่อสร้างผลิตภัณฑ์ที่ทำงานเชิงรุกและอัตโนมัติมากขึ้น ต่อจาก AI installation wizard, PostHog AI และ MCP
- เป้าหมายหลักคือ PostHog Code เพื่อสนับสนุนทิศทางผลิตภัณฑ์ที่สามารถค้นหาคำตอบและวิธีแก้ปัญหาแทนผู้ใช้ ลงมือทำ และพัฒนาดีขึ้นเมื่อเวลาผ่านไป
- ต้องการปรับปรุง การวิเคราะห์ session replay, การทดสอบผู้ใช้สังเคราะห์ และการคาดการณ์พฤติกรรมผู้ใช้ เพื่อลดต้นทุนในการตรวจจับปัญหา และค้นหาข้อผิดพลาดหรือจุดที่ทำให้สับสนก่อนปล่อยใช้งานจริง
- ข้อมูลที่ใช้ฝึกจะถูก ทำให้นิรนาม และใช้เฉพาะข้อมูลที่มีอยู่แล้วในอินสแตนซ์ PostHog เท่านั้น โดยจะไม่ขายหรือส่งต่อให้ ผู้ให้บริการโมเดลบุคคลที่สาม
- ลูกค้า EU cloud และลูกค้าที่มีสัญญาจำกัดการฝึกจะถูกยกเว้นโดยค่าเริ่มต้น ส่วน US cloud จะถูกรวมโดยค่าเริ่มต้น และผู้ใช้สามารถ opt-out ได้ก่อนวันที่ 29 มิถุนายน
แผนการฝึกโมเดล AI ของ PostHog
- ในช่วง 1 ปีที่ผ่านมา PostHog ได้เพิ่มความสามารถด้าน AI เข้าไปในผลิตภัณฑ์ เช่น AI installation wizard, PostHog AI และ MCP และต่อจากนี้ต้องการสร้าง ผลิตภัณฑ์ที่ทำงานเชิงรุกและอัตโนมัติมากขึ้น
- ก้าวถัดไปของ PostHog คือการสร้างผลิตภัณฑ์ที่สามารถค้นหาคำตอบและวิธีแก้ปัญหาแทนผู้ใช้ ลงมือทำ และพัฒนาดีขึ้นเมื่อเวลาผ่านไป
- PostHog Code ซึ่งขณะนี้อยู่ในช่วงเบต้า เป็นผลิตภัณฑ์หลักของทิศทางนี้ และเพื่อให้สิ่งนี้เป็นไปได้ บริษัทต้องการ ฝึกโมเดลด้วยข้อมูลภายในของ PostHog
ฟีเจอร์ที่ต้องการสร้าง
- เป้าหมายคือทำให้ผลิตภัณฑ์เดิมฉลาดและทำงานเชิงรุกมากขึ้น และช่วยให้ทีมสร้างผลิตภัณฑ์ที่ดียิ่งขึ้นได้เร็วขึ้นด้วยผลิตภัณฑ์ใหม่อย่าง PostHog Code
-
การวิเคราะห์ session replay
- PostHog AI สามารถตรวจจับปัญหาใน replay ได้อยู่แล้ว แต่มีต้นทุนสูง จึงไม่เหมาะกับการขยายไปใช้ในวงกว้าง
- หากต้องการใช้ replay อย่างทรงพลังในระดับใหญ่เหมือนตอนวิเคราะห์ปัญหาของผู้ใช้รายบุคคล ก็จำเป็นต้องมี โมเดลที่ฝึกจากข้อมูลพื้นฐานที่ประกอบเป็น replay
-
การทดสอบผู้ใช้สังเคราะห์
- การทดสอบผู้ใช้สังเคราะห์ คือแนวคิดในการใช้ความรู้เกี่ยวกับพฤติกรรมผู้ใช้ เพื่อค้นหาจุดที่ผู้ใช้อาจสับสนหรือ flow ที่อาจพังก่อนนำขึ้น production
- เมื่อโมเดลสำหรับเขียนโค้ดดีขึ้น งานด้านการทดสอบและรีวิวก็เพิ่มขึ้นอย่างมาก และ PostHog ต้องการทำงานนี้ให้เป็นอัตโนมัติ เพื่อให้ผู้ใช้โฟกัสกับตัวผลิตภัณฑ์ได้มากขึ้น
-
การคาดการณ์พฤติกรรมผู้ใช้
- หาก การคาดการณ์พฤติกรรมผู้ใช้ ดีขึ้น ก็จะสามารถเสนอการเปลี่ยนแปลงที่ช่วยเพิ่ม conversion และลดความไม่พอใจของผู้ใช้ได้ แม้กับฟีเจอร์ที่ปล่อยใช้งานไปแล้ว
- หากทำให้เป็นอัตโนมัติได้ เวลาที่ใช้วิเคราะห์ด้วยมือก็จะลดลง และจำนวนโทเค็นที่ใช้ในกระบวนการนั้นก็ลดลงด้วย
- แนวคิดเหล่านี้ยังอยู่ในขั้นทดลอง และยังต้องวนซ้ำเพื่อหาวิธีฝึกโมเดลให้ได้ผล รวมถึงค้นหาว่าข้อมูลแบบใดมีประโยชน์จริง
- PostHog ใช้ผลลัพธ์ที่ดีจากกรณีที่ AI ทำให้ผลิตภัณฑ์เรียบง่ายขึ้นหรือทรงพลังขึ้น เป็นเหตุผลสนับสนุนการทดลองครั้งนี้
วิธีการทำงานและหลักการใช้ข้อมูล
- แผนนี้มุ่งเน้นการทำให้ฟีเจอร์เดิมทรงพลังขึ้น และมอบความสามารถที่ช่วยให้ผลิตภัณฑ์พัฒนาตัวเองในเชิงรุกมากขึ้น
- แม้เครื่องมือจำนวนมากจะมุ่งเน้นการให้โค้ดที่ดีที่สุด แต่ PostHog ต้องการมุ่งเน้นไปที่การทำให้ตัวผลิตภัณฑ์ของผู้ใช้ดีขึ้นจริง
- ด้วยเหตุนี้จึงเรียก PostHog Code ว่าเป็น ตัวแก้ไขผลิตภัณฑ์
- ประเด็นสำคัญคือการนำข้อมูลที่อยู่ใน PostHog มาใช้ฝึกโมเดล และ PostHog ต้องการสื่อสารเรื่องนี้อย่างเปิดเผย แทนที่จะซ่อนไว้ในอัปเดตข้อกำหนดการใช้งาน
-
การใช้งานโดยค่าเริ่มต้น
- ผู้ใช้ EU cloud instances จะถูกยกเว้นโดยค่าเริ่มต้น
- ผู้ใช้ที่มีข้อตกลงซึ่งห้ามการฝึก เช่น BAA, MSA หรือสัญญาในลักษณะเดียวกัน ก็จะถูกยกเว้นโดยค่าเริ่มต้นเช่นกัน
- นอกเหนือจากนั้น ผู้ใช้ US cloud instances จะถูกรวมโดยค่าเริ่มต้น
-
การประมวลผลข้อมูลและข้อจำกัด
- ข้อมูลทั้งหมดจะถูก ทำให้นิรนาม ก่อนนำไปใช้ฝึก
- จะใช้เฉพาะข้อมูลที่มีอยู่แล้วในอินสแตนซ์ PostHog ของผู้ใช้เท่านั้น
- การฝึกโมเดลจะดำเนินการโดย PostHog เอง
- จะไม่ขายหรือส่งข้อมูลผู้ใช้ไปยังผู้ให้บริการโมเดลบุคคลที่สาม
-
การ opt-out
- ผู้ใช้สามารถ opt-out ได้ตลอดเวลาที่ การตั้งค่าองค์กรของ PostHog
- การเปลี่ยนแปลงการตั้งค่าองค์กรต้องใช้สิทธิ์ผู้ดูแลระบบ
- การฝึกจะยังไม่เริ่มจนกว่าจะถึงวันที่ 29 มิถุนายน เพื่อให้ผู้ใช้มีเวลาตัดสินใจ
แผนการสื่อสาร
- PostHog วางแผนจะส่งอีเมลถึงลูกค้าทุกราย โดยระบุวัตถุประสงค์อย่างชัดเจน
- สำหรับผู้ใช้ที่ไม่ได้อ่านอีเมล ก็จะแจ้งเตือนผู้ใช้ทุกคนผ่านการแจ้งเตือนภายในแอปด้วย
- บริษัทจะดำเนินการด้วยวิธีการประกาศแผนนี้อย่างเปิดเผยต่อสาธารณะ
- เป้าหมายคือการปรับปรุงผลิตภัณฑ์ PostHog สำหรับลูกค้า ไม่ใช่การเปิดเผยหรือขายโมเดลที่ฝึกจากข้อมูลผู้ใช้ หรือการนำข้อมูลไปสร้างรายได้
เหตุผลที่ใช้ opt-out แทน opt-in
- เหตุผลที่เลือก รวมโดยค่าเริ่มต้นแล้วให้ opt-out แทนการใช้ opt-in โดยค่าเริ่มต้น เพราะไม่เช่นนั้นจะรวบรวมข้อมูลได้ไม่เพียงพอสำหรับฝึกโมเดลที่มีประโยชน์จริง
- หากเลือก opt-out ผู้ใช้จะไม่สามารถใช้ฟีเจอร์ใหม่ที่สร้างขึ้นจากโมเดลเหล่านี้ได้
- ผู้ใช้ที่ถูกยกเว้นโดยค่าเริ่มต้น เช่น EU cloud instances สามารถ opt-in ด้วยตนเองได้ หากไม่ติดข้อจำกัดจากสัญญาทางกฎหมายกับ PostHog
- PostHog เลือกที่จะเปิดเผยล่วงหน้าแทนการปล่อยใช้งานแบบเงียบ ๆ
- PostHog กำลัง เปิดรับสมัครนักวิจัย AI เพื่อทำงานนี้ร่วมกัน
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
“opt-in แบบค่าเริ่มต้น” เป็นคำที่ขัดแย้งกันเอง ถ้าเป็นค่าเริ่มต้นก็แปลว่าไม่ได้มีการยินยอมจากฉัน แค่มันถูกเปิดไว้เป็นค่าปริยาย
ส่วน opt-out คือโดยปกติจะถูกรวมอยู่แล้ว และถ้าต้องการค่อยเลือกออก แต่เดี๋ยวนี้คนใช้สลับความหมายกันจนต้องอธิบายเพิ่ม
เมื่อก่อนเคยเห็นโพสต์เรื่อง telemetry แบบ opt-in ที่ถูกต้องจริง ๆ แต่คอมเมนต์อันดับบน ๆ กลับเข้าใจผิดว่าเป็น “รวมไว้โดยค่าเริ่มต้น” แล้วรุมโจมตี ดูเหมือนว่าคำนี้ตอนนี้แทบจะมีความหมายตรงข้ามไปแล้ว
PostHog เคยเป็นระบบที่ตั้งค่าไว้ครั้งเดียวแล้วค่อยแวะมาดูเป็นครั้งคราวเพื่อเอาประโยชน์เล็กน้อย ปล่อยไว้เฉย ๆ ก็แทบไม่มีพิษมีภัย
แต่ตอนนี้มันกลายเป็นอีกหนึ่งเครื่องมือที่ต้องคอยระแวงอย่างจริงจัง และถ้าค่าเริ่มต้นยังไหลไปในทิศทางที่ทนไม่ไหว การถอดมันออกจากระบบแล้วเดินหน้าต่อคงง่ายกว่า
ตลอด 20 ปีที่ผ่านมา ผมโดนแพตเทิร์นที่บริษัทที่ประสบความสำเร็จค่อย ๆ เปลี่ยนไปตอนเติบโตเล่นงานมาหลายครั้งจนนับไม่ไหวแล้ว ในช่วง กระแส AI นี้ PostHog ก็พุ่งเข้าไปเต็มตัว และดูเหมือนจะกำลังสำรวจอะไรอย่างเครื่องมือ no-code ด้วย
Supabase ก็เคยยอดเยี่ยม แต่ตอนนี้ก็เหมือนกำลังดำดิ่งสู่ห้วงลึกของ AI เช่นกัน หรือบางทีสิ่งเดียวที่ไม่เปลี่ยนอาจเป็นผมเอง และอาจเป็นผมที่มีปัญหาจนต้องยอมรับเจ้าเหนือหัว AI ยุคใหม่แล้วไปทาง AI ทั้งหมดก็ได้
บริษัทส่วนใหญ่คงซ่อนการเปลี่ยนแปลงแบบนี้ไว้ในอัปเดตเงื่อนไขการใช้งานที่น่าเบื่อ แต่เรายึดความโปร่งใส จึงจะเผยสิ่งที่คุณควรรู้ในรูปแบบรายการลำดับเลขที่เป็นมิตรกับอินเทอร์เน็ต
ผู้ใช้ EU cloud instance จะถูกยกเว้นโดยค่าเริ่มต้น และผู้ใช้ที่มีสัญญาห้ามนำข้อมูลไปฝึกก็จะถูกยกเว้นเช่นกัน
นอกเหนือจากนั้น ผู้ใช้ US cloud instance จะถูกรวมอยู่โดยค่าเริ่มต้น
พวกเขาบอกว่าจะทำข้อมูลทั้งหมดให้ไม่สามารถระบุตัวตนได้ก่อนการฝึก ใช้เฉพาะข้อมูลที่มีอยู่แล้วในอินสแตนซ์ PostHog และจะฝึกโมเดลเองโดยไม่ขายหรือส่งข้อมูลไปยังผู้ให้บริการโมเดลภายนอก
ผู้ใช้สามารถเลือกออกได้ตลอดเวลาในการตั้งค่าองค์กร ต้องมีสิทธิ์ผู้ดูแลระบบ และการฝึกจะไม่เริ่มจนถึงวันที่ 29 มิถุนายน ดังนั้นยังมีเวลาตัดสินใจเพียงพอ
งั้นสุดสัปดาห์นี้ผมก็จะให้เวลาของคุณเป็น “งานอาสา” สำหรับการซ่อมระเบียงของผมแล้วกัน ไม่ต้องกังวล ผมอาสาแทนคุณให้เรียบร้อยแล้ว
ทางที่ดีกว่าน่าจะเป็นให้ส่วนลดกับคนที่ยินยอม
มีผู้เล่นที่ทำเรื่องนี้ได้ดีกว่าอยู่แล้ว และผมอยากเชื่อมของพวกนั้นเข้ากับระบบวิเคราะห์ของ PostHog มากกว่า
และต้องดูด้วยว่า “นอกเหนือจากนั้น ผู้ใช้ US cloud instance จะถูกรวมอยู่โดยค่าเริ่มต้น” ครอบคลุมผู้ใช้ปลายทางใน EU ด้วยหรือไม่ เนื่องจากข้อมูลส่วนบุคคลนั้นได้มาจากเจ้าของข้อมูลโดยตรง จึงอยู่ภายใต้ หน้าที่แจ้งตามมาตรา 13 ของ GDPR
การขาดมาตรา 13 ไม่สามารถมาแก้ย้อนหลังทีหลังได้ ต้องแสดงให้ได้ว่าลูกค้าทุกรายได้ให้คำชี้แจงตามมาตรา 13 ที่ครอบคลุมการประมวลผลนี้อย่างเพียงพอ และแทบจะแน่นอนว่าจะเข้าข่ายขอบเขต 3(2)(b) ด้วย
นี่เป็นการเตือนชั้นดีว่าควรสร้างเครื่องมือวิเคราะห์ของตัวเองและ self-host เอง PostHog เสียลูกค้าไปหนึ่งรายแล้ว
การส่งอีเมลหาลูกค้าแต่ละรายเพื่อถามว่าอยากเข้าร่วมหรือไม่คงไม่ใช่เรื่องยาก สมมติฐานแบบนี้แปลว่าพวกเขาไม่มีความเข้าใจด้านผลิตภัณฑ์ ทั้งต่อลูกค้าของตัวเองและลูกค้าของลูกค้า ลาก่อน
ผมก็ไม่สบายใจกับการเอาข้อมูลของผมไปฝึก AI เหมือนกัน แต่ประเด็นกังวลหลักคือข้อมูลไปไหน และผมได้รับการแจ้งและรับรู้อย่างเพียงพอหรือไม่ ซึ่งในกรณีนี้ PostHog ก็ให้คำตอบกับคำถามเหล่านั้นได้ค่อนข้างดี
ช่วงหลายเดือนที่ผ่านมา ผมลังเลว่าจะย้ายไปใช้ดีไหม แต่ ผลิตภัณฑ์ AI ใหม่ กับ UI แปลก ๆ ก็ทำให้หงุดหงิดมาตลอด นี่คือฟางเส้นสุดท้ายจริง ๆ
ผมคิดว่า opt-in เป็นโมเดลธุรกิจที่แย่มาก
ผมยังจำได้ว่าครั้งหนึ่งคนเคยชื่นชมเว็บรีดีไซน์ “OS” กันมาก แต่เวลาต้องหา session replay เพื่อดีบัก มันกลับเป็นความซับซ้อนด้าน UX ที่สับสนและไม่จำเป็นที่สุด ต่อมาพวกเขาค่อยเพิ่มเมนูนำทางไว้ที่มุมขวาบน
“opt-in แบบค่าเริ่มต้น” สุดท้ายแล้วก็คือ opt-out ไม่ใช่หรือ?
ตอนนี้เริ่มชัดเจนมากแล้วว่ามีบางอย่างจะพูดเกี่ยวกับบริษัทที่มีกลิ่นอาย ความกวนแบบ SF
อย่างเช่นการรีดีไซน์ OS, “เอกสารกฎหมายสุดเซ็กซี่”, อีเมลหัวข้อประหลาด ๆ, ร้านขายของที่ระลึกที่ขายฟิกเกอร์แอ็กชันของ CEO อะไรทำนองนั้น
เวลามันช่วยเพิ่มการยอมรับด้วยภาพลักษณ์ที่เป็นมิตรกับผู้ใช้ มันอาจเป็นข้อดีได้ แต่เมื่อบริษัทไล่ล่าการเติบโตของรายได้และตัดสินใจในทางที่ขัดกับผู้ใช้ มันจะกลายเป็นการดูหมิ่นซ้ำเติม
ไม่ได้จะพูดกว้าง ๆ ว่าเทคโนโลยีต้องไม่มีความสนุก แต่ถ้าสารที่สื่อออกมาไม่สอดคล้องกับการตัดสินใจของผู้บริหาร มันจะกลายเป็นปัญหาใหญ่
แต่ของดีก็ดูจะมีวันสิ้นสุด โดยเฉพาะเมื่อเป็นบริษัท ช่วง 2 ปีที่ผ่านมาไปในทิศทางแปลกประหลาดอย่างสิ้นเชิง และ AI ก็ทำให้ทุกอย่างแย่ลงไปอีก
ดูท่าว่าคงต้องกลับไปคุ้ยหาโปรเจกต์โอเพนซอร์สอีกครั้ง
ตรรกะคือ “ทำไมถึงเป็น opt-out แทนที่จะเป็น opt-in? พูดสั้น ๆ ก็เพราะไม่อย่างนั้นเราจะมีข้อมูลไม่พอสำหรับฝึกโมเดลที่มีประโยชน์จริง”
ถ้าคนไม่ต้องการยินยอมโดยตรงให้เอาข้อมูลของพวกเขาไปป้อน บริการ AI ที่ไม่ได้ให้ประโยชน์อะไร อีกตัวหนึ่ง นั่นก็น่าจะมีความหมายอยู่แล้ว ช่างแปลกจริง ๆ
ถ้าวิธีเดียวที่จะได้ข้อมูลคือ “สมมติว่าเอาไปได้ก่อน แล้วค่อยให้เจ้าของข้อมูลมาบอกให้หยุด” ก็อดสงสัยไม่ได้ว่านั่นแปลว่าอะไร คงเป็นปริศนาที่ไม่มีใครไขได้สินะ
นี่ควรเป็นบทเรียนเรื่อง การสื่อสารที่แย่ สิ่งที่พวกเขาจะเอาไปฝึกไม่ถูกอธิบายให้ชัดเจน ซึ่งเป็นความผิดพลาดใหญ่
ประกาศครั้งนี้เผยให้เห็นข้อเสียของแนวคิดแบรนด์ที่โดดเด่นจนเกินงามของ PostHog อย่างชัดเจน
ทุกวันยิ่งรู้สึกขอบคุณ กฎหมายของสหภาพยุโรป มากขึ้น ตอนนี้ผมคงพูดได้แค่นั้น
กฎหมายของ EU กำลังสกัด การรีดข้อมูล และยุทธวิธีผูกผู้ใช้ติดแพลตฟอร์มที่บิ๊กเทคเคยใช้จนผูกขาดได้สำเร็จ
แต่แพลตฟอร์มขนาดใหญ่ไม่จำเป็นต้องย้อนคืนความได้เปรียบที่ได้มาแล้ว หรือชดใช้สำหรับวิธีการที่ตอนนี้ถูกจำกัดหรือถือว่าผิดกฎหมาย ผลคือพวกเขาสามารถกินค่าเช่าเชิงผูกขาดจากตำแหน่งที่ปักหลักไว้แล้วต่อไปอย่างเงียบ ๆ ขณะที่คนอื่น ๆ ไม่อาจใช้บันไดเส้นเดียวกับที่พวกเขาเคยปีนขึ้นมาได้