- แบนเนอร์หน้าโฮม เป็นพื้นที่สำคัญที่มองเห็นเป็นอันดับแรกบนหน้าจอแรกของลูกค้า โดยใช้ ระบบแนะนำแบบ Hyper-personalization เพื่อเพิ่มอัตราการคลิก (CTR) และประสบการณ์ผู้ใช้ให้สูงสุด
- จากเดิมที่ใช้วิธีเพิ่มประสิทธิภาพ CTR แบบง่าย ๆ บนพื้นฐาน MAB (Multi-Armed Bandit) ได้พัฒนาไปสู่การใช้ อัลกอริทึมสมัยใหม่อย่าง DeepFM, Two-Tower, HGNN และกราฟเบสเอ็มเบดดิง เพื่อสะท้อนคุณลักษณะของแบนเนอร์และผู้ใช้ได้อย่างละเอียดแม่นยำยิ่งขึ้น
- ปัญหาเฉพาะของโดเมน เช่น วงจรชีวิตแบนเนอร์ที่สั้น, สัญญาณคลิกที่มีนอยส์สูง, ความไม่สมดุลของข้อมูล ถูกแก้ด้วย Continual Learning และการผสมผสานระหว่างโมเดลรายตัวกับโมเดลรวม
- ผลลัพธ์สุดท้ายคือสร้างระบบแนะนำที่เป็นระบบครบถ้วน ทั้ง เพิ่ม CTR ได้มากกว่า 16%, รองรับแบนเนอร์ใหม่และผู้ใช้แบบ cold user รวมถึงเชื่อมโยงกับการทำงานแบบเรียลไทม์และนโยบายทางธุรกิจ
- ต่อจากนี้มีแผนพัฒนาอย่างต่อเนื่องในด้าน real-time serving, Multi-Task Learning, การยกระดับคุณภาพ embedding และการนำตัวชี้วัดผลลัพธ์ที่หลากหลายมาใช้
สร้างประสบการณ์ที่ดีกว่าด้วยบิ๊กแบนเนอร์ที่ปรับให้เหมาะกับลูกค้า
- เมื่อรสนิยมของลูกค้าและ ความหลากหลายของคอนเทนต์ที่แสดง เพิ่มขึ้น การแสดงแบนเนอร์แบบเดียวกันกับทุกคนจึงมีข้อจำกัดในการมอบประสบการณ์ที่น่าพอใจ
- ด้วยเป้าหมายในการ เพิ่ม CTR ให้สูงสุด จึงได้ดำเนินโครงการนำตรรกะการ แสดงผลแบบ personalized มาใช้กับบิ๊กแบนเนอร์ด้านบนของหน้าโฮมแต่ละสโตร์
ความสำคัญและลักษณะของแบนเนอร์หน้าโฮม
- แบนเนอร์หน้าโฮมคือ แบนเนอร์แบบสไลด์ที่อยู่บนสุดของหน้าจอ ที่ลูกค้าเจอเป็นอย่างแรกในบริการของ MUSINSA (รวม 35 ชิ้น) โดยในแอปจะแสดง 1 ชิ้น และบนเว็บจะแสดง 3 ชิ้น
- ประมาณ 97% ของทราฟฟิกทั้งหมดของ MUSINSA จะเห็นแบนเนอร์หน้าโฮมเมื่อเข้าสู่หน้าหลัก
- การคลิกแบนเนอร์หน้าโฮมคิดเป็น 35% ของจำนวนคลิกทั้งหมด และคิดเป็น 37% ของเซสชันที่เกิดการคลิก แสดงให้เห็นถึงสัดส่วนที่สูงมาก
- เป็นพื้นที่ที่มีผลต่อการเปลี่ยนเป็นผลลัพธ์ทางธุรกิจสูงมากจากความถี่ในการมองเห็นที่สูง
ข้อจำกัดของวิธีแนะนำแบบเดิม
- เดิมใช้ อัลกอริทึม MAB (Multi-Armed Bandit) เพื่อทำระบบแนะนำโดยเน้น CTR เป็นหลัก
- ปรับสมดุลระหว่าง Exploration และ Exploitation
- มี ข้อจำกัด 3 ประการ:
- พึ่งพา ตัวชี้วัด CTR เพียงตัวเดียว มากเกินไป จึงสะท้อนรสนิยมลูกค้าที่หลากหลายและคุณลักษณะของแบนเนอร์ได้ไม่ดีพอ
- สะท้อนความเกี่ยวข้องระหว่างแบนเนอร์ได้ยาก (ประมวลผลแบบอิสระต่อกัน)
- ปัญหา cold start (เมื่อข้อมูลการคลิกของแบนเนอร์ใหม่ไม่เพียงพอ ประสิทธิภาพจะลดลง)
- เพื่อก้าวข้ามข้อจำกัดเหล่านี้ จึงออกแบบ ระบบแนะนำแบบใหม่ ขึ้นมา
ไปป์ไลน์ของระบบแนะนำ
- ระบบประกอบด้วยไปป์ไลน์หลายขั้นตอน
- เสริมความแข็งแรงให้ Representation ของแบนเนอร์: ดึง embedding ที่อิงจากข้อความ รูปภาพ และสินค้าที่เกี่ยวข้องกับแบนเนอร์ (ใช้ HGNN และ GraphSAGE)
- ฝึกโมเดลทำนายการคลิก: ใช้ทั้ง DeepFM (ปฏิสัมพันธ์ระหว่างฟีเจอร์) และ Two-Tower (แยก embedding ของผู้ใช้/แบนเนอร์) พร้อมกัน
- ให้คะแนนแบนเนอร์และนำไปใช้งาน: คำนวณคะแนนทำนาย CTR ของแต่ละผู้ใช้แบบ batch/เรียลไทม์
- สำหรับผู้ใช้ที่มีข้อมูลเพียงพอ ใช้ personalization ที่ละเอียดแม่นยำ
- สำหรับผู้ใช้ใหม่หรือ cold user ใช้ การแนะนำตามเซกเมนต์
- สะท้อนนโยบายธุรกิจ: นอกเหนือจากคะแนนจากระบบแล้ว ยังสะท้อนนโยบายและกลยุทธ์ของบริษัท แบนเนอร์แคมเปญ และการเปลี่ยนแปลงเร่งด่วนแบบเรียลไทม์
- แสดงแบนเนอร์ขั้นสุดท้าย: แนะนำและแสดง Top-N แบนเนอร์ที่มีคะแนนสูงสุด
แนะนำโมเดลหลักของระบบแนะนำ
- DeepFM: โครงสร้างขนานระหว่าง FM (ปฏิสัมพันธ์ลำดับที่ 2) + DNN (ปฏิสัมพันธ์มิติสูง) ทำให้เรียนรู้ได้อย่างมีประสิทธิภาพทั้งข้อมูล sparse และปฏิสัมพันธ์ที่ซับซ้อน เหมาะอย่างยิ่งกับการทำนาย CTR
- Two-Tower: ดึง embedding ของผู้ใช้และแบนเนอร์จากโครงข่ายประสาทอิสระคนละชุด มีจุดแข็งด้านข้อมูลขนาดใหญ่และ real-time serving พร้อมการแนะนำแบบอิงความคล้ายคลึง
DeepFM
- ผสาน FM layer (ปฏิสัมพันธ์ของฟีเจอร์ระดับที่ 2) + DNN layer (การรวมฟีเจอร์ไม่เชิงเส้นมิติสูง)
- แข็งแรงกับข้อมูล sparse และมีโครงสร้างการเรียนรู้แบบ End-to-End ที่ช่วยเพิ่มประสิทธิภาพได้อย่างสม่ำเสมอ
- ใช้ข้อมูลผู้ใช้ เมทาดาทาของแบนเนอร์ และข้อมูล embedding (64 มิติ) เป็นฟีเจอร์
- ประมวลผลเวกเตอร์ embedding เป็นบล็อกเดี่ยวเพื่อให้ได้ประสิทธิภาพและความเสถียรในการฝึก
- ใช้ ผลการทำนาย CTR เพื่อจัดอันดับแบนเนอร์
Two-Tower
- ใช้ โครงข่ายประสาทแยกสำหรับผู้ใช้และแบนเนอร์ (tower) เพื่อสร้าง embedding และคำนวณความคล้ายคลึง
- มี ความสามารถในการขยายระบบ ที่เหมาะกับข้อมูลขนาดใหญ่ และตอบสนองได้รวดเร็วด้วยเวกเตอร์ที่เตรียมไว้ล่วงหน้า (latency ต่ำ)
- แต่ละ tower ใช้ข้อมูลนำเข้าหลากหลาย เช่น ข้อมูลประชากรศาสตร์ พฤติกรรมการใช้งาน ข้อความ/รูปภาพ
- โครงสร้างการฝึกแบบแยก/ประมวลผลขนาน ช่วยให้รับมือกับปัญหาระบบแนะนำขนาดใหญ่ได้อย่างรวดเร็วและยืดหยุ่น
ความยากสำคัญที่พบเมื่อนำไปใช้จริง
- แบนเนอร์หน้าโฮมมี วงจรชีวิต สั้นมาก (2–3 วัน หรือบางครั้งเป็นระดับไม่กี่ชั่วโมง) จึงต้องสะท้อนผลแบบเรียลไทม์
- สัญญาณฟีดแบ็กส่วนใหญ่พึ่งพา การคลิก ทำให้แยกแยะความชอบที่แท้จริงของผู้ใช้ได้ยาก
- ต่างจากสินค้าและแบรนด์ แบนเนอร์มี เมทาดาทา ที่เป็นโครงสร้างน้อย ทำให้เข้าใจบริบทจากภาพและข้อความได้ยาก
- ความไม่สมดุลของข้อมูลรายสโตร์ (ความต่างของทราฟฟิกและการใช้งานในแต่ละสโตร์เฉพาะทาง) อาจทำให้ประสิทธิภาพโดยรวมลดลง
- เพื่อแก้ปัญหา จึงออกแบบระบบใหม่โดยยึด 3 แกนเทคนิคหลักคือ การเพิ่มพลังการแทนค่า การคงความใหม่ของข้อมูล และการลดความไม่สมดุล
แนวทางปรับปรุงที่เป็นรูปธรรม
เสริมคุณลักษณะของแบนเนอร์
- เพื่อก้าวข้ามข้อจำกัดของการใช้ค่าเฉลี่ย embedding แบบ PinSAGE (ข้อจำกัดในการแทนแบนเนอร์ที่ซับซ้อน และไม่สามารถแนะนำแบนเนอร์ใหม่ได้) จึงนำ HGNN มาใช้
- อิงจากรูปแบบพฤติกรรมของผู้ใช้ สร้าง embedding ความสัมพันธ์ระหว่างแบนเนอร์กับสินค้าใน โครงสร้างกราฟ ด้วย GraphSAGE
- สำหรับข้อมูลข้อความและรูปภาพ ใช้การผสมผสานของ LLM embedding
- อัปเดต user embedding แบบเรียลไทม์ และนำ Continual Learning มาใช้เพื่อสะท้อนความสนใจล่าสุดของผู้ใช้
- CTR เพิ่มขึ้น 8.3%
Continual Learning
- เลิกใช้การฝึกแบบรวบข้อมูลทั้งหมดในครั้งเดียว และนำ การอัปเดตอย่างต่อเนื่อง มาใช้ (ทุก 1 ชั่วโมง จาก log ล่าสุด 3 ชั่วโมง)
- ปรับ learning rate แบบไดนามิกตามปริมาณกิจกรรม (สูงสุด 5 เท่าในช่วงสัปดาห์ และ 2 เท่าในช่วงกลางคืน)
- ทำให้เกิดทั้ง การปรับตัวได้รวดเร็ว และ ป้องกันโมเดลล้าสมัย พร้อมสะท้อนคำแนะนำได้ไวโดยไม่ทำให้ประสิทธิภาพลดลง
- CTR เพิ่มขึ้น 24%
การเลือกโมเดลเชิงกลยุทธ์
- กำหนดกลยุทธ์การสร้างโมเดลที่เหมาะสมที่สุดในแต่ละสโตร์
- เมนสโตร์ใช้ DeepFM+Continual ส่วนสโตร์เฉพาะทางใช้โมเดล Two-Tower แบบรายสโตร์ ทำให้ CTR เพิ่มขึ้น 19%
ผลลัพธ์สุดท้าย
- เมื่อเทียบกับ MAB เดิม Two-Tower เพิ่ม CTR 11.2%, DeepFM เพิ่ม 16.1%
- หน้าโฮมของ MUSINSA ใช้ DeepFM+Continual Learning ส่วนสโตร์เฉพาะทางนำโมเดล Two-Tower ไปใช้จริง
ทิศทางในอนาคต
- เดินหน้ายกระดับต่อในด้าน สถาปัตยกรรม real-time serving, การนำ Multi-Task Learning มาใช้ (CTR+GGMV), การปรับปรุงคุณภาพ embedding และโครงสร้างกราฟ, และ การกระจายตัวชี้วัดผลลัพธ์ให้หลากหลาย
- มีแผนพัฒนาให้ก้าวพ้นจากการวัดด้วย CTR เพียงตัวเดียว ไปสู่โมเดลที่ประเมินได้ทั้ง การบรรลุเป้าหมายทางธุรกิจที่หลากหลายและประสบการณ์เชิงคุณภาพ
1 ความคิดเห็น
เป็นบทความที่ดีนะ ~