หน้าจอแรกที่คุณเห็นถูกกำหนดอย่างไร? เรื่องราวของระบบแนะนำแบนเนอร์หน้าโฮมแบบปรับให้เหมาะกับแต่ละคนของ MUSINSA

(medium.com)

2 คะแนน โดย GN⁺ 2025-06-05 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

แบนเนอร์หน้าโฮม เป็นพื้นที่สำคัญที่มองเห็นเป็นอันดับแรกบนหน้าจอแรกของลูกค้า โดยใช้ ระบบแนะนำแบบ Hyper-personalization เพื่อเพิ่มอัตราการคลิก (CTR) และประสบการณ์ผู้ใช้ให้สูงสุด
จากเดิมที่ใช้วิธีเพิ่มประสิทธิภาพ CTR แบบง่าย ๆ บนพื้นฐาน MAB (Multi-Armed Bandit) ได้พัฒนาไปสู่การใช้ อัลกอริทึมสมัยใหม่อย่าง DeepFM, Two-Tower, HGNN และกราฟเบสเอ็มเบดดิง เพื่อสะท้อนคุณลักษณะของแบนเนอร์และผู้ใช้ได้อย่างละเอียดแม่นยำยิ่งขึ้น
ปัญหาเฉพาะของโดเมน เช่น วงจรชีวิตแบนเนอร์ที่สั้น, สัญญาณคลิกที่มีนอยส์สูง, ความไม่สมดุลของข้อมูล ถูกแก้ด้วย Continual Learning และการผสมผสานระหว่างโมเดลรายตัวกับโมเดลรวม
ผลลัพธ์สุดท้ายคือสร้างระบบแนะนำที่เป็นระบบครบถ้วน ทั้ง เพิ่ม CTR ได้มากกว่า 16%, รองรับแบนเนอร์ใหม่และผู้ใช้แบบ cold user รวมถึงเชื่อมโยงกับการทำงานแบบเรียลไทม์และนโยบายทางธุรกิจ
ต่อจากนี้มีแผนพัฒนาอย่างต่อเนื่องในด้าน real-time serving, Multi-Task Learning, การยกระดับคุณภาพ embedding และการนำตัวชี้วัดผลลัพธ์ที่หลากหลายมาใช้

สร้างประสบการณ์ที่ดีกว่าด้วยบิ๊กแบนเนอร์ที่ปรับให้เหมาะกับลูกค้า

เมื่อรสนิยมของลูกค้าและ ความหลากหลายของคอนเทนต์ที่แสดง เพิ่มขึ้น การแสดงแบนเนอร์แบบเดียวกันกับทุกคนจึงมีข้อจำกัดในการมอบประสบการณ์ที่น่าพอใจ
ด้วยเป้าหมายในการ เพิ่ม CTR ให้สูงสุด จึงได้ดำเนินโครงการนำตรรกะการ แสดงผลแบบ personalized มาใช้กับบิ๊กแบนเนอร์ด้านบนของหน้าโฮมแต่ละสโตร์

ความสำคัญและลักษณะของแบนเนอร์หน้าโฮม

แบนเนอร์หน้าโฮมคือ แบนเนอร์แบบสไลด์ที่อยู่บนสุดของหน้าจอ ที่ลูกค้าเจอเป็นอย่างแรกในบริการของ MUSINSA (รวม 35 ชิ้น) โดยในแอปจะแสดง 1 ชิ้น และบนเว็บจะแสดง 3 ชิ้น
ประมาณ 97% ของทราฟฟิกทั้งหมดของ MUSINSA จะเห็นแบนเนอร์หน้าโฮมเมื่อเข้าสู่หน้าหลัก
การคลิกแบนเนอร์หน้าโฮมคิดเป็น 35% ของจำนวนคลิกทั้งหมด และคิดเป็น 37% ของเซสชันที่เกิดการคลิก แสดงให้เห็นถึงสัดส่วนที่สูงมาก
เป็นพื้นที่ที่มีผลต่อการเปลี่ยนเป็นผลลัพธ์ทางธุรกิจสูงมากจากความถี่ในการมองเห็นที่สูง

ข้อจำกัดของวิธีแนะนำแบบเดิม

เดิมใช้ อัลกอริทึม MAB (Multi-Armed Bandit) เพื่อทำระบบแนะนำโดยเน้น CTR เป็นหลัก
- ปรับสมดุลระหว่าง Exploration และ Exploitation
มี ข้อจำกัด 3 ประการ:
- พึ่งพา ตัวชี้วัด CTR เพียงตัวเดียว มากเกินไป จึงสะท้อนรสนิยมลูกค้าที่หลากหลายและคุณลักษณะของแบนเนอร์ได้ไม่ดีพอ
- สะท้อนความเกี่ยวข้องระหว่างแบนเนอร์ได้ยาก (ประมวลผลแบบอิสระต่อกัน)
- ปัญหา cold start (เมื่อข้อมูลการคลิกของแบนเนอร์ใหม่ไม่เพียงพอ ประสิทธิภาพจะลดลง)
เพื่อก้าวข้ามข้อจำกัดเหล่านี้ จึงออกแบบ ระบบแนะนำแบบใหม่ ขึ้นมา

ไปป์ไลน์ของระบบแนะนำ

ระบบประกอบด้วยไปป์ไลน์หลายขั้นตอน
1. เสริมความแข็งแรงให้ Representation ของแบนเนอร์: ดึง embedding ที่อิงจากข้อความ รูปภาพ และสินค้าที่เกี่ยวข้องกับแบนเนอร์ (ใช้ HGNN และ GraphSAGE)
2. ฝึกโมเดลทำนายการคลิก: ใช้ทั้ง DeepFM (ปฏิสัมพันธ์ระหว่างฟีเจอร์) และ Two-Tower (แยก embedding ของผู้ใช้/แบนเนอร์) พร้อมกัน
3. ให้คะแนนแบนเนอร์และนำไปใช้งาน: คำนวณคะแนนทำนาย CTR ของแต่ละผู้ใช้แบบ batch/เรียลไทม์
  - สำหรับผู้ใช้ที่มีข้อมูลเพียงพอ ใช้ personalization ที่ละเอียดแม่นยำ
  - สำหรับผู้ใช้ใหม่หรือ cold user ใช้ การแนะนำตามเซกเมนต์
4. สะท้อนนโยบายธุรกิจ: นอกเหนือจากคะแนนจากระบบแล้ว ยังสะท้อนนโยบายและกลยุทธ์ของบริษัท แบนเนอร์แคมเปญ และการเปลี่ยนแปลงเร่งด่วนแบบเรียลไทม์
5. แสดงแบนเนอร์ขั้นสุดท้าย: แนะนำและแสดง Top-N แบนเนอร์ที่มีคะแนนสูงสุด

แนะนำโมเดลหลักของระบบแนะนำ

DeepFM: โครงสร้างขนานระหว่าง FM (ปฏิสัมพันธ์ลำดับที่ 2) + DNN (ปฏิสัมพันธ์มิติสูง) ทำให้เรียนรู้ได้อย่างมีประสิทธิภาพทั้งข้อมูล sparse และปฏิสัมพันธ์ที่ซับซ้อน เหมาะอย่างยิ่งกับการทำนาย CTR
Two-Tower: ดึง embedding ของผู้ใช้และแบนเนอร์จากโครงข่ายประสาทอิสระคนละชุด มีจุดแข็งด้านข้อมูลขนาดใหญ่และ real-time serving พร้อมการแนะนำแบบอิงความคล้ายคลึง

DeepFM

ผสาน FM layer (ปฏิสัมพันธ์ของฟีเจอร์ระดับที่ 2) + DNN layer (การรวมฟีเจอร์ไม่เชิงเส้นมิติสูง)
แข็งแรงกับข้อมูล sparse และมีโครงสร้างการเรียนรู้แบบ End-to-End ที่ช่วยเพิ่มประสิทธิภาพได้อย่างสม่ำเสมอ
ใช้ข้อมูลผู้ใช้ เมทาดาทาของแบนเนอร์ และข้อมูล embedding (64 มิติ) เป็นฟีเจอร์
ประมวลผลเวกเตอร์ embedding เป็นบล็อกเดี่ยวเพื่อให้ได้ประสิทธิภาพและความเสถียรในการฝึก
ใช้ ผลการทำนาย CTR เพื่อจัดอันดับแบนเนอร์

Two-Tower

ใช้ โครงข่ายประสาทแยกสำหรับผู้ใช้และแบนเนอร์ (tower) เพื่อสร้าง embedding และคำนวณความคล้ายคลึง
มี ความสามารถในการขยายระบบ ที่เหมาะกับข้อมูลขนาดใหญ่ และตอบสนองได้รวดเร็วด้วยเวกเตอร์ที่เตรียมไว้ล่วงหน้า (latency ต่ำ)
แต่ละ tower ใช้ข้อมูลนำเข้าหลากหลาย เช่น ข้อมูลประชากรศาสตร์ พฤติกรรมการใช้งาน ข้อความ/รูปภาพ
โครงสร้างการฝึกแบบแยก/ประมวลผลขนาน ช่วยให้รับมือกับปัญหาระบบแนะนำขนาดใหญ่ได้อย่างรวดเร็วและยืดหยุ่น

ความยากสำคัญที่พบเมื่อนำไปใช้จริง

แบนเนอร์หน้าโฮมมี วงจรชีวิต สั้นมาก (2–3 วัน หรือบางครั้งเป็นระดับไม่กี่ชั่วโมง) จึงต้องสะท้อนผลแบบเรียลไทม์
สัญญาณฟีดแบ็กส่วนใหญ่พึ่งพา การคลิก ทำให้แยกแยะความชอบที่แท้จริงของผู้ใช้ได้ยาก
ต่างจากสินค้าและแบรนด์ แบนเนอร์มี เมทาดาทา ที่เป็นโครงสร้างน้อย ทำให้เข้าใจบริบทจากภาพและข้อความได้ยาก
ความไม่สมดุลของข้อมูลรายสโตร์ (ความต่างของทราฟฟิกและการใช้งานในแต่ละสโตร์เฉพาะทาง) อาจทำให้ประสิทธิภาพโดยรวมลดลง
เพื่อแก้ปัญหา จึงออกแบบระบบใหม่โดยยึด 3 แกนเทคนิคหลักคือ การเพิ่มพลังการแทนค่า การคงความใหม่ของข้อมูล และการลดความไม่สมดุล

แนวทางปรับปรุงที่เป็นรูปธรรม

เสริมคุณลักษณะของแบนเนอร์

เพื่อก้าวข้ามข้อจำกัดของการใช้ค่าเฉลี่ย embedding แบบ PinSAGE (ข้อจำกัดในการแทนแบนเนอร์ที่ซับซ้อน และไม่สามารถแนะนำแบนเนอร์ใหม่ได้) จึงนำ HGNN มาใช้
อิงจากรูปแบบพฤติกรรมของผู้ใช้ สร้าง embedding ความสัมพันธ์ระหว่างแบนเนอร์กับสินค้าใน โครงสร้างกราฟ ด้วย GraphSAGE
สำหรับข้อมูลข้อความและรูปภาพ ใช้การผสมผสานของ LLM embedding
อัปเดต user embedding แบบเรียลไทม์ และนำ Continual Learning มาใช้เพื่อสะท้อนความสนใจล่าสุดของผู้ใช้
CTR เพิ่มขึ้น 8.3%

Continual Learning

เลิกใช้การฝึกแบบรวบข้อมูลทั้งหมดในครั้งเดียว และนำ การอัปเดตอย่างต่อเนื่อง มาใช้ (ทุก 1 ชั่วโมง จาก log ล่าสุด 3 ชั่วโมง)
ปรับ learning rate แบบไดนามิกตามปริมาณกิจกรรม (สูงสุด 5 เท่าในช่วงสัปดาห์ และ 2 เท่าในช่วงกลางคืน)
ทำให้เกิดทั้ง การปรับตัวได้รวดเร็ว และ ป้องกันโมเดลล้าสมัย พร้อมสะท้อนคำแนะนำได้ไวโดยไม่ทำให้ประสิทธิภาพลดลง
CTR เพิ่มขึ้น 24%

การเลือกโมเดลเชิงกลยุทธ์

กำหนดกลยุทธ์การสร้างโมเดลที่เหมาะสมที่สุดในแต่ละสโตร์
เมนสโตร์ใช้ DeepFM+Continual ส่วนสโตร์เฉพาะทางใช้โมเดล Two-Tower แบบรายสโตร์ ทำให้ CTR เพิ่มขึ้น 19%

ผลลัพธ์สุดท้าย

เมื่อเทียบกับ MAB เดิม Two-Tower เพิ่ม CTR 11.2%, DeepFM เพิ่ม 16.1%
หน้าโฮมของ MUSINSA ใช้ DeepFM+Continual Learning ส่วนสโตร์เฉพาะทางนำโมเดล Two-Tower ไปใช้จริง

ทิศทางในอนาคต

เดินหน้ายกระดับต่อในด้าน สถาปัตยกรรม real-time serving, การนำ Multi-Task Learning มาใช้ (CTR+GGMV), การปรับปรุงคุณภาพ embedding และโครงสร้างกราฟ, และ การกระจายตัวชี้วัดผลลัพธ์ให้หลากหลาย
มีแผนพัฒนาให้ก้าวพ้นจากการวัดด้วย CTR เพียงตัวเดียว ไปสู่โมเดลที่ประเมินได้ทั้ง การบรรลุเป้าหมายทางธุรกิจที่หลากหลายและประสบการณ์เชิงคุณภาพ

1 ความคิดเห็น

codemasterkimc 2025-06-05

เป็นบทความที่ดีนะ ~

สร้างประสบการณ์ที่ดีกว่าด้วยบิ๊กแบนเนอร์ที่ปรับให้เหมาะกับลูกค้า

ความสำคัญและลักษณะของแบนเนอร์หน้าโฮม

ข้อจำกัดของวิธีแนะนำแบบเดิม

ไปป์ไลน์ของระบบแนะนำ

แนะนำโมเดลหลักของระบบแนะนำ

DeepFM

Two-Tower

ความยากสำคัญที่พบเมื่อนำไปใช้จริง

แนวทางปรับปรุงที่เป็นรูปธรรม

เสริมคุณลักษณะของแบนเนอร์

Continual Learning

การเลือกโมเดลเชิงกลยุทธ์

ผลลัพธ์สุดท้าย

ทิศทางในอนาคต

บทความที่เกี่ยวข้อง

1 ความคิดเห็น