2 คะแนน โดย GN⁺ 2025-06-05 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • แบนเนอร์หน้าโฮม เป็นพื้นที่สำคัญที่มองเห็นเป็นอันดับแรกบนหน้าจอแรกของลูกค้า โดยใช้ ระบบแนะนำแบบ Hyper-personalization เพื่อเพิ่มอัตราการคลิก (CTR) และประสบการณ์ผู้ใช้ให้สูงสุด
  • จากเดิมที่ใช้วิธีเพิ่มประสิทธิภาพ CTR แบบง่าย ๆ บนพื้นฐาน MAB (Multi-Armed Bandit) ได้พัฒนาไปสู่การใช้ อัลกอริทึมสมัยใหม่อย่าง DeepFM, Two-Tower, HGNN และกราฟเบสเอ็มเบดดิง เพื่อสะท้อนคุณลักษณะของแบนเนอร์และผู้ใช้ได้อย่างละเอียดแม่นยำยิ่งขึ้น
  • ปัญหาเฉพาะของโดเมน เช่น วงจรชีวิตแบนเนอร์ที่สั้น, สัญญาณคลิกที่มีนอยส์สูง, ความไม่สมดุลของข้อมูล ถูกแก้ด้วย Continual Learning และการผสมผสานระหว่างโมเดลรายตัวกับโมเดลรวม
  • ผลลัพธ์สุดท้ายคือสร้างระบบแนะนำที่เป็นระบบครบถ้วน ทั้ง เพิ่ม CTR ได้มากกว่า 16%, รองรับแบนเนอร์ใหม่และผู้ใช้แบบ cold user รวมถึงเชื่อมโยงกับการทำงานแบบเรียลไทม์และนโยบายทางธุรกิจ
  • ต่อจากนี้มีแผนพัฒนาอย่างต่อเนื่องในด้าน real-time serving, Multi-Task Learning, การยกระดับคุณภาพ embedding และการนำตัวชี้วัดผลลัพธ์ที่หลากหลายมาใช้

สร้างประสบการณ์ที่ดีกว่าด้วยบิ๊กแบนเนอร์ที่ปรับให้เหมาะกับลูกค้า

  • เมื่อรสนิยมของลูกค้าและ ความหลากหลายของคอนเทนต์ที่แสดง เพิ่มขึ้น การแสดงแบนเนอร์แบบเดียวกันกับทุกคนจึงมีข้อจำกัดในการมอบประสบการณ์ที่น่าพอใจ
  • ด้วยเป้าหมายในการ เพิ่ม CTR ให้สูงสุด จึงได้ดำเนินโครงการนำตรรกะการ แสดงผลแบบ personalized มาใช้กับบิ๊กแบนเนอร์ด้านบนของหน้าโฮมแต่ละสโตร์

ความสำคัญและลักษณะของแบนเนอร์หน้าโฮม

  • แบนเนอร์หน้าโฮมคือ แบนเนอร์แบบสไลด์ที่อยู่บนสุดของหน้าจอ ที่ลูกค้าเจอเป็นอย่างแรกในบริการของ MUSINSA (รวม 35 ชิ้น) โดยในแอปจะแสดง 1 ชิ้น และบนเว็บจะแสดง 3 ชิ้น
  • ประมาณ 97% ของทราฟฟิกทั้งหมดของ MUSINSA จะเห็นแบนเนอร์หน้าโฮมเมื่อเข้าสู่หน้าหลัก
  • การคลิกแบนเนอร์หน้าโฮมคิดเป็น 35% ของจำนวนคลิกทั้งหมด และคิดเป็น 37% ของเซสชันที่เกิดการคลิก แสดงให้เห็นถึงสัดส่วนที่สูงมาก
  • เป็นพื้นที่ที่มีผลต่อการเปลี่ยนเป็นผลลัพธ์ทางธุรกิจสูงมากจากความถี่ในการมองเห็นที่สูง

ข้อจำกัดของวิธีแนะนำแบบเดิม

  • เดิมใช้ อัลกอริทึม MAB (Multi-Armed Bandit) เพื่อทำระบบแนะนำโดยเน้น CTR เป็นหลัก
    • ปรับสมดุลระหว่าง Exploration และ Exploitation
  • มี ข้อจำกัด 3 ประการ:
    • พึ่งพา ตัวชี้วัด CTR เพียงตัวเดียว มากเกินไป จึงสะท้อนรสนิยมลูกค้าที่หลากหลายและคุณลักษณะของแบนเนอร์ได้ไม่ดีพอ
    • สะท้อนความเกี่ยวข้องระหว่างแบนเนอร์ได้ยาก (ประมวลผลแบบอิสระต่อกัน)
    • ปัญหา cold start (เมื่อข้อมูลการคลิกของแบนเนอร์ใหม่ไม่เพียงพอ ประสิทธิภาพจะลดลง)
  • เพื่อก้าวข้ามข้อจำกัดเหล่านี้ จึงออกแบบ ระบบแนะนำแบบใหม่ ขึ้นมา

ไปป์ไลน์ของระบบแนะนำ

  • ระบบประกอบด้วยไปป์ไลน์หลายขั้นตอน
    1. เสริมความแข็งแรงให้ Representation ของแบนเนอร์: ดึง embedding ที่อิงจากข้อความ รูปภาพ และสินค้าที่เกี่ยวข้องกับแบนเนอร์ (ใช้ HGNN และ GraphSAGE)
    2. ฝึกโมเดลทำนายการคลิก: ใช้ทั้ง DeepFM (ปฏิสัมพันธ์ระหว่างฟีเจอร์) และ Two-Tower (แยก embedding ของผู้ใช้/แบนเนอร์) พร้อมกัน
    3. ให้คะแนนแบนเนอร์และนำไปใช้งาน: คำนวณคะแนนทำนาย CTR ของแต่ละผู้ใช้แบบ batch/เรียลไทม์
      • สำหรับผู้ใช้ที่มีข้อมูลเพียงพอ ใช้ personalization ที่ละเอียดแม่นยำ
      • สำหรับผู้ใช้ใหม่หรือ cold user ใช้ การแนะนำตามเซกเมนต์
    4. สะท้อนนโยบายธุรกิจ: นอกเหนือจากคะแนนจากระบบแล้ว ยังสะท้อนนโยบายและกลยุทธ์ของบริษัท แบนเนอร์แคมเปญ และการเปลี่ยนแปลงเร่งด่วนแบบเรียลไทม์
    5. แสดงแบนเนอร์ขั้นสุดท้าย: แนะนำและแสดง Top-N แบนเนอร์ที่มีคะแนนสูงสุด

แนะนำโมเดลหลักของระบบแนะนำ

  • DeepFM: โครงสร้างขนานระหว่าง FM (ปฏิสัมพันธ์ลำดับที่ 2) + DNN (ปฏิสัมพันธ์มิติสูง) ทำให้เรียนรู้ได้อย่างมีประสิทธิภาพทั้งข้อมูล sparse และปฏิสัมพันธ์ที่ซับซ้อน เหมาะอย่างยิ่งกับการทำนาย CTR
  • Two-Tower: ดึง embedding ของผู้ใช้และแบนเนอร์จากโครงข่ายประสาทอิสระคนละชุด มีจุดแข็งด้านข้อมูลขนาดใหญ่และ real-time serving พร้อมการแนะนำแบบอิงความคล้ายคลึง

DeepFM

  • ผสาน FM layer (ปฏิสัมพันธ์ของฟีเจอร์ระดับที่ 2) + DNN layer (การรวมฟีเจอร์ไม่เชิงเส้นมิติสูง)
  • แข็งแรงกับข้อมูล sparse และมีโครงสร้างการเรียนรู้แบบ End-to-End ที่ช่วยเพิ่มประสิทธิภาพได้อย่างสม่ำเสมอ
  • ใช้ข้อมูลผู้ใช้ เมทาดาทาของแบนเนอร์ และข้อมูล embedding (64 มิติ) เป็นฟีเจอร์
  • ประมวลผลเวกเตอร์ embedding เป็นบล็อกเดี่ยวเพื่อให้ได้ประสิทธิภาพและความเสถียรในการฝึก
  • ใช้ ผลการทำนาย CTR เพื่อจัดอันดับแบนเนอร์

Two-Tower

  • ใช้ โครงข่ายประสาทแยกสำหรับผู้ใช้และแบนเนอร์ (tower) เพื่อสร้าง embedding และคำนวณความคล้ายคลึง
  • มี ความสามารถในการขยายระบบ ที่เหมาะกับข้อมูลขนาดใหญ่ และตอบสนองได้รวดเร็วด้วยเวกเตอร์ที่เตรียมไว้ล่วงหน้า (latency ต่ำ)
  • แต่ละ tower ใช้ข้อมูลนำเข้าหลากหลาย เช่น ข้อมูลประชากรศาสตร์ พฤติกรรมการใช้งาน ข้อความ/รูปภาพ
  • โครงสร้างการฝึกแบบแยก/ประมวลผลขนาน ช่วยให้รับมือกับปัญหาระบบแนะนำขนาดใหญ่ได้อย่างรวดเร็วและยืดหยุ่น

ความยากสำคัญที่พบเมื่อนำไปใช้จริง

  • แบนเนอร์หน้าโฮมมี วงจรชีวิต สั้นมาก (2–3 วัน หรือบางครั้งเป็นระดับไม่กี่ชั่วโมง) จึงต้องสะท้อนผลแบบเรียลไทม์
  • สัญญาณฟีดแบ็กส่วนใหญ่พึ่งพา การคลิก ทำให้แยกแยะความชอบที่แท้จริงของผู้ใช้ได้ยาก
  • ต่างจากสินค้าและแบรนด์ แบนเนอร์มี เมทาดาทา ที่เป็นโครงสร้างน้อย ทำให้เข้าใจบริบทจากภาพและข้อความได้ยาก
  • ความไม่สมดุลของข้อมูลรายสโตร์ (ความต่างของทราฟฟิกและการใช้งานในแต่ละสโตร์เฉพาะทาง) อาจทำให้ประสิทธิภาพโดยรวมลดลง
  • เพื่อแก้ปัญหา จึงออกแบบระบบใหม่โดยยึด 3 แกนเทคนิคหลักคือ การเพิ่มพลังการแทนค่า การคงความใหม่ของข้อมูล และการลดความไม่สมดุล

แนวทางปรับปรุงที่เป็นรูปธรรม

เสริมคุณลักษณะของแบนเนอร์

  • เพื่อก้าวข้ามข้อจำกัดของการใช้ค่าเฉลี่ย embedding แบบ PinSAGE (ข้อจำกัดในการแทนแบนเนอร์ที่ซับซ้อน และไม่สามารถแนะนำแบนเนอร์ใหม่ได้) จึงนำ HGNN มาใช้
  • อิงจากรูปแบบพฤติกรรมของผู้ใช้ สร้าง embedding ความสัมพันธ์ระหว่างแบนเนอร์กับสินค้าใน โครงสร้างกราฟ ด้วย GraphSAGE
  • สำหรับข้อมูลข้อความและรูปภาพ ใช้การผสมผสานของ LLM embedding
  • อัปเดต user embedding แบบเรียลไทม์ และนำ Continual Learning มาใช้เพื่อสะท้อนความสนใจล่าสุดของผู้ใช้
  • CTR เพิ่มขึ้น 8.3%

Continual Learning

  • เลิกใช้การฝึกแบบรวบข้อมูลทั้งหมดในครั้งเดียว และนำ การอัปเดตอย่างต่อเนื่อง มาใช้ (ทุก 1 ชั่วโมง จาก log ล่าสุด 3 ชั่วโมง)
  • ปรับ learning rate แบบไดนามิกตามปริมาณกิจกรรม (สูงสุด 5 เท่าในช่วงสัปดาห์ และ 2 เท่าในช่วงกลางคืน)
  • ทำให้เกิดทั้ง การปรับตัวได้รวดเร็ว และ ป้องกันโมเดลล้าสมัย พร้อมสะท้อนคำแนะนำได้ไวโดยไม่ทำให้ประสิทธิภาพลดลง
  • CTR เพิ่มขึ้น 24%

การเลือกโมเดลเชิงกลยุทธ์

  • กำหนดกลยุทธ์การสร้างโมเดลที่เหมาะสมที่สุดในแต่ละสโตร์
  • เมนสโตร์ใช้ DeepFM+Continual ส่วนสโตร์เฉพาะทางใช้โมเดล Two-Tower แบบรายสโตร์ ทำให้ CTR เพิ่มขึ้น 19%

ผลลัพธ์สุดท้าย

  • เมื่อเทียบกับ MAB เดิม Two-Tower เพิ่ม CTR 11.2%, DeepFM เพิ่ม 16.1%
  • หน้าโฮมของ MUSINSA ใช้ DeepFM+Continual Learning ส่วนสโตร์เฉพาะทางนำโมเดล Two-Tower ไปใช้จริง

ทิศทางในอนาคต

  • เดินหน้ายกระดับต่อในด้าน สถาปัตยกรรม real-time serving, การนำ Multi-Task Learning มาใช้ (CTR+GGMV), การปรับปรุงคุณภาพ embedding และโครงสร้างกราฟ, และ การกระจายตัวชี้วัดผลลัพธ์ให้หลากหลาย
  • มีแผนพัฒนาให้ก้าวพ้นจากการวัดด้วย CTR เพียงตัวเดียว ไปสู่โมเดลที่ประเมินได้ทั้ง การบรรลุเป้าหมายทางธุรกิจที่หลากหลายและประสบการณ์เชิงคุณภาพ

1 ความคิดเห็น

 
codemasterkimc 2025-06-05

เป็นบทความที่ดีนะ ~