นี่คือเครื่องมือสำรวจเพอร์โซนาคนเกาหลีที่ใช้ ชุดข้อมูล Nemotron-Personas-Korea ที่ NVIDIA เปิดเผย

ชุดข้อมูลนี้เป็นชุดข้อมูลสังเคราะห์ขนาด 1 ล้านคนของชาวเกาหลี โดยมีข้อมูลอย่างอายุ อาชีพ พื้นที่ และความสัมพันธ์ในครอบครัวรวมอยู่ด้วย วิธีการสร้างชุดข้อมูลและข้อมูลสถิติได้อธิบายไว้อย่างละเอียดที่ https://th.news.hada.io/topic?id=28919

ฟังก์ชันหลักของเครื่องมือสำรวจเพอร์โซนามีดังนี้

  1. สามารถค้นหาเพอร์โซนา หรือค้นหาเพอร์โซนาที่คล้ายกันได้ โดยใช้โมเดล embedding ของ Qwen เพื่อเปรียบเทียบความคล้ายคลึง

  2. สามารถดูการกระจายตัวของประชากรของเพอร์โซนาบนแผนที่ได้ โดยใช้ข้อมูลตำแหน่งที่อยู่ในชุดข้อมูล

  3. สามารถสนทนากับเพอร์โซนาได้ และตอบคำถามง่ายๆ ได้ในระดับหนึ่ง

ได้ดึง embedding ขนาด 1024 มิติสำหรับทั้งชุดข้อมูลด้วยโมเดล Qwen 0.6 embedding และจัดทำเป็นชุดข้อมูลบน Hugging Face เนื่องจากคอลัมน์ *_persona มีลักษณะที่ชื่อถูกใส่ซ้ำๆ จึงอาจทำให้ค่า embedding มีอคติไปทางชื่อได้

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น