เครื่องมือสำรวจเพอร์โซนาคนเกาหลีบนพื้นฐาน Nemotron-Personas-Korea
(microworld.dev)นี่คือเครื่องมือสำรวจเพอร์โซนาคนเกาหลีที่ใช้ ชุดข้อมูล Nemotron-Personas-Korea ที่ NVIDIA เปิดเผย
ชุดข้อมูลนี้เป็นชุดข้อมูลสังเคราะห์ขนาด 1 ล้านคนของชาวเกาหลี โดยมีข้อมูลอย่างอายุ อาชีพ พื้นที่ และความสัมพันธ์ในครอบครัวรวมอยู่ด้วย วิธีการสร้างชุดข้อมูลและข้อมูลสถิติได้อธิบายไว้อย่างละเอียดที่ https://th.news.hada.io/topic?id=28919
ฟังก์ชันหลักของเครื่องมือสำรวจเพอร์โซนามีดังนี้
-
สามารถค้นหาเพอร์โซนา หรือค้นหาเพอร์โซนาที่คล้ายกันได้ โดยใช้โมเดล embedding ของ Qwen เพื่อเปรียบเทียบความคล้ายคลึง
-
สามารถดูการกระจายตัวของประชากรของเพอร์โซนาบนแผนที่ได้ โดยใช้ข้อมูลตำแหน่งที่อยู่ในชุดข้อมูล
-
สามารถสนทนากับเพอร์โซนาได้ และตอบคำถามง่ายๆ ได้ในระดับหนึ่ง
ได้ดึง embedding ขนาด 1024 มิติสำหรับทั้งชุดข้อมูลด้วยโมเดล Qwen 0.6 embedding และจัดทำเป็นชุดข้อมูลบน Hugging Face เนื่องจากคอลัมน์ *_persona มีลักษณะที่ชื่อถูกใส่ซ้ำๆ จึงอาจทำให้ค่า embedding มีอคติไปทางชื่อได้
- Hugging Face Nemotron-Personas-Korea-Qwen3-0.6B-embeddings
ยังไม่มีความคิดเห็น