- สร้างโมเดลแมชชีนเลิร์นนิง (ML) เชิงกำเนิดสำหรับการสร้างฟอนต์ชื่อ
FontoGen
- โมเดลรับคำอธิบายของฟอนต์เป็นอินพุต และส่งออกเป็นไฟล์ฟอนต์
- ผู้เขียนได้รับแรงบันดาลใจจากการเติบโตของ AI ในปี 2023 จึงเริ่มสำรวจการสร้าง SVG จากข้อความ และนำไปสู่ไอเดียการสร้างฟอนต์
- ผู้เขียนสร้างโมเดลโดยอ้างอิงจากงานวิจัย IconShop2 และพบว่าสามารถสร้างฟอนต์ได้ในลักษณะคล้ายกับการสร้าง SVG
- โมเดลเป็นแบบ sequence-to-sequence ที่ฝึกด้วยลำดับซึ่งมี text embedding ตามด้วย font embedding
- text embedding สร้างโดยใช้โมเดลเอนโค้ดเดอร์ BERT ที่ผ่านการพรีเทรนไว้ล่วงหน้า ส่วน font embedding สร้างโดยแปลงฟอนต์เป็นลำดับโทเคน
- โมเดลเป็นทรานส์ฟอร์เมอร์แบบ autoregressive เฉพาะเอนโค้ดเดอร์ ประกอบด้วย 16 เลเยอร์และ 8 บล็อก มีพารามิเตอร์ทั้งหมด 73.7 ล้านตัว
- ผู้เขียนใช้ BigBird3 attention เพื่อโฟกัสกับพรอมป์ต์เริ่มต้นและดูโทเคนก่อนหน้า N ตัว เพื่อจับสไตล์ของหลาย glyph ก่อนหน้า
- โมเดลฝึกด้วยชุดข้อมูลฟอนต์เฉพาะ 71k รายการ โดยใช้ GPT-3.5 สรุปคำอธิบายหลากหลายประเภทให้เหลือคีย์เวิร์ดไม่กี่คำ
- กระบวนการฝึกใช้เวลา 127 ชั่วโมง และหยุดเมื่อ validation loss แทบไม่ดีขึ้น
- ผู้เขียนปรับปรุงประสิทธิภาพได้ 3 เท่า โดยย้ายงานให้มากที่สุดไปไว้ในขั้นตอน preprocessing ของชุดข้อมูล
- ผู้เขียนเสนอการประยุกต์ใช้ในอนาคตที่เป็นไปได้ เช่น ผสานโมเดลเข้ากับโปรแกรมแก้ไขฟอนต์ที่มีอยู่ เพื่อสร้าง glyph อื่นทั้งหมดจาก glyph เดียวที่นักออกแบบสร้างขึ้น
2 ความคิดเห็น
ช่วยสร้างฟอนต์น่ารักๆ ให้ฉันหน่อย
ความคิดเห็นจาก Hacker News