28 คะแนน โดย xguru 2023-06-09 | 9 ความคิดเห็น | แชร์ทาง WhatsApp
  • ผู้ใช้ Reddit ชื่อ nhciao สร้างคิวอาร์โค้ดสไตล์อนิเมะที่ใช้งานได้จริง โดยใช้ ControlNet + LoRA
  • สิ่งนี้เป็นไปได้เพราะฟังก์ชัน Error Correction ที่มีอยู่เดิมของคิวอาร์โค้ด
  • สามารถประยุกต์ใช้ได้หลากหลายรูปแบบ เช่น ลวดลายดั้งเดิมของจีน, ukiyo-e, อนิเมชัน 2D, ภาพหมึกจีน, สีน้ำ, ภาพสามมิติ, นามธรรม, PCB เป็นต้น
  • รายละเอียดเพิ่มเติมดูได้จากบทความต้นฉบับที่เขียนเป็นภาษาจีน

9 ความคิดเห็น

 
yinn27 2023-06-10

ไอเดียสุดยอดมาก…

 
qkreoaksn 2023-06-09

โอ้โห.....

 
popup 2023-06-09

ลองสแกนดูแล้วอ่าน QR ได้ด้วย น่าทึ่งดีนะ

 
kuroneko 2023-06-09

พอจะเข้าใจอยู่ว่าในทางทฤษฎีมันเป็นไปได้ แต่ก็ยังทำใจเชื่อไม่ลงจริง ๆ ว่าสิ่งนั้นสแกนได้จริง น่าทึ่งมากครับ

 
xguru 2023-06-09

บทความบล็อกภาษาจีน: https://mp.weixin.qq.com/s/i4WR5ULH1ZZYl8Watf3EPw

 
kuroneko 2023-06-09

พอลองเอาบทความต้นฉบับไปใส่ในเครื่องมือสรุป ก็ได้ออกมาแบบนี้ครับ

  • บทความนี้กล่าวถึงโมเดล ControlNet แบบใหม่ที่สามารถสร้างภาพ QR code ที่สแกนได้ โดย ControlNet สามารถเข้ารหัสข้อมูลที่ซ่อนอยู่ในภาพซึ่งดูปกติสำหรับสายตามนุษย์ได้
  • ผู้เขียนและเพื่อนร่วมทีมเคยสร้างตัวสร้าง QR code แบบกำหนดพารามิเตอร์มาก่อน แต่ไม่ได้อัปเดตต่อเนื่อง และไอเดียปัจจุบันเกิดขึ้นหลังจากที่ Stable Diffusion เปิดตัว
  • ความพยายามแรก ๆ กับ ControlNet คือการฝึกให้เรียนรู้ลวดลายดั้งเดิมของจีน โดยผู้เขียนระบุว่าใช้เอกสาร AIGC All in One และ HuggingFace JAX/Diffusers ในการฝึก
  • การฝึก ControlNet ต้องใช้ข้อมูลจำนวนมากและพลังประมวลผลสูง งานวิจัยนี้ใช้ภาพมากถึง 300,000 ภาพ และเวลา GPU A100 จำนวน 600 ชั่วโมง ส่วนผู้เขียนฝึกเวอร์ชันภาพจำนวน 100,000 ภาพด้วยอัตราการเรียนรู้ที่สูง
  • หลังการฝึก ผู้เขียนได้ทดสอบการจับคู่ Checkpoint + LoRA + QR Code ControlNet หลายแบบ เพื่อสร้าง QR code ที่สแกนได้ในหลากหลายสไตล์ เช่น ลวดลายดั้งเดิมของจีน, ukiyo-e, 2D, หมึก, perspective, abstract และสไตล์ PCB
  • QR code ที่สร้างขึ้นมีทั้งสไตล์ลวดลายดั้งเดิมของจีน, ukiyo-e, แอนิเมชัน, ภาพประกอบ, หมึก, สีน้ำ, 3D และ abstract
  • โปรเจกต์นี้อาศัยความร่วมมือจากเพื่อนร่วมทีมหลายคนและทรัพยากร GPU ของห้องแล็บ อีกทั้งเซิร์ฟเวอร์ Google TPU ก็ช่วยเร่งความเร็วในการฝึกได้ด้วย
  • ผู้เขียนมีแผนจะเผยแพร่โมเดลและเอกสารทางเทคนิคผ่านบัญชีทางการบน WeChat และเว็บไซต์ในอนาคต
  • บทความนี้กล่าวถึงการพัฒนาอย่างรวดเร็วของโมเดลสร้างภาพด้วย AI และแสดงความรู้สึกว่าอยากกลับไปเรียนมหาวิทยาลัยอีกครั้ง
  • ผู้เขียนกล่าวขอบคุณ Google และ HuggingFace ที่ให้เซิร์ฟเวอร์ TPU โดยบอกว่า "ได้ใช้เวลาอย่างสนุกสนาน"
 
lunamoth 2023-06-09

ขอทราบได้ไหมครับว่าใช้บริการอะไรสำหรับตัวสรุป?

 
kuroneko 2023-06-11

กำลังใช้งาน Universal Summarizer ของ Kagi อยู่

 
lunamoth 2023-06-11

ขอบคุณที่แจ้งให้ทราบ