6 คะแนน โดย arxivgpt 2024-09-06 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

การต้องส่งสิ่งมีชีวิตอันเป็นที่รักจากไปเป็นความสูญเสียครั้งใหญ่และความเศร้าอันบีบคั้นหัวใจสำหรับทุกคน

โดยเฉพาะอย่างยิ่งหากสิ่งนั้นได้จากไปสู่หนทางนิรันดร์ที่ไม่มีวันได้พบกันอีก ก็ยิ่งเป็นเช่นนั้น

เรื่องนี้เพิ่งเกิดขึ้นเมื่อไม่กี่วันก่อน

เจ้าแมวเลี้ยง 'Eric' (มีชื่อเล่นว่า 'Eric Go') ซึ่งเป็นสมาชิกของครอบครัวมานานกว่า 10 ปี ได้จากลาไปอย่างกะทันหันจนไม่ทันได้เตรียมใจ หรือแม้แต่จะจินตนาการถึงการจากลาเช่นนี้

เพื่อครอบครัวและตัวฉันที่กำลังจมอยู่กับความเศร้า ฉันอยากเก็บความทรงจำของ 'Eric' และสร้างความรู้สึกสมจริงว่าเขายังอยู่เคียงข้างเราเสมอ จึงตัดสินใจใช้ 'AI' เพื่อหาวิธีให้ 'Eric' อยู่กับครอบครัวของเราได้ตลอดไป

ในขั้นแรก ฉันตัดสินใจใช้รูปถ่ายของ 'Eric'

เป้าหมายแรกของฉันคือทำให้ทุกคนในครอบครัวสามารถพบ 'Eric' ได้ผ่าน 'ภาพถ่ายและวิดีโอ' ทุกครั้งที่คิดถึงเขา

กล่าวคือ จะนำรูปถ่ายของ 'Eric' ตอนที่ยังมีชีวิตอยู่มาให้ AI ฝึกเรียนรู้ก่อน

จากนั้นเมื่อคิดถึง 'Eric' ก็ป้อนคำสั่งให้ AI ด้วยข้อความหรือเสียง เช่น “ขอภาพแมว (คงรูปลักษณ์ของ 'Eric' ตอนมีชีวิต) ที่ชายหาดฮาวาย ใส่แว่นกันแดดและเครื่องประดับดอกไม้ กำลังยิ้มอย่างมีความสุขพร้อมชูข้อความว่า 'พ่อรักนะ'”

แล้วไม่นาน AI ก็จะสร้างภาพหรือวิดีโอของ 'Eric' ในรูปลักษณ์เดิมตามที่ฉันต้องการขึ้นมาให้ดู

เพื่อสิ่งนี้ ฉันได้วางขั้นตอน การเตรียมการ (การพัฒนา) และกลยุทธ์ไว้หลายอย่าง

ผู้เขียนมีความสามารถด้านการพัฒนา AI ระดับมืออาชีพและมี NVIDIA H100 GPU อยู่หลายตัว จึงเป็นความท้าทายและการทดลองที่สามารถทำได้จริงอย่างเพียงพอ

  1. ขั้นแรกได้คัดเลือกรูปถ่ายของ 'Eric' ประมาณ 45 รูป

  2. เพื่อเพิ่มคุณภาพการฝึก จึงพัฒนากระบวนการ preprocessing แบบอัตโนมัติและนำมาใช้

สิ่งนี้มีเป้าหมายเพื่อทำให้ "วัตถุ" ชัดเจนและเด่นชัดยิ่งขึ้น รวมถึงเพิ่มประสิทธิภาพของการ supervised learning ให้กับ AI

หนึ่งในขั้นตอนนั้นคือการแยกเฉพาะ "วัตถุ" (แมว) ออกจาก 'รูปต้นฉบับ' (ที่มีพื้นหลังรวมอยู่) แบบอัตโนมัติ แล้วทำ preprocessing เช่น scale-up

  1. หลังจบงาน preprocessing ของรูปทั้ง 45 รูป ก็ทำการฝึกด้วยวิธี LoRA

การฝึกใช้การตั้งค่าเริ่มต้นเป็นหลัก และใช้เวลาประมาณ 2 ชั่วโมงเมื่ออิงตาม A100 GPU

  1. การฝึกได้ดำเนินไป และหลังจากฝึกเสร็จ ได้ลงทะเบียน 'โมเดล' เฉพาะสำหรับ 'Eric' ไว้บน 'Hugging Face'

  2. จากนั้นได้เตรียมเชื่อมต่อโมเดลที่ฝึกแล้วเข้ากับโมเดล FLUX เพื่อสร้างภาพด้วยคุณภาพสูงสุด

ได้เขียนโค้ดให้โมเดล FLUX พื้นฐานสามารถรับพรอมป์ต์ภาษาเกาหลีได้ และตอนนี้ก็สามารถตรวจสอบผลลัพธ์จากการฝึกได้แล้ว

ผลลัพธ์ออกมาเหมือนกับตอนที่ยังมีชีวิตอยู่อย่างน่าทึ่ง

เมื่อเห็นทั้งครอบครัวชื่นชมและรู้สึกทึ่งพร้อมกับชอบผลลัพธ์นี้มาก ก็ทำให้ฉันรู้สึกภูมิใจ

และหวังว่าการเปิดเผยบันทึกกระบวนการนี้ไว้จะเป็นประโยชน์กับใครสักคนในอนาคต

หากใครอยากทำแบบนี้ให้กับแมวหรือสุนัขเลี้ยงของตัวเอง ก็สามารถส่งข้อความมาได้ทุกเมื่อ ฉันยินดีช่วยเหลือ

1 ความคิดเห็น

 
arxivgpt 2024-09-06

รายละเอียดเพิ่มเติมและรูปภาพได้ลงไว้ใน Brunch แล้ว
อ้างอิง: https://brunch.co.kr/@seawolf/16