LL3M: นักสร้างโมเดล 3D ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่

(threedle.github.io)

11 คะแนน โดย GN⁺ 2025-08-18 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

LL3M ใช้โมเดลภาษาขนาดใหญ่หลายตัวในการเขียนโค้ด Python อัตโนมัติเพื่อ สร้างและแก้ไขแอสเซ็ต 3D ใน Blender
ตามคำสั่งข้อความของผู้ใช้ ระบบสามารถสร้าง รูปร่างที่สร้างสรรค์และแม่นยำ ได้โดยตรง และนำการจัดการเรขาคณิตที่ซับซ้อนไปแปลงเป็นโค้ด
ต่างจากเครื่องมือสร้างโมเดล 3D แบบเดิม โดยมอบ การสร้างแอสเซ็ตที่ไร้ข้อจำกัดและการโต้ตอบอย่างละเอียด
โค้ด Blender ที่สร้างขึ้นมีความชัดเจนและมี ความโปร่งใสของพารามิเตอร์ สูง ทำให้ผู้ใช้หรือเอเจนต์สามารถแก้ไขหรือปรับปรุงซ้ำได้ง่าย
แสดงให้เห็นถึงศักยภาพในการจัดการแอสเซ็ต 3D อย่างกว้างขวาง เช่น การทำสไตล์ให้สม่ำเสมอ การแก้ไขวัสดุ และการสร้างโครงสร้างลำดับชั้น

ภาพรวมของ LL3M

LL3M เป็นเฟรมเวิร์กนวัตกรรมที่เอเจนต์ LLM หลายตัวเขียนโค้ด Python เพื่อ สร้างและแก้ไขแอสเซ็ต 3D ใน Blender
เมื่อผู้ใช้สั่งงานด้วยข้อความ LL3M จะทำให้การสร้างรูปทรงเชิงสร้างสรรค์และการปรับแต่งเรขาคณิตอย่างแม่นยำเป็นแบบอัตโนมัติ และใช้โค้ดระดับสูงเป็นรูปแบบการแทน 3D เพื่อให้สามารถปรับปรุงซ้ำและทำงานร่วมกันได้
โค้ดมีคำอธิบายที่ชัดเจน ทำให้พารามิเตอร์และโครงสร้างต่าง ๆ โปร่งใส จึงเหมาะกับการแก้ไขเพิ่มเติมและการรับฟีดแบ็กจากผู้ใช้อย่างต่อเนื่อง

ภาพรวมของไปป์ไลน์

ไปป์ไลน์ประกอบด้วย 3 ขั้นตอนหลัก (การสร้างเริ่มต้น การปรับปรุงอัตโนมัติ และการปรับปรุงตามฟีดแบ็กของผู้ใช้)
- ในขั้นตอนการสร้างเริ่มต้น นอกจากสร้างรูปทรงพื้นฐานแล้ว LL3M ยังตรวจจับและปรับปรุงโครงสร้างที่ไม่สมเหตุสมผลหรือองค์ประกอบเรขาคณิตที่เรียบง่ายเกินไป โดยอัตโนมัติ
- ขั้นตอนที่สองเป็นการแก้ไขอัตโนมัติที่ละเอียดขึ้น และสะท้อนถึง รูปทรงหรือความสัมพันธ์ที่ซับซ้อน ได้ด้วย
- ขั้นตอนสุดท้ายรองรับคำขอแก้ไขเพิ่มเติมจากผู้ใช้ เพื่อให้เกิด การสร้างแอสเซ็ต 3D แบบโต้ตอบและทำซ้ำได้
แต่ละขั้นตอนใช้การแบ่งบทบาทของเอเจนต์เพื่อดำเนินแนวทางการปรับปรุงแบบค่อยเป็นค่อยไปและวนซ้ำ

แกลเลอรีและประสิทธิภาพ

การสร้างรูปทรงที่หลากหลาย: สร้างโครงสร้างที่ซับซ้อนและรายละเอียดประณีตของกังหันลม เปียโน ชุดกลอง ฯลฯ ด้วยโค้ด
การใช้สไตล์อย่างสม่ำเสมอ: นำคำสั่ง "steampunk" เดียวกันไปใช้กับเมชหลายชิ้น (เช่น หมวก) เพื่อคงสไตล์ร่วมกันแต่ได้ผลลัพธ์ที่แตกต่างกัน
รองรับการแก้ไขวัสดุ: เช่น สามารถกำหนดเฉพาะส่วนคมดาบด้วย shader node แยกต่างหากเพื่อเปลี่ยนวัสดุได้

ความสามารถในการตีความโค้ด

โค้ดที่สร้างขึ้นมี ตรรกะเชิงโครงสร้าง ชื่อตัวแปรที่ชัดเจน และคอมเมนต์ จึงเข้าใจและแก้ไขได้ง่าย
ตัวอย่าง: สามารถแก้ไขลอจิกของแพตเทิร์นคีย์บอร์ดหรือค่าตัวแปรความกว้างของคีย์ได้โดยตรง
เนื่องจาก Blender node และพารามิเตอร์ต่าง ๆ ถูกเปิดเผยไว้อย่างครบถ้วน จึงสามารถปรับคุณสมบัติด้านภาพ เช่น สีและแพตเทิร์น ได้อย่างเป็นธรรมชาติ

การนำโค้ดกลับมาใช้ใหม่และความอเนกประสงค์

แม้จะเป็นรูปทรงที่ต่างกัน แต่แพตเทิร์นโค้ดระดับสูงอย่าง ลูป modifier และการตั้งค่า node ยังสามารถนำกลับมาใช้ซ้ำได้
ทำให้สามารถสร้างโค้ดแบบโมดูลาร์ที่แก้ไขได้จากพรอมป์ต์ที่หลากหลาย

ฉากและโครงสร้างลำดับชั้น

สร้างวัตถุหลายชิ้นและจัดวางความสัมพันธ์เชิงพื้นที่โดยอัตโนมัติด้วย instancing และ parenting
ตัวอย่าง: เมื่อสร้างวัตถุประกอบอย่างโคมไฟ ระบบจะสะท้อนโครงสร้างความสัมพันธ์แบบพ่อ-ลูก เพื่อให้การแปลงค่าถูกส่งต่อในเชิงลำดับชั้น
แต่ละชิ้นส่วนมี semantic name ที่มีความหมาย จึงสามารถจัดการได้อย่างมีประสิทธิภาพใน scene graph ของ Blender

LL3M: นักสร้างโมเดล 3D ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่

ภาพรวมของ LL3M

ภาพรวมของไปป์ไลน์

แกลเลอรีและประสิทธิภาพ

ความสามารถในการตีความโค้ด

การนำโค้ดกลับมาใช้ใหม่และความอเนกประสงค์

ฉากและโครงสร้างลำดับชั้น

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น