LegoGPT - สร้างดีไซน์ LEGO ที่ประกอบได้จริงจากข้อความโดยอัตโนมัติ
(avalovelace1.github.io)- LegoGPT เป็นโครงการนวัตกรรมที่สามารถ สร้างโครงสร้าง LEGO ที่มั่นคงและประกอบได้จริง จากการป้อนข้อความเพียงอย่างเดียว
- มีการสร้างชุดข้อมูล StableText2Lego ที่ให้โครงสร้าง LEGO ที่มีเสถียรภาพทางกายภาพมากกว่า 47,000 แบบ พร้อมคำอธิบายอย่างละเอียด
- อัลกอริทึม ใช้การตรวจสอบความถูกต้องอย่างรวดเร็วและการย้อนกลับบนพื้นฐานฟิสิกส์ เพื่อลบโครงสร้างที่ไม่สมจริงออกโดยอัตโนมัติ
- ดีไซน์ LEGO ที่สร้างขึ้นสามารถประกอบจริงได้ทั้งโดย มนุษย์และหุ่นยนต์ และยังรองรับการแสดงสีสันและพื้นผิวที่หลากหลาย
- ระบบนี้เปิดโอกาสใหม่ให้กับหลายสาขา เช่น การทำต้นแบบงานออกแบบเชิงสร้างสรรค์, การศึกษา และงานประยุกต์ด้านหุ่นยนต์
แนะนำโครงการ
- LegoGPT เป็นแนวทางแรกที่สร้าง โครงสร้าง LEGO ที่ประกอบได้จริงและมีเสถียรภาพทางกายภาพ แบบอัตโนมัติเต็มรูปแบบ โดยอิงจากข้อความพรอมป์ต์ที่ผู้ใช้ป้อน
- โครงการนี้สร้างขึ้นพร้อม ชุดข้อมูลโครงสร้าง LEGO ขนาดใหญ่ และคำอธิบายอย่างละเอียด ทำให้สามารถสร้างผลงานที่มีทั้ง ความมั่นคง ความหลากหลาย และความสวยงาม แม้ในกระบวนการประกอบจริง
- มีการยืนยันเชิงทดลองแล้วว่าโครงสร้าง LEGO ที่สร้างขึ้นสามารถ ประกอบด้วยมือโดยมนุษย์ หรือประกอบอัตโนมัติด้วยแขนกลหุ่นยนต์ได้จริง
ชุดข้อมูล StableText2Lego
- ชุดข้อมูล StableText2Lego สร้างจากการแปลงรูปทรงของ ShapeNetCore 3D mesh ให้เป็น voxel แล้วใช้วิธีการจัดวางบล็อกหลายแบบ โดย เลือกเฉพาะโครงสร้างที่ผ่านการตรวจสอบเสถียรภาพทางกายภาพ เท่านั้น
- ในกระบวนการสร้างข้อมูล มีการ เรนเดอร์มุมมองของแต่ละโครงสร้างจาก 24 มุม และให้ GPT-4o สร้าง คำบรรยายที่ละเอียด โดยอัตโนมัติจากภาพเหล่านั้น
- ชุดข้อมูลที่ได้ประกอบด้วย โครงสร้าง LEGO มากกว่า 47,000 แบบ และ อ็อบเจ็กต์ 3D ที่ไม่ซ้ำกันมากกว่า 28,000 ชิ้น ที่มี รูปทรง โครงสร้าง และพื้นผิว หลากหลาย
ไปป์ไลน์ของ LegoGPT
- โครงสร้าง LEGO ถูกโทเคไนซ์เป็นลำดับโทเค็นข้อความแบบ จากล่างขึ้นบน และสแกนแบบแรสเตอร์ เพื่อใช้เป็นอินพุต
- มีการจับคู่ลำดับบล็อกแต่ละชุดกับคำอธิบายภาษาธรรมชาติ แล้วนำไป fine-tune โมเดลที่อิงกับ LLaMA-3.2-Instruct-1B เพื่อเรียนรู้การแมประหว่าง คำอธิบายกับลำดับบล็อก
- ในขั้นตอนอนุมาน LegoGPT จะค่อย ๆ สร้างโครงสร้าง LEGO จากข้อความพรอมป์ต์ด้วยวิธี ทำนายและเพิ่มบล็อกทีละชิ้น
- ทุกครั้งที่มีการเพิ่มบล็อก จะมีการตรวจสอบความถูกต้องในด้าน รูปแบบ การมีอยู่ในคลังบล็อก และการชนกัน และหลังจากสร้างโครงสร้างเสร็จแล้วจะมีการ ตรวจสอบเสถียรภาพทางกายภาพซ้ำอีกครั้ง
- หากโครงสร้างสุดท้ายไม่เสถียร ระบบจะ ลบบล็อกที่ไม่เสถียรและบล็อกทั้งหมดที่ถูกเพิ่มหลังจากนั้น แล้ว rollback กลับไปยังสถานะที่เสถียรเพื่อสร้างใหม่
ตัวอย่างการสร้างโครงสร้าง LEGO แบบเป็นขั้นตอน
- "เรือทรงเพรียวที่มีลำตัวเรือยาวและแคบ"
- "ชั้นหนังสือที่มีชั้นวางแนวนอน"
- "ม้านั่งมีที่วางแขนแต่ไม่มีพนักพิง"
- แต่ละตัวอย่างถูกสร้างขึ้นทีละขั้นจาก ข้อความพรอมป์ต์ ไปเป็น โครงสร้าง LEGO ที่สะท้อนลักษณะทางภาพได้อย่างชัดเจน
การประกอบอัตโนมัติด้วยหุ่นยนต์
- โมเดล LEGO ที่สร้างขึ้นถูกนำไปใช้กับ การประกอบจริงด้วยแขนกลหุ่นยนต์ และมีการสาธิตใน วิดีโอแบบเร่งความเร็ว 8 เท่า
- แสดงให้เห็นความเป็นไปได้ของ การประยุกต์ใช้กับการประกอบโดยหุ่นยนต์จริง สำหรับตัวอย่างอย่าง "เรือทรงเพรียวที่มีลำตัวเรือยาวและแคบ" และ "กีตาร์ 6 สายแบบไม่สมมาตร"
โมเดล LEGO ที่สร้างพื้นผิวและสีสันได้
- ระบบสามารถสร้างดีไซน์ LEGO ที่ถ่ายทอด พื้นผิว วัสดุ และเอฟเฟกต์ความงามเฉพาะทาง ได้จากพรอมป์ต์ภาษาธรรมชาติ เช่น "ม้านั่งที่มีตะไคร่น้ำเกาะ", "วัสดุไซเบอร์พังก์นีออนไล่เฉด", "ชั้นวางหนังสือในห้องทำงานสไตล์วิกตอเรียน"
- ยังสามารถสร้างแบบ LEGO จากข้อความเพียงอย่างเดียวให้สะท้อน สีสันหลากหลายและเอฟเฟกต์โลหะ ได้ เช่น "Sunburst Les Paul with amber finish"
การอ้างอิงและการสนับสนุนงานวิจัย
- มีการระบุข้อมูลของงานวิจัย ผู้เขียน และหน่วยงานที่สนับสนุนงานวิจัยนี้ไว้ เช่น Packard Foundation และ Amazon Faculty Award
- โครงการนี้ดำเนินการภายใต้การสนับสนุนทั้งด้านวิชาการและอุตสาหกรรมหลายรูปแบบ เช่น Microsoft Research PhD Fellowship ของหนึ่งในนักวิจัยหลัก
อ้างอิงโครงการและเทมเพลต
- เทมเพลตของเว็บไซต์นี้อ้างอิงเลย์เอาต์จากโครงการ Custom Diffusion และ DreamFusion
1 ความคิดเห็น
ความเห็นบน Hacker News
playsinlineให้กับแท็ก video https://developer.mozilla.org/en-US/docs/… น่าเสียดายที่ค่าเริ่มต้นของ iOS เป็นแบบนี้