1 คะแนน โดย GN⁺ 2025-03-08 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • สำรวจวิธีย้อนออกแบบแพตเทิร์นที่ซับซ้อนจากกฎเฉพาะที่อย่างง่าย
  • แนวทางที่ผสานความสามารถในการเรียนรู้ของ Neural Cellular Automata (NCA) เข้ากับ Differentiable Logic Gate Networks เพื่อให้ได้กฎเฉพาะที่แบบไม่ต่อเนื่องผ่านการเรียนรู้
    • "จะสามารถเรียนรู้กฎของ Conway's Game of Life ได้หรือไม่?"
    • "จะสามารถสร้างแพตเทิร์นซับซ้อนแบบ NCA พร้อมเรียนรู้โครงสร้างวนซ้ำเชิงกาลอวกาศได้หรือไม่?"

Introduction

  • Cellular Automata (CA) เริ่มจากกฎเฉพาะที่อย่างง่าย แต่สามารถก่อให้เกิดแพตเทิร์นที่ซับซ้อนและคาดเดาได้ยาก
  • โดยปกติแล้ว ใน CA มนุษย์จะเป็นผู้ออกแบบกฎเองโดยตรง แต่ที่นี่ได้นำเสนอวิธีที่สามารถกำหนดแพตเทิร์นหรือพฤติกรรมเป้าหมายล่วงหน้า แล้วให้ระบบ "เรียนรู้" ย้อนกลับเพื่อหากฎเฉพาะที่ที่สอดคล้องกับสิ่งนั้น
  • โดยเฉพาะอย่างยิ่ง Neural Cellular Automata (NCA) คือการออกแบบให้โครงสร้าง CA ผสานกับเทคนิคดีปเลิร์นนิง เพื่อให้สามารถเรียนรู้ได้ในปริภูมิต่อเนื่อง
  • Differentiable Logic Gate Networks เป็นเทคนิคที่ประมาณลอจิกเกต (AND, OR, XOR เป็นต้น) แบบต่อเนื่องเพื่อให้เรียนรู้ได้ และในท้ายที่สุดจะแปลงกลับเป็นวงจรตรรกะแบบไม่ต่อเนื่อง
  • จากการผสานสองแนวคิดนี้ จึงเสนอโมเดล CA ที่ทั้งเรียนรู้ได้และเป็นแบบไม่ต่อเนื่องอย่างสมบูรณ์ในชื่อ DiffLogic CA
  • สิ่งนี้อาจมองได้ว่าเป็นก้าวเล็ก ๆ ไปสู่ Programmable Matter หรือ Computronium
  • บทความนี้ดำเนินไปตามลำดับดังนี้
    • สรุป Neural Cellular Automata
    • สรุป Differentiable Logic Gate Networks
    • โครงสร้าง DiffLogic CA ที่ผสานทั้งสองแนวทาง
    • การทดลองเรียนรู้กฎของ Conway’s Game of Life
    • การทดลองเรียนรู้เพื่อสร้างแพตเทิร์นซับซ้อน (กระดานหมากรุก, กิ้งก่า, ภาพสี เป็นต้น)

Recap – Neural Cellular Automata(NCA)

  • แนวคิด
    • เป็นระบบที่แทนที่กฎ CA แบบดั้งเดิมด้วยรูปแบบที่สามารถเรียนรู้ได้ด้วยโครงข่ายประสาท
    • แต่ละเซลล์มีหลายช่องสัญญาณ (state) และสร้างแพตเทิร์นซับซ้อนผ่านปฏิสัมพันธ์เฉพาะที่
    • ใช้ Sobel filter เป็นต้น เพื่อรับข้อมูลจากบริเวณรอบข้าง แล้วให้โครงข่ายประสาทตัดสินการเปลี่ยนสถานะ
  • ลักษณะเด่น
    • กระบวนการคำนวณทั้งหมดหาอนุพันธ์ได้ จึงสามารถฝึกให้สร้างแพตเทิร์นตามที่ต้องการได้
    • ยังคงแก่นสำคัญของ CA เช่น ความขนาน ความเป็นเฉพาะที่ และการคำนวณแบบอิงสถานะ พร้อมผสานเทคนิคดีปเลิร์นนิง

Recap – Differentiable Logic Gate Networks(DLGNs)

  • แนวคิดหลัก
    • แทนที่จะใช้ NN แบบดั้งเดิม จะเรียนรู้ผ่านการประมาณลอจิกเกต (AND, OR, XOR เป็นต้น) แบบต่อเนื่อง (soft gate)
    • ในช่วงฝึก เกตจะทำงานแบบต่อเนื่อง และในช่วงอนุมานสุดท้ายจะดำเนินการแบบไบนารีจริง
  • กระบวนการเรียนรู้
    • เรียนรู้การกระจายความน่าจะเป็นของการดำเนินการเชิงตรรกะที่เป็นไปได้ 16 แบบของเกต ก่อนจะลู่เข้าสู่การดำเนินการเฉพาะแบบหนึ่งในที่สุด
    • ใช้การประมาณแบบต่อเนื่องเพื่อให้หาอนุพันธ์ได้ และเมื่อฝึกเสร็จแล้วจะเปลี่ยนเป็นลอจิกเกตแบบไม่ต่อเนื่องอย่างสมบูรณ์
  • ข้อดี
    • วงจรสุดท้ายประกอบด้วยลอจิกเกตแบบไบนารีทั้งหมด จึงมีประสิทธิภาพสูงในเชิงฮาร์ดแวร์
    • เนื่องจากอิงตรรกะแบบไม่ต่อเนื่อง จึงมีข้อดีด้านความสามารถในการตีความและประสิทธิภาพพลังงาน

Differentiable Logic Cellular Automata (DiffLogic CA)

  • โครงสร้าง
    • ในกริด 2D แต่ละเซลล์มีสถานะ n บิต และจำลองผ่านขั้นตอน Perception → Update
    • ขั้นตอน Perception
      • ประมวลผลข้อมูลของเพื่อนบ้าน (แยกตามแต่ละช่องสัญญาณ) ด้วยเคอร์เนลวงจรตรรกะ
    • ขั้นตอน Update
      • รวมสถานะปัจจุบันกับผลลัพธ์จาก Perception ผ่านวงจรตรรกะอีกชุดหนึ่ง เพื่อกำหนดสถานะของเวลาถัดไป
  • ลักษณะเด่น
    • ทุกเซลล์ทำงานเสมือนโปรเซสเซอร์ขนาดเล็กที่เป็นอิสระและกระจายตัว
    • เรียนรู้แบบ soft (การประมาณต่อเนื่อง) แล้วอนุมานแบบ hard (เกตไบนารี) จึงมีประสิทธิภาพสูง
    • มีปรัชญาคล้ายกับสถาปัตยกรรมคอมพิวติ้งแบบอิง CA อย่าง CAM-8

Experiment 1: Learning Game of Life

  • วัตถุประสงค์
    • เรียนรู้กฎของ Conway's Game of Life ด้วย DiffLogic CA เพื่อตรวจสอบว่าสามารถทำซ้ำได้อย่างสมบูรณ์หรือไม่
  • การตั้งค่า
    • ใช้สถานะเซลล์ 1 บิต
    • Perception ใช้ 16 เคอร์เนล (แต่ละอันมีโครงสร้างเกต 8→4→2→1)
    • Update ใช้ 23 เลเยอร์ (16 เลเยอร์แรก 128 โหนด แล้วตามด้วย [64, 32, 16, 8, 4, 2, 1])
    • ฝึกบนทุกสถานะที่เป็นไปได้ทั้งหมดในกริด 3x3 (512 สถานะ) เพื่อให้ทำนายสถานะในสเต็ปถัดไปได้อย่างถูกต้อง
  • ผลลัพธ์
    • ค่าความสูญเสียจากการฝึกลดลงจนเกือบเป็น 0 และเรียนรู้กฎเฉพาะที่ของ Game of Life ได้อย่างสมบูรณ์
    • บนกริดที่ใหญ่ขึ้น สามารถสร้างทุกแพตเทิร์น เช่น glider, block ได้เหมือน Game of Life จริง
    • ในวงจรสุดท้ายมีการใช้เกต AND และ OR เป็นจำนวนมาก

Experiment 2: Pattern Generation

  • ตัวอย่าง Checkerboard
    • เซลล์ที่มีสถานะ 8 บิตสร้างลวดลายกระดานหมากรุก 16x16 ภายใน 20 สเต็ป
    • Perception ใช้ 16 เคอร์เนล และ Update ใช้ 16 เลเยอร์ (สูงสุด 256 เกต)
    • คำนวณค่าความสูญเสียโดยเปรียบเทียบเฉพาะช่องสัญญาณสุดท้ายกับแพตเทิร์นเป้าหมาย
  • ผลลัพธ์
    • สร้างลวดลายกระดานหมากรุกได้อย่างแม่นยำ และกฎถูกทำให้กระชับด้วยเกตเพียงไม่กี่ตัว
    • แม้ขยายไปยังกริดที่ใหญ่ขึ้น 4 เท่า ก็ยังสเกลด้วยกฎเดิมและทำงานได้โดยไม่มีปัญหา
    • แม้ปิดใช้งานบางเซลล์อย่างถาวร แพตเทิร์นก็ไม่เสียหายมาก และเมื่อกู้คืนเซลล์ที่ปิดใช้งาน ระบบก็ซ่อมแซมตัวเองได้อัตโนมัติ
  • Asynchronicity
    • แม้ฝึกด้วยการอัปเดตแบบอะซิงโครนัส ก็ยังเรียนรู้แพตเทิร์นกระดานหมากรุกได้อย่างไม่มีปัญหา
    • กฎที่ฝึกแบบซิงโครนัสก็ยังทำงานได้ดีเมื่อนำไปใช้กับการอนุมานแบบอะซิงโครนัส
    • กฎที่ฝึกแบบอะซิงโครนัสมีแนวโน้มฟื้นตัวจากสัญญาณรบกวนหรือความเสียหายได้เร็วกว่าเล็กน้อย

Experiment 3: Growing a Lizard

  • วัตถุประสงค์
    • ฝึกให้สร้างโครงร่างกิ้งก่าขนาด 20x20 ภายใน 12 สเต็ป เพื่อยืนยันความเป็นไปได้ในการสร้างรูปร่างที่ซับซ้อน
  • การตั้งค่า
    • สถานะ 128 บิต
    • Perception 4 เคอร์เนล (แต่ละอันเป็นโครงสร้างเกต [8, 4, 2, 1]), Update 10 เลเยอร์ (8 เลเยอร์แรก 512 เกต แล้วตามด้วย [256, 128])
    • วางเซลล์ที่แอ็กทีฟเพียงหนึ่งเซลล์ไว้ตรงกลางกริด และใช้ periodic boundary condition
  • ผลลัพธ์
    • แม้บนกริดขนาดใหญ่ (40x40) กิ้งก่าก็ยังเติบโตได้อย่างถูกต้อง
    • แม้จะต้องใช้เกตจำนวนมาก แต่ก็สามารถฝึกได้ด้วยการปรับจูนไฮเปอร์พารามิเตอร์ที่เหมาะสม

Experiment 4: Learning the G with colors

  • วัตถุประสงค์
    • สร้างภาพสีขนาด 16x16 ที่มี 3 ช่องสัญญาณ RGB ตลอด 15 สเต็ป เพื่อทดสอบการสร้างแพตเทิร์นหลายช่องสัญญาณ
  • การตั้งค่า
    • สถานะ 64 บิต (ใช้ 3 ช่องสัญญาณแรกเป็น RGB โดยแต่ละช่องมีค่าเป็น 0 หรือ 1)
    • Perception 4 เคอร์เนล (แต่ละอันเป็น [8, 4, 2]), Update 11 เลเยอร์ (8 เลเยอร์แรก 512 เกต แล้วตามด้วย [256, 128, 64])
    • ภาพเป้าหมายเป็นแพตเทิร์นตัว G ขนาด 16x16 ที่เติมด้วยหนึ่งใน 8 สี
  • ผลลัพธ์
    • ฝึกจนค่าความสูญเสียเกือบเป็น 0 และหลัง 15 สเต็ปสามารถสร้างตัว G สีตามเป้าหมายได้อย่างแม่นยำ
    • วงจรใช้เกต TRUE และ FALSE จำนวนมาก และมี OR gate เด่นชัด

Summary and Discussion

  • ทำอะไรไปบ้าง
    • เสนอ DiffLogic CA ซึ่งเป็นโมเดล CA ที่ทั้งเรียนรู้ได้และเป็นแบบไม่ต่อเนื่องอย่างสมบูรณ์
    • แสดงความสามารถในการทำซ้ำกฎคลาสสิกอย่าง Game of Life และสร้างแพตเทิร์นอย่างกระดานหมากรุก, กิ้งก่า, และ G แบบมีสี
    • เนื่องจากประกอบด้วยวงจรตรรกะแบบไม่ต่อเนื่อง จึงคาดหวังได้ทั้งการตีความที่เข้าใจง่ายและประสิทธิภาพเชิงฮาร์ดแวร์
  • ความสำคัญ
    • พิสูจน์ว่าแพตเทิร์นการจัดระเบียบตัวเองแบบที่ NCA แสดงให้เห็นนั้น สามารถเรียนรู้ได้ด้วยลอจิกเกตแบบไม่ต่อเนื่องเช่นกัน
    • เมื่อคำนึงถึงคุณสมบัติอย่างการฟื้นฟูจากความเสียหายหรือการอัปเดตแบบอะซิงโครนัส ก็มีศักยภาพสูงในการประยุกต์ใช้กับการคอมพิวต์แบบกระจายและทนต่อความผิดพลาด (robust)
  • ข้อจำกัดและงานในอนาคต
    • เมื่อต้องเรียนรู้ภาพหรือแพตเทิร์นที่ซับซ้อน จำเป็นต้องปรับจูนไฮเปอร์พารามิเตอร์อย่างเหมาะสม
    • ยังมีช่องทางให้สำรวจโครงสร้างอย่างเกตแบบ LSTM หรือกลไกที่ลืมสถานะได้อย่างมีประสิทธิภาพ เพื่อให้สร้างแพตเทิร์นที่หลากหลายยิ่งขึ้น
    • สามารถต่อยอดไปในทิศทางของการปรับขนาดวงจรให้เหมาะสมและทำให้การฝึกมีเสถียรภาพมากขึ้น
  • บทสรุป
    • DiffLogic CA เป็นแนวทางที่มีอนาคตสำหรับทิศทางการคอมพิวต์แบบกระจายเชิงทฤษฎี เช่น Programmable Matter หรือ Computronium
    • ด้วยความที่เป็นแบบไม่ต่อเนื่องอย่างสมบูรณ์แต่ยังเรียนรู้ได้ จึงมีศักยภาพที่จะเป็นรากฐานของระบบกระจายในอนาคต

1 ความคิดเห็น

 
GN⁺ 2025-03-08
ความเห็นบน Hacker News
  • น่าสนใจมาก ฉันกำลังสะสมแพลตฟอร์มเครื่องทัวริงอเนกประสงค์แบบใหม่อยู่ สะสมเหมือนโปเกมอนเพื่อใช้ทดลอง genetic programming เคยใช้ cellular automata (CA) มาก่อน แต่แนวทางนี้น่าดึงดูดกว่ามาก ไม่เคยคิดจะโมเดลเคอร์เนลเหมือนวงจรลอจิกดิจิทัลมาก่อน
    • ตรรกะแบบบูลีน เกต และข้อจำกัดของวงจร สร้างพื้นผิวที่น่าสนใจให้กับ fitness landscape ได้ พารามิเตอร์ที่ได้สามารถแปลงตรงไปเป็นการติดตั้งใช้งานบนฮาร์ดแวร์ หรือผ่านขั้นตอนปรับให้เหมาะสมเพิ่มเติมแล้วคอมไพล์เป็นโปรแกรมง่าย ๆ ได้ ดูดีกว่าค่าทศนิยมลอยตัวลึกลับแบบกล่องดำที่มีพารามิเตอร์นับพันล้านตัว
  • ฉันชอบใช้ cellular automata กับงานศิลปะ รู้สึกทึ่งเสมอว่าลวดลายแบบไหนจะปรากฏขึ้นได้ คงต้องลองใช้ DLCA ดูแล้ว
  • น่าสนใจมาก ฉันประทับใจกับคำถามที่ Michael Levin ตั้งไว้เกี่ยวกับวิธีที่เซลล์สัตว์สามารถร่วมมือกันได้โดยไม่มีลำดับชั้น มีการทดลองที่เซลล์ตาของตัวอ่อนกบย้ายกลับไปยังตำแหน่งเดิมของมัน แต่ก็ยังไม่มีคำตอบว่าเซลล์รู้ได้อย่างไรว่าควรหยุดเมื่อไร
    • การเข้าใจการจัดระเบียบแบบไร้ลำดับชั้นเป็นเรื่องสำคัญต่อการเข้าใจว่าสังคมทำงานอย่างไร และยังสำคัญต่อการแก้ปัญหา prisoner’s dilemma ในหลายระดับขนาดด้วย
    • มันยังเกี่ยวกับการทำความเข้าใจและการสร้างแบบจำลองความซับซ้อนด้วย
    • เป็นครั้งแรกที่ฉันเห็นความสามารถในการสร้างแบบจำลองสิ่งแบบนี้ มันไปต่อได้อีกหลายทิศทาง น่าทึ่งมาก
  • ช่วงหลังมานี้ฉันคิดเรื่อง "สติปัญญา" มากขึ้นเรื่อย ๆ ดูเหมือนว่าเรากำลังอยู่ในช่วงหัวเลี้ยวหัวต่อสำคัญของการเข้าใจว่ามันทำงานอย่างไร สติปัญญาอาจเป็นพฤติกรรมที่เกิดขึ้นเองตามธรรมชาติ ซึ่งไม่ได้ต่างจากกลศาสตร์แบบนิวตันดั้งเดิมหรือไฟฟ้ามากนัก ท้ายที่สุดแล้วมันอาจสรุปลงมาเป็นกฎง่าย ๆ
    • ถ้าทุกอย่างที่ไม่เป็นดิสครีตในสมองเป็นเพียง "โครงสร้างพื้นฐาน" ล่ะ? ถ้ามันมีไว้เพื่อรองรับแกนกระบวนการสำคัญที่เรียบง่ายโดยพื้นฐาน แต่เป็นตัวที่ทำงานจริง? ถ้าทุกอย่างลงเอยที่ logic gates และสัญญาณไฟฟ้าล่ะ?
    • ช่วงเวลาที่น่าตื่นเต้นกำลังมาถึง
  • สิ่งเหล่านี้น่าดึงดูดมาก โดยเฉพาะในเรื่องความสามารถในการทำให้ทั่วไป แต่ภาพวิสัยทัศน์คืออะไร? ในอนาคตมันจะทำอะไรได้? ในเชิงปรัชญา มันจะสอนอะไรเราเกี่ยวกับโลก? ฉันรู้ว่า cellular automata แบบ 1D มีความเทียบเท่าทัวริงอยู่แล้ว ดังนั้น NCA/สิ่งเหล่านี้จึงไม่ได้ชวนประหลาดใจมากนัก
  • นี่คือการค้นพบระดับพลิกวงการ มันไม่ใช่เรื่องกระดานหมากรุกหรือตุ๊กแก สมการเชิงอนุพันธ์ Navier-Stokes คือกฎอัปเดตที่ควบคุมการเคลื่อนที่ของของไหล ความซับซ้อนทั้งหมด เช่น การก่อตัวของเมฆและการเคลื่อนไหวของเปลวไฟ ถูกกำกับด้วยกฎง่าย ๆ วิทยาศาสตร์คือการค้นพบสมการนี้ผ่านตัวอย่างจริง สามารถนำโมเดล DLCA ไปใช้กับการบันทึกวิดีโอควันเพื่ออนุมานสมการ Navier-Stokes ได้ และเมื่อพิจารณาว่ากฎอัปเดตเองก็อาจเปลี่ยนแปลงตามกฎอัปเดตอื่นได้ เราจะเข้าสู่พื้นที่ที่น่าสนใจมาก นี่อาจเป็นเหตุผลว่าทำไมเซลล์ประสาทในสมองจึงเชื่อมต่อกับเซลล์ประสาทอีกนับพันเซลล์
    • ผู้บริหาร Google คงจะมองข้ามการค้นพบนี้เพราะไม่เกี่ยวกับธุรกิจโฆษณาของพวกเขา อีกไม่กี่ปีเมื่อ DLCA พลิกโลก พวกเขาก็จะอ้างว่าพนักงานของตนเป็นผู้ค้นพบ
  • เป็นงานวิจัยที่น่าสนใจมาก มีคำถามหนึ่ง: เนื่องจากมันถูกอัปเดตโดยใช้ gradient descent แบบ "global" ดังนั้น cell gate จึงไม่ขนานแท้จริง
    • มีความเป็นไปได้ไหมสำหรับวิธีปรับน้ำหนักที่เป็น local อย่างเคร่งครัด?
  • การผ่อนคลายต่อเนื่องของพีชคณิตบูลีนเป็นแนวคิดเก่าแล้ว การสังเคราะห์วงจรเป็นสาขาที่มีการศึกษามาอย่างดี Google ชนะการแข่งขันไปเมื่อ 2 ปีก่อน อยากรู้ว่าได้ลองนำตัวเรียนรู้ไปใช้กับชุดข้อมูลของการแข่งขัน IWLS หรือไม่ ถ้าไม่ได้ทำ ทำไมถึงไม่ได้ทำ?
  • จะใช้กับ ARC-AGI challenge ได้ไหม? จะเอาไปผสานกับงานล่าสุดได้หรือเปล่า?
  • ขอโปรโมตตัวเองหน่อยแต่เกี่ยวข้อง => Robustness and halting of multicellular artificial development (2011)
    • cellular automata ที่มีกฎอัปเดตรวมกับ perceptrons และ isotropic diffusion น้ำหนักของโครงข่ายประสาทถูกปรับให้เหมาะสมเพื่อให้ cellular automata วาดภาพได้ มีความสามารถในการ self-healing (กล่าวคือ เมื่อถูกรบกวนก็จะสร้างภาพขึ้นมาใหม่)
    • ตอนนั้น automatic differentiation ยังเข้าถึงได้ไม่ง่ายเหมือนทุกวันนี้ จึงใช้ evolutionary strategies เพื่อปรับน้ำหนักให้เหมาะสม แน่นอนว่าการใช้ gradient descent น่าจะดีกว่ามาก