วิธีประหยัดพลังงานของนักวิจัย AI: ย้อนกลับไปด้วยแนวทางแบบกรอถอยหลัง

(quantamagazine.org)

4 คะแนน โดย GN⁺ 2025-06-05 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

การคำนวณแบบกรอถอยหลัง (reversible computing) เป็นแนวทางเชิงทฤษฎีที่รันการคำนวณย้อนทิศทางเพื่อ ประหยัดพลังงานโดยไม่ต้องลบข้อมูล และกำลังถูกจับตาในฐานะทางเลือกสำหรับแก้ปัญหาการใช้พลังงานของ AI
คอมพิวเตอร์แบบเดิมจะ ปล่อยความร้อน (พลังงาน) ออกมาอย่างหลีกเลี่ยงไม่ได้เมื่อมีการลบข้อมูล ซึ่งไม่อาจหลีกเลี่ยงได้เพราะข้อจำกัดทางฟิสิกส์ (หลักการของ Landauer)
แนวคิด Uncomputation คือเก็บไว้เฉพาะผลลัพธ์ของการคำนวณ แล้วทำส่วนที่เหลือ ย้อนกระบวนการคำนวณกลับ เพื่อประมวลผลโดยไม่สูญเสียข้อมูล แต่ยังมีข้อจำกัดเชิงปฏิบัติ เช่น ความเร็วและต้นทุนหน่วยความจำ
ล่าสุดมีการพิสูจน์เชิงประจักษ์ว่า ในงานอย่าง AI ที่มีการประมวลผลแบบขนานจำนวนมาก หากใช้งานชิป reversible หลายตัวที่ทำงานช้าลง จะให้ ผลด้านการประหยัดพลังงานสูง
ภาคอุตสาหกรรมและนักวิจัย กำลังเริ่มพัฒนาชิป reversible เชิงพาณิชย์จริง ทำให้ความเป็นไปได้ของ นวัตกรรมด้านประสิทธิภาพพลังงานของ AI เข้าใกล้ความจริงมากขึ้น

การสูญเสียพลังงานพื้นฐานของการคำนวณคอมพิวเตอร์

เมื่อคอมพิวเตอร์บวกเลขสองจำนวน เช่น 2 + 2 = 4 จะเหลือไว้เพียง เอาต์พุตหนึ่งค่า จาก อินพุตสองค่า
ข้อมูลบางส่วนจึงหายไป ทำให้การคำนวณมีลักษณะ ไม่ผันกลับได้ และข้อมูลที่ถูกลบนี้จะเปลี่ยนเป็น พลังงานความร้อน
คอมพิวเตอร์ส่วนใหญ่ทำงานด้วยวิธีนี้ จึงหลีกเลี่ยงไม่ได้ที่จะมี การสูญเสียข้อมูล (และเกิดความร้อน) อยู่เสมอในระดับพื้นฐาน

ข้อเสนอเรื่องการคำนวณแบบผันกลับได้ของ Landauer และข้อจำกัด

Landauer เสนอแนวคิดเรื่อง การคำนวณที่ลดการสูญเสียพลังงาน ด้วยการบันทึกผลของทุกการคำนวณไว้โดยไม่ลบข้อมูล
แต่คอมพิวเตอร์ลักษณะนี้มีปัญหาเรื่อง หน่วยความจำเต็มอย่างรวดเร็วในโลกความเป็นจริง จึงขาด ความสามารถในการใช้งานจริง
ท้ายที่สุด Landauer จึงมองว่า การคำนวณแบบผันกลับได้ เป็นทางตัน

ไอเดีย uncomputation (การคำนวณย้อนกลับ) ของ Bennett

ในปี 1973 Charles Bennett แห่ง IBM เสนอวิธีเก็บไว้เฉพาะผลลัพธ์ของการคำนวณ แล้วลบส่วนที่เหลือด้วยการ รันกระบวนการคำนวณย้อนกลับ (uncomputation)
เปรียบได้กับ Hansel และ Gretel ที่เก็บเศษขนมปังกลับคืน คือสามารถ เก็บไว้เฉพาะข้อมูลที่จำเป็น และกำจัดส่วนอื่นโดยไม่สูญเสียข้อมูล
วิธีนี้มีข้อเสียคือ ใช้เวลาคำนวณเพิ่มเป็น 2 เท่า จึงถูกมองว่าไม่มีประสิทธิภาพ

งานวิจัยที่ทำให้ใช้งานได้จริงมากขึ้น

ในปี 1989 Bennett แสดงให้เห็นว่า หากใช้ หน่วยความจำ เพิ่มขึ้นเล็กน้อย ก็สามารถลดเวลาคำนวณลงได้มาก
หลังจากนั้นนักวิจัยก็ศึกษาวิธี ปรับสมดุลหน่วยความจำและเวลา อย่างต่อเนื่อง
อย่างไรก็ตาม คอมพิวเตอร์ไม่ได้สูญเสียพลังงานเพียงจากการลบข้อมูลเท่านั้น แต่ยังสูญเสียจาก ความไม่มีประสิทธิภาพของโครงสร้างการเชื่อมต่อทรานซิสเตอร์ เองด้วย
หากต้องการสร้าง คอมพิวเตอร์แบบผันกลับได้ที่ประหยัดพลังงานจริง ก็จำเป็นต้องมีโครงสร้างที่ ลดการสูญเสียความร้อน ตั้งแต่ขั้นตอนการออกแบบ

ชิปต้นแบบของ MIT และปฏิกิริยาจากอุตสาหกรรม

ในช่วงทศวรรษ 1990 วิศวกรของ MIT ได้สร้าง ชิปต้นแบบ ที่เพิ่มประสิทธิภาพของวงจร
Frank เข้าร่วมในฐานะนักศึกษาปริญญาเอก และต่อมากลายเป็นนักวิชาการคนสำคัญของ reversible computing
แต่ในบริบทที่ประสิทธิภาพของชิปแบบเดิมพัฒนาอย่างรวดเร็ว ภาคอุตสาหกรรมกลับ ไม่สนใจทางเลือกเชิงทฤษฎีนี้มากนัก ทำให้การสนับสนุนมีอย่างจำกัด
Frank เองก็เคยหยุดงานวิจัยนี้ไปช่วงหนึ่งเพื่อหาทางอื่น
อย่างไรก็ตาม เมื่อ การย่อส่วนวงจรเข้าใกล้ขีดจำกัด ความสนใจต่อปัญหาประสิทธิภาพพลังงานก็เพิ่มสูงขึ้นอย่างมาก

ประสิทธิภาพด้านพลังงานของ reversible computing และความเป็นไปได้ในการใช้กับ AI

ในปี 2022 Hannah Earley จาก Cambridge ได้วิเคราะห์ ประสิทธิภาพด้านพลังงานของคอมพิวเตอร์แบบผันกลับได้ อย่างละเอียด
คอมพิวเตอร์แบบผันกลับได้ปล่อย ความร้อนน้อยกว่า แบบเดิม แต่ก็ ไม่อาจไร้ความร้อนได้อย่างสมบูรณ์
โดยเฉพาะอย่างยิ่ง พบว่าเมื่อคอมพิวเตอร์แบบผันกลับได้ ทำงานช้าลง การปล่อยความร้อนก็จะลดลง
งานคำนวณของ AI เป็นงานใน สภาพแวดล้อมการประมวลผลแบบขนาน ดังนั้นยิ่งให้แต่ละชิปทำงานช้าลงและเพิ่มจำนวนชิป ก็ยิ่งคาดหวังได้ถึง การลดการใช้พลังงานรวม
ความเร็วที่ช้าลงยังช่วยลดต้นทุนการระบายความร้อน ทำให้มีโอกาส วางชิปได้หนาแน่นขึ้น และประหยัดพื้นที่กับวัสดุ ด้วย

ความเคลื่อนไหวสู่เชิงพาณิชย์และแนวโน้ม

เมื่อนักลงทุนเริ่มให้ความสนใจ Earley และ Frank จึงร่วมก่อตั้ง Vaire Computing และเริ่มพัฒนา ชิป reversible เชิงพาณิชย์
Mogensen แห่งมหาวิทยาลัยโคเปนเฮเกนและคนอื่น ๆ แสดงความคาดหวังอย่างมากว่าโปรเซสเซอร์แบบผันกลับได้จะถูกนำไปใช้ในงานจริง
สถานการณ์ในตอนนี้คือ reversible computing ซึ่งอยู่ในระดับทฤษฎีมานานหลายทศวรรษ กำลังถูกจับตาว่าจะสร้างนวัตกรรมที่จับต้องได้ในด้าน AI และประสิทธิภาพพลังงานได้หรือไม่

บทสรุป

reversible computing เป็นแนวทางที่ใช้งานได้จริงในการก้าวข้ามข้อจำกัดทางฟิสิกส์ของคอมพิวเตอร์ที่ก่อให้เกิดความร้อนเมื่อมีการลบข้อมูล และกำลังได้รับความสนใจในฐานะเทคโนโลยีลดพลังงานขนาดใหญ่สำหรับยุค AI
แนวทางการใช้งานชิปแบบช้าแต่ขนานจำนวนมาก กำลัง สอดคล้องกับลักษณะเชิงโครงสร้างของงานคำนวณ AI จนทำให้การนำไปใช้เชิงพาณิชย์เข้าใกล้มากขึ้น

1 ความคิดเห็น

GN⁺ 2025-06-05

ความคิดเห็นจาก Hacker News

ในนวนิยาย Time ของ Stephen Baxter มีพล็อตว่าในอนาคตอันไกลโพ้น หลังจากดาวทุกดวงดับสูญและหลุมดำทั้งหมดระเหยไปแล้ว ลูกหลานของมนุษยชาติยังคงอยู่ในจักรวาลที่มีเอนโทรปีสูงสุด ในสภาวะที่พลังงานอิสระถูกใช้หมดสิ้นแล้ว ลูกหลานเหล่านี้ดำรงอยู่ด้วยการทำซ้ำเหตุการณ์เดิมภายในซิมูเลชันขนาดมหึมา โดยใช้เฉพาะการคำนวณแบบผันกลับได้เท่านั้น (ทำงานได้โดยไม่ใช้พลังงาน) วนลูปเหตุการณ์เดิมซ้ำ ๆ ด้วยการ uncompute ผลการคำนวณแล้ว compute ใหม่
ในมุมของวิศวกรซอฟต์แวร์ มีการพูดถึงว่าประเด็นนี้เข้าใจได้ไม่ง่ายนัก รู้สึกสับสนเมื่อเจอแนวคิดที่ว่าการลบข้อมูลทำให้อิเล็กตรอนสูญหาย อิเล็กตรอนเหมือนจะสูญหายอยู่ทุกแห่งอยู่แล้ว และเกตส่วนใหญ่ก็ทำงานผ่านการปฏิเสธกระแสไฟ จึงตั้งคำถามว่าการกระทำเหล่านี้ล้วนเป็นเรื่องไม่ดีทั้งหมดหรือไม่ สงสัยว่าทำไมการบันทึกการเปลี่ยนแปลงของหน่วยความจำทั้งหมดจึงช่วยป้องกันการสูญเสียความร้อน และกังวลว่าการต้องเก็บหน่วยความจำทั้งหมดไว้ตลอดเวลาจะยิ่งใช้พลังงานมากขึ้นหรือไม่ รวมถึงตั้งข้อสงสัยเชิงปฏิบัติว่าทำไมในการคำนวณจึงจำเป็นต้องย้อนกลับไปสู่อดีตด้วย
- ในทางทฤษฎี คอมพิวเตอร์ที่ไม่ลืมข้อมูลสามารถใช้พลังงานได้น้อยมาก จึงเป็นไปได้ที่จะสร้างคอมพิวเตอร์ที่แทบไม่ปล่อยความร้อน คอมพิวเตอร์ชนิดนี้คือการคำนวณแบบผันกลับได้ (adiabatic computing) ซึ่งเกตคำนวณทั้งหมดต้องย้อนกลับได้ อย่างไรก็ตาม ขั้นตอนต้นทางมาก ๆ และปลายทาง เช่น การตั้งค่าสถานะอินพุตและการคัดลอกเอาต์พุต ก็ยังต้องใช้พลังงาน ในโลกจริง การใช้พลังงานส่วนใหญ่ไม่ได้สูญเสียไปเพราะการ "ลบ" ข้อมูลในลอจิกเกต แต่เสียไปกับเรื่องอย่างความต้านทานของสายสัญญาณ หากจะสร้าง CPU แบบผันกลับได้อย่างสมบูรณ์ก็ต้องใช้ฮาร์ดแวร์พิเศษ เช่น สายและอุปกรณ์ตัวนำยิ่งยวด และยังต้องสามารถย้อนการคำนวณได้ด้วย ซึ่งก็ไม่ใช่ปัญหาง่าย ๆ หรือไม่เช่นนั้นก็ต้องยอมลบสถานะและรับการใช้พลังงานนั้นไป ตัวอย่างในโลกจริงคือคอมพิวเตอร์ควอนตัม ซึ่งเกตลอจิกควอนตัมสามารถผันกลับได้ทุกการคำนวณและทำงานย้อนทิศได้
- ในมุมของอุณหพลศาสตร์ กระบวนการที่ผันกลับได้มีประสิทธิภาพสูงสุดในทางทฤษฎี ซึ่งเกี่ยวข้องกับเอนโทรปี หากลบข้อมูลก็จะไม่เป็นกระบวนการผันกลับได้อีกต่อไป จึงหลีกเลี่ยงการเกิดความร้อนไม่ได้ อย่างไรก็ตาม ทั้งหมดนี้เป็นเรื่องเชิงทฤษฎีอย่างมาก และคอมพิวเตอร์จริงในปัจจุบันยังห่างไกลจากขีดจำกัดนี้มาก อุปกรณ์ลอจิกจริงส่วนใหญ่ เช่น AND, OR, NAND เมื่อตัดขาดจากบริบทแล้วล้วนมีโครงสร้างการคำนวณที่ไม่ผันกลับได้
- มีการชี้ว่าอุปกรณ์จัดเก็บถาวรอย่างฮาร์ดดิสก์และ SSD ไม่ใช้พลังงานเลยในการคงข้อมูลไว้ ดังนั้นจึงไม่เกิดความร้อน แต่เมื่อต้องลบหรือเขียนทับข้อมูลก็จำเป็นต้องใช้พลังงานอย่างหลีกเลี่ยงไม่ได้ และทำให้เกิดความร้อนมาก ปัญหาการระบายความร้อนเป็นอุปสรรคต่อการย่อขนาดชิปให้เล็กลงยิ่งกว่าเดิม หากออกแบบคอมพิวเตอร์ที่ไม่ลบข้อมูลได้ ก็จะลดความร้อนได้มาก ทำให้ประสิทธิภาพชิปสูงขึ้น ประหยัดพลังงาน และเปิดโอกาสต่อการสเกล
ค่อนข้างสงสัยกับแรงจูงใจเรื่องการประหยัดพลังงาน แต่การสร้างสถาปัตยกรรม deep learning แบบผันกลับได้เองก็เป็นหัวข้อวิจัยที่น่าสนใจมาก มีการถกเถียงกันอย่างคึกคักจริงในช่วงปี 2019~2021 เช่นใน ชุดเวิร์กช็อป invertibleworkshop โมเดล diffusion ที่กำลังได้รับความนิยมในช่วงหลังก็อาจมองได้ว่าเป็นกรณีพิเศษของ continuous normalizing flow จึงในทางทฤษฎีสามารถคำนวณแบบผันกลับได้ แต่คิดว่าโมเดลที่ถูก distill แล้วซึ่งใช้ใน production แทบทั้งหมดไม่เป็นเช่นนั้น การจำลองสมการเชิงอนุพันธ์ก็เช่นกัน เพราะข้อผิดพลาดจากการปัดเศษของ floating point ทำให้การคำนวณย้อนกลับไม่ตรงกันอย่างแม่นยำในทางปฏิบัติ แต่ถ้าออกแบบอย่างประณีตก็สามารถทำ ซิมูเลชันที่ผันกลับได้อย่างสมบูรณ์ระดับ bit-to-bit ได้เช่นกัน
- ยังมีงานวิจัยปี 2015ที่มีประโยชน์ในกรณีที่สามารถย้อนการคำนวณได้อย่างแม่นยำในงาน machine learning
มีการครุ่นคิดว่าการที่การคำนวณมีทิศทางหมายความว่าอย่างไร ดูคล้ายความเป็นเหตุเป็นผล แต่จริง ๆ แล้วน่าจะเป็นเรื่องของอินพุตและเอาต์พุต สุดท้ายก็ดูเหมือนว่าจะต้องลองรันโปรแกรมก่อนจึงจะรู้ และถ้าเก็บสถานะไว้ ก็ดูแค่ทำให้ backtracking ง่ายขึ้นเท่านั้น
- ใช่ แต่สิ่งนี้พูดกันในระดับกายภาพ จึงต้องมีฮาร์ดแวร์เฉพาะ การลบข้อมูล (เช่น การคำนวณ AND) ทำให้เกิดความร้อน จึงต้องใช้ลอจิกเกตอีกแบบ เช่น Fredkin gate
- ที่จริงแล้วการคำนวณทุกอย่างมีทิศทาง มีคนหนึ่งบอกว่าสนใจหัวข้อนี้มาก ตัวอย่างเช่น ฟังก์ชัน f(x) -> y เองก็ชี้ทิศทางอยู่แล้ว แน่นอนว่าถ้าย้อนกลับได้ก็คงดี แต่ก็มีกรณีที่ผกผันกลับไม่ได้เสมอ เช่น f(x)=mx+b หาอินเวอร์สได้ง่าย (ตราบใดที่ m≠0) แต่ f(x)=x^2 นั้น เมื่อพยายามกู้ค่า x จาก f(x) จะได้ทั้ง ±x จึงไม่เป็นเอกลักษณ์ สามารถอธิบายด้วยแนวคิดเรื่อง image และ preimage ของฟังก์ชันได้ และเรื่องนี้ยังเกี่ยวข้องใกล้ชิดกับปัญหา P=NP อีกด้วย ใน machine learning นั้น Normalizing Flow เป็นแบบ invertible, diffusion model เป็นโครงสร้าง reversible และยังมี GAN-Inversion ผู้แสดงความเห็นรายนี้ไม่ค่อยชอบที่ชุมชน ML ใช้คำว่า "inverse problem" การเข้าใจแนวคิดนี้จะทำให้เห็นว่าเหตุใดการพยากรณ์จึงแม่นได้เพียงทิศทางเดียวแต่ย้อนกลับแล้วล้มเหลว สุดท้ายมันพาไปสู่ปัญหา causal inference ในฟิสิกส์ เป้าหมายสำคัญคือการดัดแปลงสมการเพื่อสร้างแผนที่เชิงเหตุ แต่ก็มีปัญหาเฉพาะตัวจากเอนโทรปีและกลศาสตร์ควอนตัม ตัวอย่างเช่น เมื่อลองคำนวณย้อนสถานะของโมเลกุลก๊าซ ก็อาจได้หลายสถานะที่ไม่ใช่คำตอบเดียว เช่นเดียวกับตัวอย่างแคลคูลัส การ differentiation ไม่ผันกลับได้ เพราะ f(x)+C ล้วนให้ค่าอนุพันธ์เดียวกัน นั่นคือมีการสูญเสียข้อมูลในทิศทางเดียว แต่หากสุ่มเก็บสถานะจากหลายช่วงเวลา พื้นที่ของคำตอบก็อาจแคบลงอย่างมาก
- โดยสรุปแล้ว หากลดการคำนวณแบบไม่ผันกลับได้ (การลบข้อมูล) ให้เหลือน้อยที่สุด ก็จะทำให้การคำนวณแบบผันกลับได้เป็นไปได้ ตัวอย่าง: 2 + 2 + 2 หากบันทึกทุกขั้นตอนของการคำนวณไว้ทั้งหมด ก็ผันกลับได้ แต่ถ้าเก็บไว้แค่ผลลัพธ์สุดท้ายและลบประวัติทิ้งไป (เหลือเพียง 6) ก็จะไม่ผันกลับได้
มีคนบอกว่าติดตาม Mike P Frank บน Twitter มาตลอด และมักได้เห็นความเห็นที่น่าสนใจเกี่ยวกับ reversible computing และ AI MikePFrank บน Twitter
คาดหวังว่าเทคโนโลยีนี้อาจมีประโยชน์เมื่อกระแสซอฟต์แวร์บนฐาน GPU datacenter หวนกลับมาอีกครั้ง แต่ก็มองว่าเหมือน Jevons Paradox (เมื่อประสิทธิภาพดีขึ้น ความต้องการกลับเพิ่มขึ้นจนประหยัดพลังงานจริงไม่ได้) สุดท้ายอาจไม่ใช่จุดเปลี่ยนอยู่ดี
อยากรู้ว่าแผนที่เป็นรูปธรรมคืออะไร และเคยมีกรณีสาธิต reversible matmul จริงหรือไม่ แม้แต่การคำนวณนั้นเองก็ดูเลี่ยงการลบข้อมูลระหว่างทางได้ยาก จึงสงสัยในความเป็นจริงได้มากน้อยแค่ไหน
- สำหรับเมทริกซ์แบบผันกลับได้ reversible matmul ก็มีอยู่ แต่ใช้ไม่ได้กับตัวดำเนินการที่ไม่ผันกลับได้อย่าง ReLU และก็ยังไม่ค่อยเข้าใจเหมือนกันว่าตามที่บทความอ้าง เพียงแค่คำนวณย้อนกลับแล้วจะใช้พลังงานน้อยลงได้อย่างไร
มีคนเล่าว่าพอเห็นพาดหัวบทความนี้ก็รู้สึกถึงความย้อนแย้ง เพราะหน้าเว็บนั้นใช้เวลาโหลดถึง 12 วินาทีแม้บนคอมพิวเตอร์สมัยใหม่ ผู้คนมักไม่ค่อยสนใจปัญหาของคนอื่น และเมื่อมีเทคโนโลยีใหม่เกิดขึ้น (เช่น AI) ต้นทุนทางสังคมอย่างสิ่งแวดล้อม งานของปัจเจก โครงสร้างพื้นฐาน การละเมิดลิขสิทธิ์ และระบบสังคม มักถูกผลักออกไปเป็นภาระภายนอก เมื่อได้ประสิทธิภาพเพิ่มขึ้น สุดท้ายก็มักใช้เพื่อตัวเองมากขึ้น ไม่ได้ลดความเสียหายที่มอบให้ผู้อื่น เป็นมุมมองที่ค่อนข้างขมขื่น
มีการยืนยันมาหลายครั้งแล้วว่า ต่อให้ใช้ LLM หลายรอบ ปริมาณไฟฟ้าที่ใช้ก็ยังน้อยกว่าการต้มน้ำด้วยกาต้มน้ำไฟฟ้า

วิธีประหยัดพลังงานของนักวิจัย AI: ย้อนกลับไปด้วยแนวทางแบบกรอถอยหลัง

การสูญเสียพลังงานพื้นฐานของการคำนวณคอมพิวเตอร์

ข้อเสนอเรื่องการคำนวณแบบผันกลับได้ของ Landauer และข้อจำกัด

ไอเดีย uncomputation (การคำนวณย้อนกลับ) ของ Bennett

งานวิจัยที่ทำให้ใช้งานได้จริงมากขึ้น

ชิปต้นแบบของ MIT และปฏิกิริยาจากอุตสาหกรรม

ประสิทธิภาพด้านพลังงานของ reversible computing และความเป็นไปได้ในการใช้กับ AI

ความเคลื่อนไหวสู่เชิงพาณิชย์และแนวโน้ม

บทสรุป

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News