AlphaChip ปฏิวัติการออกแบบชิปคอมพิวเตอร์ได้อย่างไร

(deepmind.google)

7 คะแนน โดย GN⁺ 2024-09-29 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ในปี 2020 ได้เผยแพร่ preprint ที่นำเสนอวิธีการเสริมกำลังการเรียนรู้แบบใหม่สำหรับการออกแบบเลย์เอาต์ชิป
วิธีนี้ได้รับการตีพิมพ์ใน Nature ในเวลาต่อมา และเปิดเป็นโอเพนซอร์ส
วันนี้เราเผยแพร่ addendum ใน Nature ที่อธิบายวิธีนี้และผลกระทบที่มีต่อวงการออกแบบชิปอย่างละเอียด
เรายังเปิดเผย checkpoint ที่ผ่านการ pre-train แล้ว แบ่งปันน้ำหนักของโมเดล และประกาศชื่อ AlphaChip
ชิปคอมพิวเตอร์เป็นแรงขับเคลื่อนความก้าวหน้าอันน่าทึ่งของปัญญาประดิษฐ์ (AI) และ AlphaChip ใช้ AI เพื่อเร่งและปรับแต่งการออกแบบชิปให้เหมาะสม
วิธีนี้ถูกใช้ในการออกแบบเลย์เอาต์ชิประดับเหนือมนุษย์สำหรับ Tensor Processing Unit (TPU) ซึ่งเป็น AI accelerator แบบสั่งทำของ Google ใน 3 รุ่นล่าสุด
AlphaChip เป็นหนึ่งในแนวทาง reinforcement learning ชุดแรก ๆ ที่ถูกนำมาใช้แก้ปัญหาวิศวกรรมจริง
แทนที่จะต้องใช้แรงคนหลายสัปดาห์หรือหลายเดือน มันสามารถสร้างเลย์เอาต์ชิปที่มีคุณภาพระดับเหนือมนุษย์หรือใกล้เคียงได้ภายในไม่กี่ชั่วโมง และเลย์เอาต์เหล่านี้ถูกใช้กับชิปหลากหลายประเภท ตั้งแต่ดาต้าเซ็นเตอร์ทั่วโลกไปจนถึงโทรศัพท์มือถือ

AlphaChip ทำงานอย่างไร

การออกแบบเลย์เอาต์ชิปไม่ใช่งานที่เรียบง่าย
ชิปคอมพิวเตอร์ประกอบด้วยบล็อกจำนวนมากที่เชื่อมต่อถึงกัน พร้อมทั้งชั้นขององค์ประกอบวงจรและสายไฟที่บางมากซึ่งเชื่อมทุกอย่างเข้าด้วยกัน
ยังมีข้อจำกัดด้านการออกแบบที่ซับซ้อนและเชื่อมโยงกันจำนวนมากซึ่งต้องทำให้สอดคล้องกันพร้อมกัน
ด้วยความซับซ้อนนี้ นักออกแบบชิปจึงพยายามทำให้กระบวนการ floorplanning ของชิปเป็นอัตโนมัติมานานกว่า 60 ปีแต่ยังทำได้ยาก
คล้ายกับ AlphaGo และ AlphaZero เราสร้าง AlphaChip ให้เข้าหา chip floorplanning ราวกับเป็นเกมชนิดหนึ่ง
เริ่มจากกริดว่างเปล่า AlphaChip จะวางองค์ประกอบวงจรทีละชิ้น และทำซ้ำเช่นนี้จนกว่าจะวางองค์ประกอบทั้งหมดเสร็จ
จากนั้นมันจะได้รับรางวัลตามคุณภาพของเลย์เอาต์สุดท้าย
ด้วยกราฟนิวรัลเน็ตเวิร์กแบบ "edge-based" รูปแบบใหม่ AlphaChip สามารถเรียนรู้ความสัมพันธ์ระหว่างองค์ประกอบชิปที่เชื่อมต่อกัน และทำการ generalize ไปทั่วทั้งชิปได้ ทำให้มันพัฒนาได้ดีขึ้นในทุกเลย์เอาต์ที่ออกแบบ

ใช้ AI ออกแบบชิปเร่งความเร็ว AI ของ Google

นับตั้งแต่การประกาศในปี 2020 AlphaChip ได้สร้างเลย์เอาต์ชิประดับเหนือมนุษย์ที่ถูกใช้ใน TPU ของ Google ทุกเจเนอเรชัน
ชิปเหล่านี้ทำให้สามารถสร้างโมเดล AI ขนาดใหญ่ที่อิงบนสถาปัตยกรรม Transformer ของ Google ได้
TPU คือหัวใจของระบบ generative AI ทรงพลัง ตั้งแต่โมเดลภาษาขนาดใหญ่อย่าง Gemini ไปจนถึงเครื่องสร้างภาพและวิดีโออย่าง Imagen และ Veo
AI accelerator เหล่านี้ยังเป็นแกนหลักของบริการ AI ของ Google และเปิดให้ผู้ใช้ภายนอกใช้งานผ่าน Google Cloud
ในการออกแบบเลย์เอาต์ TPU นั้น AlphaChip จะเริ่มจากการฝึกกับบล็อกชิปหลากหลายประเภทจากรุ่นก่อน เช่น บล็อกเครือข่ายบนชิปและระหว่างชิป memory controller และ data transfer buffer (กระบวนการนี้เรียกว่า pre-training)
จากนั้นจึงรัน AlphaChip กับบล็อก TPU รุ่นปัจจุบันเพื่อสร้างเลย์เอาต์คุณภาพสูง
ต่างจากแนวทางก่อนหน้า AlphaChip จะเก่งขึ้นและเร็วขึ้นเมื่อมันได้แก้ปัญหางานวางองค์ประกอบชิปมากขึ้น คล้ายกับผู้เชี่ยวชาญมนุษย์
สำหรับ TPU แต่ละเจเนอเรชันใหม่ รวมถึง Trillium รุ่นล่าสุด (รุ่นที่ 6) AlphaChip ได้ออกแบบเลย์เอาต์ชิปที่ดีขึ้น และครอบคลุมสัดส่วนของ floorplan ทั้งหมดมากขึ้น ช่วยเร่งรอบการออกแบบและผลิตชิปสมรรถนะสูงขึ้น

ผลกระทบในวงกว้างของ AlphaChip

เราเห็นผลกระทบของ AlphaChip ได้ผ่านการใช้งานทั่วทั้ง Alphabet ชุมชนนักวิจัย และอุตสาหกรรมการออกแบบชิป
นอกเหนือจากการออกแบบ AI accelerator เฉพาะทางอย่าง TPU แล้ว AlphaChip ยังสร้างเลย์เอาต์ให้กับชิปอื่น ๆ ทั่วทั้ง Alphabet เช่น Axion โปรเซสเซอร์ Arm-based สำหรับดาต้าเซ็นเตอร์แบบใช้งานทั่วไปตัวแรกของ Google
องค์กรภายนอกก็นำ AlphaChip ไปใช้และต่อยอดเช่นกัน (ตัวอย่างเช่น MediaTek ซึ่งเป็นหนึ่งในบริษัทออกแบบชิปชั้นนำของโลก ได้ขยาย AlphaChip เพื่อปรับปรุงด้านพลังงาน ประสิทธิภาพ และพื้นที่ชิป พร้อมเร่งการพัฒนาชิปที่ล้ำหน้าที่สุดอย่าง Dimensity Flagship 5G ซึ่งใช้ในโทรศัพท์ Samsung)
AlphaChip ได้จุดชนวนให้เกิดการระเบิดของงานด้าน AI เพื่อการออกแบบชิป และได้ขยายไปสู่ขั้นตอนสำคัญอื่น ๆ ของการออกแบบชิป เช่น logic synthesis และ macro selection

การสร้างชิปแห่งอนาคต

เราเชื่อว่า AlphaChip มีศักยภาพในการเพิ่มประสิทธิภาพทุกขั้นตอนของวงจรการออกแบบชิป ตั้งแต่สถาปัตยกรรมคอมพิวเตอร์ไปจนถึงการผลิต
มันอาจปฏิวัติการออกแบบชิปสำหรับฮาร์ดแวร์สั่งทำที่พบได้ในอุปกรณ์ประจำวัน เช่น สมาร์ตโฟน อุปกรณ์ทางการแพทย์ และเซ็นเซอร์การเกษตร
AlphaChip เวอร์ชันในอนาคตกำลังอยู่ระหว่างการพัฒนา และเราหวังว่าจะได้ร่วมมือกับชุมชนเพื่อสร้างนวัตกรรมในสาขานี้ต่อไป และสร้างอนาคตที่ชิปเร็วขึ้น ถูกลง และประหยัดพลังงานมากขึ้น

ความเห็นของ GN⁺

แนวทางที่ขับเคลื่อนด้วย AI ของ AlphaChip กำลังปฏิวัติวงการออกแบบชิป โดยเฉพาะในด้านการทำให้กระบวนการออกแบบเลย์เอาต์ชิปเป็นอัตโนมัติ ซึ่งมีความก้าวหน้าอย่างมาก
AlphaChip เป็นหนึ่งในตัวอย่างยุคแรกของการนำ reinforcement learning มาใช้กับปัญหาวิศวกรรมจริง และเป็นตัวอย่างที่ดีว่า AI สามารถถูกนำไปใช้ในโลกจริงได้อย่างไร
ผลกระทบของ AlphaChip ต่อการออกแบบ TPU จะเป็นหมุดหมายสำคัญของความก้าวหน้าในฮาร์ดแวร์ AI accelerator AI accelerator ที่ดีกว่าจะทำให้เกิดโมเดล AI ที่ทรงพลังยิ่งขึ้น และสิ่งนั้นก็จะยิ่งเร่งความก้าวหน้าของ AI ต่อไปอีก
อย่างไรก็ตาม การพึ่งพาเครื่องมือออกแบบด้วย AI มากเกินไปอาจนำไปสู่การสูญเสียความเชี่ยวชาญของนักออกแบบมนุษย์ ในระยะยาว ความร่วมมือระหว่าง AI กับผู้เชี่ยวชาญมนุษย์น่าจะเป็นแนวทางที่เหมาะสมที่สุด
เครื่องมือออกแบบที่ขับเคลื่อนด้วย AI ที่คล้ายกัน ได้แก่ Cerebus ของ Cadence และ DSO.ai ของ Synopsys เป็นต้น ในอนาคตการแข่งขันระหว่างเครื่องมือออกแบบอัตโนมัติที่ขับเคลื่อนด้วย AI น่าจะรุนแรงขึ้น

1 ความคิดเห็น

GN⁺ 2024-09-29

ความคิดเห็นจาก Hacker News

บทความใน Nature ของ Google ถูกวิจารณ์จากนักวิจัยในวงการ EDA CAD
- บทความโต้แย้งจากนักวิจัยภายใน Google: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
- บทความ ISPD ปี 2023 จากทีมวิจัย UCSD: "Assessment of Reinforcement Learning for Macro Placement"
- บทความวิจารณ์ของ Igor Markov: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
อัลกอริทึม RL สำหรับการวาง macro ของ Google ไม่ได้ถูกเปรียบเทียบอย่างยุติธรรมกับอัลกอริทึมสมัยใหม่อื่น ๆ
- มีการอ้างว่าทำการวาง macro ได้ดีกว่ามนุษย์ แต่ก็ยังไม่ถึงระดับประสิทธิภาพของอัลกอริทึมการวางแบบผสมในปัจจุบัน
- เทคโนโลยี RL ต้องใช้ทรัพยากรคอมพิวต์มากกว่าอัลกอริทึมอื่น ๆ และไม่ได้เรียนรู้การแทนปัญหาการวางแบบใหม่ตัวปัญหาเอง แต่เรียนรู้ฟังก์ชันตัวแทนแทน
มีความสงสัยต่อผลงานของ Google และได้เขียนโพสต์อธิบายโดยละเอียดไว้บนเว็บไซต์ส่วนตัว
มีกรณีที่นักวิจัยของ Google ถูกคุกคามจนย้ายไป Anthropic
- บทความที่เกี่ยวข้อง: "Google Brain AI Researcher Fired Tension"
TSMC เน้นย้ำว่าซอฟต์แวร์อัตโนมัติสำหรับการออกแบบชิปรุ่นใหม่ล่าสุดสามารถเลือกการออกแบบลอจิกสำหรับ TDP ได้
- สิ่งนี้อาจเป็นวิธีในการคงไว้ซึ่ง Dennard scaling
- ความเร็วแสงและความใกล้ทางกายภาพยังคงสำคัญ แต่ก็สงสัยว่าการหลีกเลี่ยง thermal throttling จะให้ประโยชน์ได้มากเพียงใด
มีคำถามเกี่ยวกับวิธีวัดคุณภาพของการออกแบบชิป
- สงสัยว่าเมตริกที่ Google รายงานนั้นสมเหตุสมผลจริงหรือไม่ หรือเป็นเพียงการทำให้ตัวเองดูดี
- "คุณภาพ" ของการออกแบบชิปมีหลายมิติและขึ้นอยู่กับกรณีการใช้งานอย่างมาก
- ชิปสำหรับดาต้าเซ็นเตอร์กับชิปสำหรับกล้องมือถือหรือรถยนต์ย่อมมีหน้าตาแตกต่างกันมาก
- สงสัยว่าในปัญหา/งานเฉพาะนี้ คำว่า "ดีกว่า" หมายถึงอะไรกันแน่
Eurisco เคยถูกใช้ทำงานด้าน placement และ routing และทำได้ดีมาก
- Eurisco ถูกใช้ในการออกแบบกองยานอวกาศรบในเกม Traveler TCS
- Eurisco ใช้การจัดวางแบบอิงสมมาตรที่เรียนรู้มาจากการออกแบบ VLSI
- สงสัยว่า heuristic ของ AlphaChip จะนำไปใช้ที่อื่นได้หรือไม่
งานด้านการออกแบบชิปของ Google เป็นเรื่องที่ "มีข้อถกเถียง"
- สงสัยว่าทำไมถึงทำแค่ PR โดยไม่ได้ทำสิ่งใหม่
มีปัญหาที่บทความ DeepX จำนวนมากถูกส่งไป Nature แทนที่จะเป็นเวที CS ที่เหมาะสม
- ถ้าทำงานด้านการออกแบบชิปได้ดีกว่าจริง ก็ควรส่งไปที่ IPSD หรือ ISCA เป็นต้น
- ไม่เข้าใจว่า Nature จัดการบทความแบบนี้อย่างไร
สงสัยว่าทำไมยังคงใช้คำว่า "เหนือมนุษย์" อยู่เรื่อย ๆ
- งานลักษณะนี้ใช้อัลกอริทึมทำอยู่แล้ว และมนุษย์ก็ไม่ได้มานั่งวางทรานซิสเตอร์นับล้านล้านตัวด้วยมือ
อยากให้มีเครื่องมือสำหรับการออกแบบ/จัดวาง PCB
สงสัยว่าการประมวลผลแบบอิงหน่วยความจำใกล้จะเปลี่ยนจากงานวิจัยไปเป็นผลิตภัณฑ์ที่แข่งขันได้มากน้อยแค่ไหน
- คิดว่าอาจถึงเวลาที่ควรลงทุนอย่างจริงจังเพื่อขยายการทดลองอย่าง memristor ไปสู่ระดับใหญ่
- กำลังมีการถกกันว่าจะต้องมีเครื่องปฏิกรณ์ใหม่กี่เครื่องสำหรับ AI data center

AlphaChip ปฏิวัติการออกแบบชิปคอมพิวเตอร์ได้อย่างไร

AlphaChip ทำงานอย่างไร

ใช้ AI ออกแบบชิปเร่งความเร็ว AI ของ Google

ผลกระทบในวงกว้างของ AlphaChip

การสร้างชิปแห่งอนาคต

ความเห็นของ GN⁺

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News