7 คะแนน โดย GN⁺ 2024-09-29 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ในปี 2020 ได้เผยแพร่ preprint ที่นำเสนอวิธีการเสริมกำลังการเรียนรู้แบบใหม่สำหรับการออกแบบเลย์เอาต์ชิป
  • วิธีนี้ได้รับการตีพิมพ์ใน Nature ในเวลาต่อมา และเปิดเป็นโอเพนซอร์ส
  • วันนี้เราเผยแพร่ addendum ใน Nature ที่อธิบายวิธีนี้และผลกระทบที่มีต่อวงการออกแบบชิปอย่างละเอียด
  • เรายังเปิดเผย checkpoint ที่ผ่านการ pre-train แล้ว แบ่งปันน้ำหนักของโมเดล และประกาศชื่อ AlphaChip
  • ชิปคอมพิวเตอร์เป็นแรงขับเคลื่อนความก้าวหน้าอันน่าทึ่งของปัญญาประดิษฐ์ (AI) และ AlphaChip ใช้ AI เพื่อเร่งและปรับแต่งการออกแบบชิปให้เหมาะสม
  • วิธีนี้ถูกใช้ในการออกแบบเลย์เอาต์ชิประดับเหนือมนุษย์สำหรับ Tensor Processing Unit (TPU) ซึ่งเป็น AI accelerator แบบสั่งทำของ Google ใน 3 รุ่นล่าสุด
  • AlphaChip เป็นหนึ่งในแนวทาง reinforcement learning ชุดแรก ๆ ที่ถูกนำมาใช้แก้ปัญหาวิศวกรรมจริง
  • แทนที่จะต้องใช้แรงคนหลายสัปดาห์หรือหลายเดือน มันสามารถสร้างเลย์เอาต์ชิปที่มีคุณภาพระดับเหนือมนุษย์หรือใกล้เคียงได้ภายในไม่กี่ชั่วโมง และเลย์เอาต์เหล่านี้ถูกใช้กับชิปหลากหลายประเภท ตั้งแต่ดาต้าเซ็นเตอร์ทั่วโลกไปจนถึงโทรศัพท์มือถือ

AlphaChip ทำงานอย่างไร

  • การออกแบบเลย์เอาต์ชิปไม่ใช่งานที่เรียบง่าย
  • ชิปคอมพิวเตอร์ประกอบด้วยบล็อกจำนวนมากที่เชื่อมต่อถึงกัน พร้อมทั้งชั้นขององค์ประกอบวงจรและสายไฟที่บางมากซึ่งเชื่อมทุกอย่างเข้าด้วยกัน
  • ยังมีข้อจำกัดด้านการออกแบบที่ซับซ้อนและเชื่อมโยงกันจำนวนมากซึ่งต้องทำให้สอดคล้องกันพร้อมกัน
  • ด้วยความซับซ้อนนี้ นักออกแบบชิปจึงพยายามทำให้กระบวนการ floorplanning ของชิปเป็นอัตโนมัติมานานกว่า 60 ปีแต่ยังทำได้ยาก
  • คล้ายกับ AlphaGo และ AlphaZero เราสร้าง AlphaChip ให้เข้าหา chip floorplanning ราวกับเป็นเกมชนิดหนึ่ง
  • เริ่มจากกริดว่างเปล่า AlphaChip จะวางองค์ประกอบวงจรทีละชิ้น และทำซ้ำเช่นนี้จนกว่าจะวางองค์ประกอบทั้งหมดเสร็จ
  • จากนั้นมันจะได้รับรางวัลตามคุณภาพของเลย์เอาต์สุดท้าย
  • ด้วยกราฟนิวรัลเน็ตเวิร์กแบบ "edge-based" รูปแบบใหม่ AlphaChip สามารถเรียนรู้ความสัมพันธ์ระหว่างองค์ประกอบชิปที่เชื่อมต่อกัน และทำการ generalize ไปทั่วทั้งชิปได้ ทำให้มันพัฒนาได้ดีขึ้นในทุกเลย์เอาต์ที่ออกแบบ

ใช้ AI ออกแบบชิปเร่งความเร็ว AI ของ Google

  • นับตั้งแต่การประกาศในปี 2020 AlphaChip ได้สร้างเลย์เอาต์ชิประดับเหนือมนุษย์ที่ถูกใช้ใน TPU ของ Google ทุกเจเนอเรชัน
  • ชิปเหล่านี้ทำให้สามารถสร้างโมเดล AI ขนาดใหญ่ที่อิงบนสถาปัตยกรรม Transformer ของ Google ได้
  • TPU คือหัวใจของระบบ generative AI ทรงพลัง ตั้งแต่โมเดลภาษาขนาดใหญ่อย่าง Gemini ไปจนถึงเครื่องสร้างภาพและวิดีโออย่าง Imagen และ Veo
  • AI accelerator เหล่านี้ยังเป็นแกนหลักของบริการ AI ของ Google และเปิดให้ผู้ใช้ภายนอกใช้งานผ่าน Google Cloud
  • ในการออกแบบเลย์เอาต์ TPU นั้น AlphaChip จะเริ่มจากการฝึกกับบล็อกชิปหลากหลายประเภทจากรุ่นก่อน เช่น บล็อกเครือข่ายบนชิปและระหว่างชิป memory controller และ data transfer buffer (กระบวนการนี้เรียกว่า pre-training)
  • จากนั้นจึงรัน AlphaChip กับบล็อก TPU รุ่นปัจจุบันเพื่อสร้างเลย์เอาต์คุณภาพสูง
  • ต่างจากแนวทางก่อนหน้า AlphaChip จะเก่งขึ้นและเร็วขึ้นเมื่อมันได้แก้ปัญหางานวางองค์ประกอบชิปมากขึ้น คล้ายกับผู้เชี่ยวชาญมนุษย์
  • สำหรับ TPU แต่ละเจเนอเรชันใหม่ รวมถึง Trillium รุ่นล่าสุด (รุ่นที่ 6) AlphaChip ได้ออกแบบเลย์เอาต์ชิปที่ดีขึ้น และครอบคลุมสัดส่วนของ floorplan ทั้งหมดมากขึ้น ช่วยเร่งรอบการออกแบบและผลิตชิปสมรรถนะสูงขึ้น

ผลกระทบในวงกว้างของ AlphaChip

  • เราเห็นผลกระทบของ AlphaChip ได้ผ่านการใช้งานทั่วทั้ง Alphabet ชุมชนนักวิจัย และอุตสาหกรรมการออกแบบชิป
  • นอกเหนือจากการออกแบบ AI accelerator เฉพาะทางอย่าง TPU แล้ว AlphaChip ยังสร้างเลย์เอาต์ให้กับชิปอื่น ๆ ทั่วทั้ง Alphabet เช่น Axion โปรเซสเซอร์ Arm-based สำหรับดาต้าเซ็นเตอร์แบบใช้งานทั่วไปตัวแรกของ Google
  • องค์กรภายนอกก็นำ AlphaChip ไปใช้และต่อยอดเช่นกัน (ตัวอย่างเช่น MediaTek ซึ่งเป็นหนึ่งในบริษัทออกแบบชิปชั้นนำของโลก ได้ขยาย AlphaChip เพื่อปรับปรุงด้านพลังงาน ประสิทธิภาพ และพื้นที่ชิป พร้อมเร่งการพัฒนาชิปที่ล้ำหน้าที่สุดอย่าง Dimensity Flagship 5G ซึ่งใช้ในโทรศัพท์ Samsung)
  • AlphaChip ได้จุดชนวนให้เกิดการระเบิดของงานด้าน AI เพื่อการออกแบบชิป และได้ขยายไปสู่ขั้นตอนสำคัญอื่น ๆ ของการออกแบบชิป เช่น logic synthesis และ macro selection

การสร้างชิปแห่งอนาคต

  • เราเชื่อว่า AlphaChip มีศักยภาพในการเพิ่มประสิทธิภาพทุกขั้นตอนของวงจรการออกแบบชิป ตั้งแต่สถาปัตยกรรมคอมพิวเตอร์ไปจนถึงการผลิต
  • มันอาจปฏิวัติการออกแบบชิปสำหรับฮาร์ดแวร์สั่งทำที่พบได้ในอุปกรณ์ประจำวัน เช่น สมาร์ตโฟน อุปกรณ์ทางการแพทย์ และเซ็นเซอร์การเกษตร
  • AlphaChip เวอร์ชันในอนาคตกำลังอยู่ระหว่างการพัฒนา และเราหวังว่าจะได้ร่วมมือกับชุมชนเพื่อสร้างนวัตกรรมในสาขานี้ต่อไป และสร้างอนาคตที่ชิปเร็วขึ้น ถูกลง และประหยัดพลังงานมากขึ้น

ความเห็นของ GN⁺

  • แนวทางที่ขับเคลื่อนด้วย AI ของ AlphaChip กำลังปฏิวัติวงการออกแบบชิป โดยเฉพาะในด้านการทำให้กระบวนการออกแบบเลย์เอาต์ชิปเป็นอัตโนมัติ ซึ่งมีความก้าวหน้าอย่างมาก
  • AlphaChip เป็นหนึ่งในตัวอย่างยุคแรกของการนำ reinforcement learning มาใช้กับปัญหาวิศวกรรมจริง และเป็นตัวอย่างที่ดีว่า AI สามารถถูกนำไปใช้ในโลกจริงได้อย่างไร
  • ผลกระทบของ AlphaChip ต่อการออกแบบ TPU จะเป็นหมุดหมายสำคัญของความก้าวหน้าในฮาร์ดแวร์ AI accelerator AI accelerator ที่ดีกว่าจะทำให้เกิดโมเดล AI ที่ทรงพลังยิ่งขึ้น และสิ่งนั้นก็จะยิ่งเร่งความก้าวหน้าของ AI ต่อไปอีก
  • อย่างไรก็ตาม การพึ่งพาเครื่องมือออกแบบด้วย AI มากเกินไปอาจนำไปสู่การสูญเสียความเชี่ยวชาญของนักออกแบบมนุษย์ ในระยะยาว ความร่วมมือระหว่าง AI กับผู้เชี่ยวชาญมนุษย์น่าจะเป็นแนวทางที่เหมาะสมที่สุด
  • เครื่องมือออกแบบที่ขับเคลื่อนด้วย AI ที่คล้ายกัน ได้แก่ Cerebus ของ Cadence และ DSO.ai ของ Synopsys เป็นต้น ในอนาคตการแข่งขันระหว่างเครื่องมือออกแบบอัตโนมัติที่ขับเคลื่อนด้วย AI น่าจะรุนแรงขึ้น

1 ความคิดเห็น

 
GN⁺ 2024-09-29
ความคิดเห็นจาก Hacker News
  • บทความใน Nature ของ Google ถูกวิจารณ์จากนักวิจัยในวงการ EDA CAD
    • บทความโต้แย้งจากนักวิจัยภายใน Google: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
    • บทความ ISPD ปี 2023 จากทีมวิจัย UCSD: "Assessment of Reinforcement Learning for Macro Placement"
    • บทความวิจารณ์ของ Igor Markov: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
  • อัลกอริทึม RL สำหรับการวาง macro ของ Google ไม่ได้ถูกเปรียบเทียบอย่างยุติธรรมกับอัลกอริทึมสมัยใหม่อื่น ๆ
    • มีการอ้างว่าทำการวาง macro ได้ดีกว่ามนุษย์ แต่ก็ยังไม่ถึงระดับประสิทธิภาพของอัลกอริทึมการวางแบบผสมในปัจจุบัน
    • เทคโนโลยี RL ต้องใช้ทรัพยากรคอมพิวต์มากกว่าอัลกอริทึมอื่น ๆ และไม่ได้เรียนรู้การแทนปัญหาการวางแบบใหม่ตัวปัญหาเอง แต่เรียนรู้ฟังก์ชันตัวแทนแทน
  • มีความสงสัยต่อผลงานของ Google และได้เขียนโพสต์อธิบายโดยละเอียดไว้บนเว็บไซต์ส่วนตัว
  • มีกรณีที่นักวิจัยของ Google ถูกคุกคามจนย้ายไป Anthropic
    • บทความที่เกี่ยวข้อง: "Google Brain AI Researcher Fired Tension"
  • TSMC เน้นย้ำว่าซอฟต์แวร์อัตโนมัติสำหรับการออกแบบชิปรุ่นใหม่ล่าสุดสามารถเลือกการออกแบบลอจิกสำหรับ TDP ได้
    • สิ่งนี้อาจเป็นวิธีในการคงไว้ซึ่ง Dennard scaling
    • ความเร็วแสงและความใกล้ทางกายภาพยังคงสำคัญ แต่ก็สงสัยว่าการหลีกเลี่ยง thermal throttling จะให้ประโยชน์ได้มากเพียงใด
  • มีคำถามเกี่ยวกับวิธีวัดคุณภาพของการออกแบบชิป
    • สงสัยว่าเมตริกที่ Google รายงานนั้นสมเหตุสมผลจริงหรือไม่ หรือเป็นเพียงการทำให้ตัวเองดูดี
    • "คุณภาพ" ของการออกแบบชิปมีหลายมิติและขึ้นอยู่กับกรณีการใช้งานอย่างมาก
    • ชิปสำหรับดาต้าเซ็นเตอร์กับชิปสำหรับกล้องมือถือหรือรถยนต์ย่อมมีหน้าตาแตกต่างกันมาก
    • สงสัยว่าในปัญหา/งานเฉพาะนี้ คำว่า "ดีกว่า" หมายถึงอะไรกันแน่
  • Eurisco เคยถูกใช้ทำงานด้าน placement และ routing และทำได้ดีมาก
    • Eurisco ถูกใช้ในการออกแบบกองยานอวกาศรบในเกม Traveler TCS
    • Eurisco ใช้การจัดวางแบบอิงสมมาตรที่เรียนรู้มาจากการออกแบบ VLSI
    • สงสัยว่า heuristic ของ AlphaChip จะนำไปใช้ที่อื่นได้หรือไม่
  • งานด้านการออกแบบชิปของ Google เป็นเรื่องที่ "มีข้อถกเถียง"
    • สงสัยว่าทำไมถึงทำแค่ PR โดยไม่ได้ทำสิ่งใหม่
  • มีปัญหาที่บทความ DeepX จำนวนมากถูกส่งไป Nature แทนที่จะเป็นเวที CS ที่เหมาะสม
    • ถ้าทำงานด้านการออกแบบชิปได้ดีกว่าจริง ก็ควรส่งไปที่ IPSD หรือ ISCA เป็นต้น
    • ไม่เข้าใจว่า Nature จัดการบทความแบบนี้อย่างไร
  • สงสัยว่าทำไมยังคงใช้คำว่า "เหนือมนุษย์" อยู่เรื่อย ๆ
    • งานลักษณะนี้ใช้อัลกอริทึมทำอยู่แล้ว และมนุษย์ก็ไม่ได้มานั่งวางทรานซิสเตอร์นับล้านล้านตัวด้วยมือ
  • อยากให้มีเครื่องมือสำหรับการออกแบบ/จัดวาง PCB
  • สงสัยว่าการประมวลผลแบบอิงหน่วยความจำใกล้จะเปลี่ยนจากงานวิจัยไปเป็นผลิตภัณฑ์ที่แข่งขันได้มากน้อยแค่ไหน
    • คิดว่าอาจถึงเวลาที่ควรลงทุนอย่างจริงจังเพื่อขยายการทดลองอย่าง memristor ไปสู่ระดับใหญ่
    • กำลังมีการถกกันว่าจะต้องมีเครื่องปฏิกรณ์ใหม่กี่เครื่องสำหรับ AI data center