AI เรียนรู้ “มนตร์ดำ” ของการออกแบบ RFIC

(spectrum.ieee.org)

1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

RFIC เป็นรากฐานของเทคโนโลยีไร้สายอย่าง 5G, เรดาร์รถยนต์ และการสื่อสารผ่านดาวเทียม แต่ยังคงเป็น โจทย์ยากที่พึ่งพางานด้วยมือเป็นหลัก เพราะต้องปรับให้สอดคล้องกันทั้งแม่เหล็กไฟฟ้า ความร้อน และความน่าเชื่อถือของแพ็กเกจจิง
นักวิจัยจาก Princeton ไม่ได้เริ่มจากเทมเพลตการออกแบบของมนุษย์ แต่ผสาน reinforcement learning กับ inverse design เพื่อสำรวจตั้งแต่ศูนย์ทั้งสถาปัตยกรรม โทโพโลยีของวงจร พารามิเตอร์ของอุปกรณ์ และอินเทอร์เฟซแม่เหล็กไฟฟ้า
อีมูเลเตอร์ที่ขับเคลื่อนด้วย AI คาดการณ์ scattering parameters ของโครงสร้างแม่เหล็กไฟฟ้า 2 มิติใด ๆ ได้ในระดับมิลลิวินาที ช่วยลดการวนซ้ำของ electromagnetic solver แบบเดิมที่ใช้เวลาระดับนาทีถึงชั่วโมงได้อย่างมาก
ในปี 2023 งานออกแบบ power amplifier ย่านมิลลิเมตรเวฟ 30~100GHz ให้ผลลัพธ์ที่มี การผสมผสานระหว่าง bandwidth, output และ efficiency ดีที่สุดในบรรดา power amplifier แบบซิลิคอนในเวลานั้น และในปี 2024 ยังสร้างโครงสร้าง multiport IC ได้ภายในระดับนาที
AI อาจสร้างวงจรที่ใช้งานไม่ได้ จึงยังต้องมีมนุษย์กำกับในการตรวจสอบ และหากจะไปสู่โมเดลทั่วไป จำเป็นต้องมี ระบบนิเวศแบบเปิด สำหรับแบ่งปันข้อมูลการออกแบบ RFIC และแอนะล็อกที่ติดข้อจำกัด NDA

เหตุผลที่การออกแบบ RFIC ยังถูกมองเป็น “มนตร์ดำ”

RFIC คือวงจรสำคัญที่ทำให้อุปกรณ์ส่งและรับข้อมูลแบบไร้สายได้ และความก้าวหน้าของ รถยนต์ไร้คนขับ, การสื่อสารควอนตัม, 6G และการสื่อสารผ่านดาวเทียมก็ล้วนพึ่งพาชิป RF ที่ก้าวหน้ากว่าเดิม
การออกแบบ CPU หรือ GPU ใกล้เคียงกับวิทยาศาสตร์ที่มีมาตรฐานมากขึ้นแล้ว แต่การออกแบบ RF ยังมีลักษณะเป็น ทักษะที่พึ่งพางานด้วยมือ ซึ่งต้องสั่งสมจากประสบการณ์ยาวนาน
การออกแบบ RFIC ต้องรับมือกับหลายโดเมนทางฟิสิกส์พร้อมกัน
- สมการ Maxwell กำหนดวิธีที่สนามแม่เหล็กไฟฟ้ามีปฏิสัมพันธ์กับอุปกรณ์ active และ passive
- เทอร์โมไดนามิกส์กำหนดวิธีที่ความร้อนถูกสร้างและถูกระบายออกระหว่างการทำงาน
- การขยายตัวและหดตัวจากความร้อนเกี่ยวข้องกับการที่ชิปและแพ็กเกจจะทนต่อการเปลี่ยนแปลงอุณหภูมิได้อย่างเสถียรหรือไม่
เพราะต้องพิจารณาข้อจำกัดทางฟิสิกส์ทั้งหมดพร้อมกัน พื้นที่การออกแบบจึงใหญ่มาก และมักเกิด trade-off ที่เมื่อเพิ่มตัวชี้วัดประสิทธิภาพหนึ่ง อีกตัวชี้วัดกลับแย่ลง

เวิร์กโฟลว์การออกแบบ RFIC แบบดั้งเดิมและคอขวด

หากต้องออกแบบ power amplifier 28GHz สำหรับสมาร์ตโฟน 5G ย่านมิลลิเมตรเวฟ ต้องเริ่มจากการกำหนดสถาปัตยกรรมและโทโพโลยีของวงจรก่อน
สถาปัตยกรรม RFIC กำหนดองค์ประกอบที่ต้องมีและเส้นทางสัญญาณ คล้ายพิมพ์เขียวของบ้าน
- ใน power amplifier จำนวนสเตจขยายสัญญาณเป็นองค์ประกอบสำคัญ
- พื้นที่ส่วนใหญ่ของ RFIC ไม่ได้ถูกครอบครองโดยทรานซิสเตอร์ แต่เป็น อุปกรณ์ passive อย่างอินดักเตอร์ สายส่งสัญญาณ และโครงสร้างแม่เหล็กไฟฟ้า
สัญญาณ 5G ทำงานที่ 28GHz และ 39GHz, การสื่อสารผ่านดาวเทียมทำงานที่ 26.5~40GHz ขึ้นไป และเรดาร์รถยนต์ทำงานที่ 77GHz โดย RFIC จะจัดการพลังงานสัญญาณที่ความถี่สูงเหล่านี้ผ่านโครงสร้างแม่เหล็กไฟฟ้าที่ละเอียดซับซ้อน
หากเส้นทางสัญญาณไม่เข้ากันกับองค์ประกอบถัดไปอย่างเหมาะสม จะเกิดปัญหา impedance matching ที่พลังงานไม่ไหลไปข้างหน้าแต่สะท้อนกลับ
- วิศวกรออกแบบโครงสร้าง transition ขนาดเล็กระหว่างองค์ประกอบต่าง ๆ เพื่อลดการสะท้อน
- โครงสร้างนี้ใช้ได้ทั้งการส่งผ่านสัญญาณ รวมถึงการแยก การรวม และการกระจายไปหลายเส้นทาง
หากไม่ผ่านสเปก ต้องกลับไปแก้โทโพโลยีหรือสถาปัตยกรรมแล้วทำซิมูเลชันซ้ำ และการออกแบบชิปใหม่หนึ่งตัวอาจใช้เวลาหลายปีและเงินหลายสิบล้านถึงหลายร้อยล้านดอลลาร์

แนวทางออกแบบด้วย AI ที่หลุดจากเทมเพลต

งานวิจัยก่อนหน้าใช้ machine learning เพื่อปรับแต่งเทมเพลตวงจรให้เหมาะสม แต่ยังคงพึ่งพา ไลบรารีการออกแบบเดิม ที่มนุษย์สร้างไว้
เป้าหมายของนักวิจัยจาก Princeton คือให้อัลกอริทึมกำหนดพารามิเตอร์ทั้งหมดของสถาปัตยกรรม วงจรประกอบ และโครงสร้าง passive ทางแม่เหล็กไฟฟ้า ตั้งแต่ต้นโดยไม่มีโทโพโลยีที่เตรียมไว้ล่วงหน้า
วิธีนี้มีจุดเริ่มต้นต่างจากการ optimize แบบเดิม
- วิธีเดิมปรับพารามิเตอร์อย่างขนาดทรานซิสเตอร์หรือรูปทรงของอุปกรณ์ passive บนโครงสร้างที่มนุษย์สร้างขึ้น
- วิธีใหม่เริ่มจากสภาพที่เกือบว่างเปล่า สร้างชุดวงจรผู้สมัคร ทำแผนที่ trade-off ด้านประสิทธิภาพ และสำรวจพื้นที่การออกแบบ
แนวทางนี้พัฒนากลยุทธ์การออกแบบด้วยการสำรวจและประเมินด้วยตัวเอง มากกว่าการเลียนแบบตัวอย่างมนุษย์ คล้าย AlphaGo Zero
อัลกอริทึมเรียนรู้วงจร แม่เหล็กไฟฟ้า และ co-design ระหว่างทั้งสอง เพื่อมุ่งสู่การออกแบบ RFIC แบบ end-to-end

การผสาน reinforcement learning กับ inverse design

ขั้นแรกคือเฟรมเวิร์ก reinforcement learning เพื่อกำหนดสถาปัตยกรรมระบบที่เหมาะที่สุด โทโพโลยีของวงจร พารามิเตอร์ของอุปกรณ์ และลักษณะของอินเทอร์เฟซแม่เหล็กไฟฟ้า
เอเจนต์ reinforcement learning ลองชุดค่าต่าง ๆ คล้ายคอมพิวเตอร์ที่เรียนรู้เกม สังเกตความสัมพันธ์ระหว่างการกระทำกับคะแนน แล้วค้นหาวงจรที่ดีขึ้นเรื่อย ๆ
- การฝึกใช้เวลา หลายวันถึงหนึ่งสัปดาห์
- หลังฝึกเสร็จแล้ว สามารถออกแบบวงจรได้เร็วมาก
ขั้นที่สองคือ inverse design เพื่อค้นหาโครงสร้างแม่เหล็กไฟฟ้าทางกายภาพที่สร้าง scattering parameters ตามต้องการ
- scattering parameters วัดว่าสัญญาณเมื่อเข้าไปในองค์ประกอบแล้วเดินหน้าไปต่อหรือสะท้อนกลับ
- คล้ายวิธีในวิศวกรรมโครงสร้างที่ค้นหารูปโค้งหรือโครงค้ำเพื่อสร้างพื้นที่เป้าหมาย
inverse design สำหรับ RFIC แก้ด้วยการค้นหาแบบทำมือซ้ำ ๆ ได้ยาก เพราะต้องปรับให้การทำงานของวงจรเข้ากับการตอบสนองแม่เหล็กไฟฟ้าของ interconnect และอุปกรณ์ passive พร้อมกัน

อีมูเลเตอร์ AI ที่ลดการวนซ้ำในการออกแบบแม่เหล็กไฟฟ้า

นักวิจัยแทนที่ RF circuit simulator ด้วย อีมูเลเตอร์ ที่ขับเคลื่อนด้วย AI
โมเดลนี้รับโครงสร้าง 2 มิติใด ๆ เป็นอินพุต แล้วคาดการณ์ scattering parameters โดยไม่ต้องคำนวณสมการ Maxwell โดยตรง
- งานที่ electromagnetic solver แบบเดิมใช้เวลาระดับนาทีถึงชั่วโมง ถูกลดเหลือระดับ มิลลิวินาที
อีมูเลเตอร์สร้างขึ้นบนพื้นฐานของ convolutional neural network ซึ่งเก่งด้านการประมวลผลภาพ
- ภาพของโครงสร้างมีข้อมูลเชิงพื้นที่ที่ใช้คาดการณ์ประสิทธิภาพทางแม่เหล็กไฟฟ้าได้
- นักวิจัยฝึกโมเดลด้วยโครงสร้างพิกเซลแบบสุ่มจำนวนมากที่มี scattering parameters เป็น label
การผสาน inverse design ที่ใช้ reinforcement learning กับอีมูเลเตอร์ AI ทำให้เกิด end-to-end AI designer และนำไปใช้กับการออกแบบ power amplifier

ผลลัพธ์สถาปัตยกรรม RF ที่ต่างจากมนุษย์

proof of concept ที่เผยแพร่ในปี 2023 มุ่งเป้าไปที่ power amplifier ย่านมิลลิเมตรเวฟ 30~100GHz
- ช่วงนี้ครอบคลุมความถี่ส่วนใหญ่ที่เกี่ยวข้องกับ 5G และเรดาร์
- การออกแบบสุดท้ายมีการผสมผสานของ wide bandwidth, output power และ efficiency ที่ดีที่สุดในบรรดา power amplifier แบบซิลิคอนในเวลานั้น และยังรักษา record efficiency ไว้ได้
เส้นทางแม่เหล็กไฟฟ้าที่สร้างขึ้นดูเหมือนแพตเทิร์นสุ่มหรือ QR code ต่างจากโครงสร้างปกติและสมมาตรที่มนุษย์มักพิจารณา
ผลลัพธ์นี้แสดงให้เห็นว่าไม่มีหลักประกันว่าเทมเพลตที่ใช้กันมาในอดีตจะใกล้เคียงกับจุดเหมาะสมที่สุดสำหรับเป้าหมายการออกแบบยุคใหม่
ต่อมานักวิจัยขยายโมเดลไปยังโครงสร้างที่มีพอร์ตอินพุตและเอาต์พุตจำนวนมาก
- พอร์ต 2 พอร์ตมี scattering parameters 4 ค่า ส่วน 4 พอร์ตมี 16 ค่า ทำให้ความซับซ้อนเพิ่มขึ้นอย่างรวดเร็ว
- งานวิจัย multiport integrated circuits ปี 2024 แสดงให้เห็นว่าอัลกอริทึม AI สามารถจัดการโครงสร้าง multiport ได้เช่นกัน
- ก่อนหน้านี้การจำลองแม่เหล็กไฟฟ้าแบบ multiport ต้องใช้เวลาหลายวันหรือหลายสัปดาห์ แต่โมเดลนี้วิวัฒน์โครงสร้างใหม่ได้ในระดับนาที
มีการแสดงเวิร์กโฟลว์ที่ผสานเฟรมเวิร์ก reinforcement learning กับ inverse design เพื่อสร้างจากสเปกไปจนถึง fabrication-ready layout และนำไปใช้กับ low-noise amplifier, subterahertz และ broadband power amplifiers

การออกแบบ AI ที่ตีความได้

การทดสอบและดีบัก RFIC อาจใช้เวลานานเท่ากับการออกแบบหรือยากกว่า วิศวกรจึงชอบ โครงสร้างที่ตีความได้ ซึ่งสามารถเข้าใจและแก้ไขได้เมื่อเกิดปัญหา
นักวิจัยนำ diffusion models ที่ใช้ใน AI สร้างภาพมาใช้กับการสร้างโครงสร้าง RFIC
แทนที่จะใช้ text prompt ใช้ scattering parameters เป็นอินพุต และสร้างโครงสร้างแม่เหล็กไฟฟ้าของ RFIC เป็นเอาต์พุต
ใส่ spatial-frequency dial เข้าไปในอินพุต เพื่อให้ผู้ออกแบบควบคุมรูปร่างของโครงสร้างผลลัพธ์ได้
- spatial frequency ต่ำ: รูปทรงคลาสสิกและตีความได้
- spatial frequency ปานกลาง: โครงสร้างคล้ายเขาวงกต
- spatial frequency สูง: โครงสร้างแบบพิกเซลหรือใกล้เคียงรูปทรงสุ่ม
กระบวนการทั้งหมดตั้งแต่ prompt จนถึงเอาต์พุตใช้เวลาประมาณ 6 นาที และหากเป็น scattering parameters ที่สามารถเกิดขึ้นได้ทางกายภาพภายใต้สมการ Maxwell ก็สามารถสร้างโครงสร้างที่สอดคล้องกันได้

ข้อจำกัดที่เหลือและโจทย์ด้านข้อมูล

วิธีออกแบบที่ใช้ AI ได้รับความสนใจจากชุมชน RF และเริ่มพลิกเวิร์กโฟลว์การออกแบบแบบ bottom-up ดั้งเดิม
ยังมีคำถามที่ยังไม่ได้รับคำตอบ
- วิธีนี้จะ generalize ได้มากแค่ไหน
- สามารถให้ประสิทธิภาพสูงอย่างสม่ำเสมอได้หรือไม่
- สามารถ optimize trade-off ทั้งหมดที่เป็นไปได้แบบองค์รวมได้หรือไม่
- สามารถประดิษฐ์วงจรอื่น ๆ ที่มนุษย์ไม่เคยสร้างมาก่อน นอกเหนือจาก RFIC ได้หรือไม่
AI อาจเกิด hallucination โดยสร้างวงจรแย่ ๆ ที่ใช้งานไม่ได้ จึงยังต้องมีมนุษย์กำกับในการตรวจสอบต่อไป
การสร้าง foundational model แบบทั่วไปต้องใช้ข้อมูลขนาดใหญ่เพื่อเรียนรู้กฎที่ควบคุมแม่เหล็กไฟฟ้าและการทำงานของวงจร
- ImageNet เป็นตัวอย่างที่ทำให้โมเดล image recognition generalize ได้ ด้วยภาพหลากหลาย 14 ล้านภาพที่มี label จากมนุษย์
- การออกแบบ RFIC และแอนะล็อกก็ต้องการข้อมูลที่มีขนาดและความหลากหลายใกล้เคียงกัน
ข้อมูลจำนวนมากมีอยู่ในการจำลองของบริษัทและห้องวิจัยทั่วโลก แต่ส่วนใหญ่ถูกกั้นไว้หลัง NDA
Natcast ดำเนิน U.S. CHIPS and Science Act’s R&D program และเคยสามารถเสริมโครงสร้างพื้นฐานร่วมกับนวัตกรรมสำหรับเทคโนโลยีไร้สายยุคถัดไป การรับรู้ และการป้องกันประเทศได้ แต่ตัวองค์กรและ โปรแกรม ที่เกี่ยวข้องกับ machine learning และ RFIC ถูกยุติลง
หากวงการ RFIC ขยายความร่วมมือระหว่างนักวิจัย AI กับนักออกแบบชิป และสร้างระบบนิเวศแบบเปิด ก็จะสามารถใช้ศักยภาพของการออกแบบ IC ที่ขับเคลื่อนด้วย AI ได้มากขึ้น

1 ความคิดเห็น

GN⁺ 4 시간 전

ความคิดเห็นจาก Hacker News

ทำให้นึกถึง การค้นหาด้วยอัลกอริทึมเชิงพันธุกรรม ในอดีต วิธีเดาแล้วตรวจสอบอาจทรงพลังได้มาก โดยเฉพาะถ้าสามารถใส่การชี้นำจากเอเจนต์ไว้ระหว่างทางได้
https://en.wikipedia.org/wiki/Evolved_antenna
- กำลังจะพูดเรื่องคล้ายกันเลย จำได้ว่ามีเกร็ดเรื่องการใช้อัลกอริทึมเชิงพันธุกรรมสร้าง ออสซิลเลเตอร์ ที่มีจำนวนชิ้นส่วนน้อยที่สุด สุดท้ายสำเร็จด้วยสายไฟเส้นเดียวจนทำให้คนประหลาดใจ กล่าวคือมันเป็นเสาอากาศที่รับสัญญาณ RF รบกวนในบริเวณใกล้เคียงนั่นเอง
- มีอันนี้ด้วย: https://en.wikipedia.org/wiki/Evolvable_hardware
  สำหรับจุดเริ่มต้น: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
สงสัยว่าความคาดหวังทั่วไปที่ว่าทฤษฎีที่แท้จริงควรมีความ งดงามและสง่างาม อยู่ที่ใดสักแห่ง จะอยู่รอดไปได้อีกศตวรรษไหม ถ้าปรากฏการณ์ธรรมชาติจริง ๆ แล้วอธิบายได้ดีที่สุดด้วยกองสมการที่ยุ่งเหยิงน่ากลัว ซึ่งมีแต่เครื่องจักรเท่านั้นที่จัดการและอนุมานได้ ก็คงน่าเศร้าไม่น้อย
- คำว่า “ความคาดหวังทั่วไป” นั้นดูจะเกินไปหน่อย คนส่วนใหญ่เข้าใจทฤษฎีวิทยาศาสตร์ว่าเป็น การประมาณ F=ma ก็ถูกต้องเฉพาะในขอบเขตของกลศาสตร์นิวตันเท่านั้น และแต่ละพจน์ก็มีเงื่อนไขกำกับมากมาย การวัดจริงจึงเป็นเพียงการประมาณเสมอ
  มุกที่ว่านักฟิสิกส์สมมติว่าเป็น “วัวทรงกลมสมบูรณ์แบบ” ก็อยู่ในบริบทนี้ และจริง ๆ แล้วแก่นของเรียงความ “ประสิทธิผลอันไร้เหตุผลของคณิตศาสตร์” ก็ใกล้เคียงกัน คือเป็นเรื่องที่น่าทึ่งอย่างไร้เหตุผลว่าการประมาณทางคณิตศาสตร์อธิบายโลกได้ดีขนาดนั้น
- มักคิดแบบนี้เวลาเห็นการแพทย์กับร่างกายมนุษย์ เราอยากเชื่อว่าร่างกายเป็นเครื่องจักรที่หล่อลื่นมาอย่างดีราวปาฏิหาริย์ แต่ในความเป็นจริง หลายครั้งมันดูเหมือน ถุงเละเทะ ที่แทบจะประคองตัวอยู่ได้มากกว่า
- ช่วงนี้ฉันก็คิดเรื่องนี้บ่อย โดยเฉพาะเมื่อเห็นว่ามี บทพิสูจน์ที่เครื่องจักรตรวจสอบได้ จำนวนมากที่เข้าใจยาก
  มีดโกนของอ็อกคัมเป็นฮิวริสติกที่มีประโยชน์ แต่ก็ทำให้เราเอนเอียงไปทางคำอธิบายที่เรียบง่ายกว่าเช่นกัน
- กลับกัน มันคงเจ๋งมาก ระดับต่ำสุด เรารู้อยู่แล้วว่าทุกอย่างเป็น เมฆความน่าจะเป็น มีความงามและความสบายใจอยู่ในความจริงที่ว่าไม่มีสิ่งใดกำหนดได้อย่างแน่นอนตลอดกาล
- “ความคาดหวังทั่วไป” ดูจะพลาดประเด็นไป ไม่ได้หมายความว่าทฤษฎีพื้นฐานต้องเรียบง่ายหรือสง่างาม แต่ใกล้เคียงกับความหมายที่ว่า ถ้าต้องเลือกระหว่างทฤษฎีที่ซับซ้อนกว่ากับทฤษฎีที่เรียบง่ายกว่า โดยทั่วไป ทฤษฎีที่เรียบง่ายที่สุด มักเป็นตัวเลือกที่ถูกต้องกว่า สมการฟิสิกส์ควอนตัมเองก็ค่อนข้างไม่สวยเหมือนกัน
หนึ่งในการใช้งานที่ยอดเยี่ยมของการออกแบบด้วย AI คือ การปนเปื้อนสิทธิบัตร ใช้ AI สร้างแบบดัดแปลงจำนวนมากแล้วเผยแพร่ไว้บนเว็บไซต์ ต่อมาเมื่อมีสิทธิบัตรออกมา ก็ใช้ส่วนที่ทับซ้อนกันทำให้สิทธิบัตรเป็นโมฆะ หรืออย่างน้อยก็ทำให้ขอบเขตแคบลงได้ เพราะการทำให้สิทธิบัตรมีลักษณะทั่วไปถูกจำกัดด้วยงานก่อนหน้า
- นึกถึงการตอบโต้เชิงการแสดงของทนาย Damien Riehl ตอนคดีตัดสินการละเมิดของ Sam Smith ในปี 2019/2020 เขาอ้างว่าได้ร่วมกับโปรแกรมเมอร์ Noah Rubin สร้างเมโลดี้ที่เป็นไปได้ทั้งหมดภายในปริภูมิการจัดชุดหนึ่งด้วยอัลกอริทึมในรูปแบบ MIDI และเผยแพร่ภายใต้ ไลเซนส์ CC-0 [0]
  ต่อมาเขาอธิบายตรรกะของตัวเองในงาน TEDx ท้องถิ่นและได้รับความสนใจพอสมควร [1] เท่าที่จำได้ นักวิเคราะห์กฎหมายไม่ค่อยตื่นเต้น โดยบอกว่าผู้พิพากษาแยกแยะความแตกต่างที่ละเอียดกว่านี้มากเป็นเรื่องปกติอยู่แล้ว ถึงอย่างนั้นก็เป็นความพยายามที่น่ารักดี
  [0] https://allthemusic.info/
  [1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
  https://www.the-independent.com/tech/music-copyright-algorit...
น่าหงุดหงิดนิดหน่อย AI ทำอะไรได้มากก็จริง แต่การเอา LLM, มอนติคาร์โล, อัลกอริทึมเชิงพันธุกรรม, ระบบผู้เชี่ยวชาญ และเวทมนตร์เชิงสถิติอื่น ๆ แบบดั้งเดิมอย่าง แมชชีนเลิร์นนิง มาปะปนกันเรื่อย ๆ ทำให้กิจกรรมแมชชีนเลิร์นนิงที่เป็นกลางทางศีลธรรมและเป็นที่ยอมรับอยู่แล้ว ถูกผูกเข้ากับความกังวลเกี่ยวกับ LLM และ Stable Diffusion อย่างก้าวร้าวเกินไป
และก็อดคิดไม่ได้ว่านั่นอาจเป็นเจตนา
- ปัญหาคือเวลาคนพูดว่า AI ทำอะไรได้ ก็มักสื่อเป็นนัยเหมือนว่า LLM ทำสิ่งนั้นได้ด้วย จึงดูเหมือน LLM ล้วน ๆ ทำได้แทบทุกอย่าง ในทางกลับกัน ก็มีคนบอกว่า AI จะไม่มีวันทำ X ได้ เพียงเพราะ LLM ทำสิ่งนั้นได้ไม่ดีโดยพื้นฐาน คำว่า AI คลุมเครือจนประโยชน์ลดลงแล้ว
- อยากโบกไม้กายสิทธิ์แล้วลบ คำว่า AI ออกไปเลย มันแทบไม่มีความหมายจริง ๆ จะใช้เรียกอะไรก็ได้ตั้งแต่ตัวละครคู่แข่งใน Mario Kart ไปจนถึง Stable Diffusion
- “AI” เป็นคำที่ถูกสาปด้วยนัยแบบไซไฟเท่ ๆ จึงทรงพลังในฐานะคำการตลาด คนจำนวนมากคุ้นเคยกับ AI ในไซไฟ และความเชื่อที่ว่า “สื่อบางอย่างทำนายเทคโนโลยีบางอย่างไว้” ก็แพร่หลายพอสมควรสำหรับ X อย่าง Star Trek, The Hitchhiker's Guide to the Galaxy, Arthur C. Clarke กับ Y อย่างอินเทอร์เน็ต โทรศัพท์มือถือ VR
  เวลาต้องการบอกว่ามีความก้าวหน้าครั้งใหญ่ในบางสิ่ง การเชื่อมเข้ากับความเข้าใจแบบวิทยาศาสตร์ยอดนิยมที่ว่าไซไฟทำนายความสำเร็จของมนุษย์ เป็นวิธีที่ใช้แรงน้อยแต่ได้ผลมาก ถ้าลำดับความสำคัญอันดับหนึ่งคือทำให้คนตื่นเต้น ก็ไม่ใช่การสื่อสารอย่างแม่นยำ
- ดังนั้นจึงกำลังฝึกเรียกแมชชีนเลิร์นนิงแบบดั้งเดิมว่า ML และเรียกโมเดลภาษาขนาดใหญ่ว่า LLM จะพยายามไม่ใช้คำว่า AI อีกแล้ว คลุมเครือเกินไป แม้ตอนพูดถึง AI ในเกม ก็พยายามใช้ตัวย่อของอัลกอริทึมที่ AI นั้นน่าจะใช้ บางทีก็เรียกว่าโฟลว์ชาร์ต แต่ก็ไม่แน่ใจว่าภายในจริง ๆ เป็นโฟลว์ชาร์ตหรือไม่
- เหมือนกับที่สาขาแมชชีนเลิร์นนิงที่ประสบความสำเร็จกว่าในช่วง AI winter เคยตีตัวออกห่างจากคำนี้ ตอนนี้เป็น AI summer แล้ว ก็คงได้เห็นคนหันกลับมายอมรับคำนั้นอีก และบางทีตอนนี้ก็อาจกำลังเป็นแบบนั้นอยู่แล้ว
คำว่า “มนุษย์ไม่เคยแม้แต่จะจินตนาการได้” ดูเหมือนจะพูดเกินจริง ถึงอย่างนั้น ก็ดูเป็นไปได้มากที่อัลกอริทึม machine learning จะใช้ brute-force search ไปถึงการออกแบบชิปที่ไม่มีใครเคยลองมาก่อน และบางส่วนในนั้นอาจมีประโยชน์กับเรา นับว่าเป็นงานที่ค่อนข้างสมเหตุสมผลสำหรับคอมพิวเตอร์
- เป็นคำโฆษณาไร้สาระ ข้อแรก มันเหมือนกับการพิสูจน์สิ่งที่เป็นปฏิเสธ จึงพิสูจน์ไม่ได้ว่ามนุษย์ไม่สามารถจินตนาการถึงสิ่งนั้นได้ ข้อสอง มนุษย์เคยจินตนาการถึง ของแปลกประหลาด มาแล้วไม่น้อย
- เหมือน เค้กเป็นชั้น ๆ ของ machine learning ที่โรยเศษ brute-force search ไว้ข้างบน
สิ่งหนึ่งที่พอได้จากบทความคือ เพื่อสร้างความก้าวหน้าแบบนี้ จำเป็นต้องทิ้งบล็อกพื้นฐานของการออกแบบชิปที่ผ่านการพิสูจน์แล้วไป ผมสงสัยว่าเรื่องเดียวกันนี้จะใช้กับการเขียนโค้ดทั่วไปด้วยไหม นวัตกรรมสุดน่าทึ่งของการเขียนโค้ดด้วย AI จริง ๆ แล้วถูก Rust และ Python ขวางทางอยู่หรือเปล่า? เราควรปล่อยให้เครื่องมือ AI เขียนโค้ดในระดับต่ำที่สุดเท่าที่จะเป็นไปได้ไปเลยไหม?
- เป็นคำถามที่น่าสนใจ แต่ดูเหมือนจะมีนัยที่ค่อนข้างน่ากังวลต่อ portability
ทำให้นึกถึงบทความเก่านี้: https://www.damninteresting.com/on-the-origin-of-circuits/
เป็นหนึ่งในขุมทรัพย์เล็ก ๆ ที่เจอบนอินเทอร์เน็ต
- ผมก็กำลังจะโพสต์อันนี้เหมือนกัน ตอนอ่านครั้งแรกผมช็อกมาก เลยดีใจที่เห็นคนอื่น ๆ ก็ชอบมันด้วย
  ในคอมเมนต์แถว ๆ นี้มีคนพูดถึงความแข็งแกร่งทนทานของดีไซน์ที่เติบโตในแล็บ และส่วนที่น่าสนใจที่สุดในบทความ Damn Interesting สำหรับผมก็คือข้อเท็จจริงที่ว่าโปรแกรมที่วิวัฒน์ขึ้นมานั้นแยกออกจาก FPGA ทางกายภาพเพียงตัวเดียวที่ใช้ในการฝึกไม่ได้ โมเดลเรียนรู้ RFIC ครั้งนี้ใช้ซิมูเลเตอร์ เลยสงสัยว่าคุณสมบัติของฮาร์ดแวร์กายภาพที่รันซิมูเลเตอร์จะถูกแยกออกจากการเรียนรู้ได้เพียงพอหรือไม่ จนเมื่อรันซิมูเลเตอร์บนฮาร์ดแวร์ต่างกัน ดีไซน์เหล่านั้นจะทำงานคล้ายกันหรือเปล่า
  คำถามที่ชัดเจนกว่านั้นคือ ดีไซน์ที่วิวัฒน์ในซิมูเลเตอร์จะมีความหวังไหมว่าจะทำงานได้ตามคาดบนฮาร์ดแวร์กายภาพจริง สัญชาตญาณของผมสำหรับข้อหลังคือไม่น่าใช่ แต่ก็ยังดูเป็นงานวิจัยที่น่าสนใจ และผมมักคิดว่าการเข้าใจให้ถ่องแท้ว่าจริง ๆ แล้วเกิดอะไรขึ้นใน FPGA อาจเป็นเงื่อนไขเบื้องต้นก่อนจะจัดการกับ reinforcement learning ได้อย่างจริงจัง
  ดีใจที่คุณโพสต์บทความนี้ และถ้ามีบทความโปรดอื่น ๆ ที่เกี่ยวข้องกับสาขานี้ก็อยากให้ส่งมาให้ด้วย
- นี่ยังเป็นตัวอย่างของสปีชีส์ที่เฉพาะทางและถูกปรับให้เหมาะสมมากจนปรับตัวต่อไม่ได้อีกแล้วด้วย และยังเป็นตัวอย่างของ POSIWID ด้วย
คำถามที่ใหญ่ที่สุดคือดีไซน์แบบนี้ ทนทาน แค่ไหน
ใน论文แสดงให้เห็นว่าค่าที่วัดจากอุปกรณ์จริงสอดคล้องกับการคาดการณ์ได้ดี แต่ผมหาส่วนที่พูดถึงเรื่องนี้อย่างชัดเจนในเนื้อหาไม่เจอ อีกทั้งระบบบางส่วนที่นำเสนอก็มีบล็อกย่อยที่ออกแบบแบบดั้งเดิมอยู่ด้วย ซึ่งฝั่งนั้นอาจรับภาระบางอย่างไปก็ได้
บางทีผมอาจมองในแง่ลบโดยไม่จำเป็นเพราะมันเหมือนจะมาแย่งงานผม หรือบางทีพวกเขาอาจอยากให้เราคิดแบบนั้นก็ได้
ผมคิดว่าสิ่งที่ชนะจริง ๆ คือไอเดียง่าย ๆ ที่ทนต่อความแปรปรวนจากการผลิตและสภาพแวดล้อม รวมถึงข้อจำกัดของโมเดลได้ เช่น feedback หรือ symmetry แต่สิ่งที่เห็นตรงนี้แทบจะตรงกันข้าม ผมเคย blind-optimize พารามิเตอร์วงจรมาหลายครั้ง และสุดท้ายพอรู้ตัวว่า “ตรงนี้ต้องมี symmetry” หรือ “ตรงนี้ต้องมี bandwidth มากกว่านี้” ซึ่งเป็นไอเดียง่าย ๆ ที่พลาดไป ทุกอย่างก็สมเหตุสมผลขึ้นทันที เลยสงสัยว่าถ้าปรับแค่ไม่กี่พิกเซลของโครงสร้างนี้ อะไรที่ง่ายกว่านี้จะปรากฏออกมาหรือเปล่า
และก็คงต้องกล่าวถึง “evolved antenna” ตามธรรมเนียมด้วย
- นี่แหละคือส่วนที่ทำให้ผมติดใจกับบทความนี้และบทความคล้าย ๆ กันในอดีต ไม่มี หลักฐาน รองรับข้ออ้างว่า AI มีประโยชน์ในการออกแบบ
  ตามเนื้อหา บทบาทของ AI คือแทนที่ซิมูเลเตอร์แม่เหล็กไฟฟ้าในกระบวนการ optimization เพื่อประเมินพฤติกรรมของโครงสร้าง และบอกว่าเร็วกว่า simulation หลายลำดับขนาด
  ฟังดูเข้าท่า แต่ถ้าจะให้เชื่อ ผมอยากเห็นความแตกต่างระหว่างการประเมินของ AI กับการวัดจริงสำหรับเรขาคณิตที่ต่างจากที่ใช้ฝึก AI มาก ๆ และยังต้องเห็นด้วยว่าเอาความเร็วของโมเดล AI ไปเทียบกับซิมูเลเตอร์ตัวไหนกันแน่
  ในสนามแม่เหล็กไฟฟ้าและวงจรอิเล็กทรอนิกส์ มีแนวทาง simulation หลายแบบที่แลกความแม่นยำกับความเร็ว ดังนั้นผมยังไม่แน่ใจว่า inference ของ AI จะใช้เวลาน้อยกว่า simulation ความแม่นยำต่ำที่เร็วกว่าอย่างมีนัยสำคัญเสมอไป simulation แบบนั้นก็อาจแม่นยำและน่าเชื่อถือกว่า AI ประเมินด้วยซ้ำ
- ผมก็เข้ามาเพื่อพูดถึง evolved antenna เหมือนกัน
  ในเมื่อมีคนพูดไปก่อนแล้ว ขอเสริมเกี่ยวกับประเด็น “ตระหนักถึงไอเดียที่ค่อนข้างเรียบง่าย” ว่าผมคิดว่าข้อดีใหญ่ข้อหนึ่งของการออกแบบโดยมีคอมพิวเตอร์ช่วยแบบนี้คือ “innovization”[1] แม้จะเป็นคำที่ค่อนข้างเก้ ๆ กัง ๆ แต่แก่นของมันคือระบบแบบนี้พาเราไปสู่ความเข้าใจที่ลึกขึ้นเกี่ยวกับกระบวนการบางอย่าง เวลาเจอกับตัวจริง ๆ แล้วเป็นความรู้สึกที่ค่อนข้างสนุก
  [1]: https://dl.acm.org/doi/10.1145/1143997.1144266
- ก็แค่ บทความขยะที่อวยเกินจริง
วิธีที่อธิบายในบทความนี้ไม่ใช่ของใหม่ นักวิทยาศาสตร์ออกแบบเสาอากาศด้วย genetic algorithms มาหลายสิบปีแล้ว เป็นของที่ไม่มีใครเข้าใจแต่ทำงานได้ดี
มันไม่ได้มหัศจรรย์ขนาดนั้น อย่างที่บทความบอก การออกแบบ RFIC เป็นเหมือนมนตร์ดำที่พึ่งพาความรู้และประสบการณ์ของผู้ออกแบบอย่างมาก เกินกว่า RF engineering ทั่วไปไปไกล และได้รับความช่วยเหลือจากเครื่องมือ modeling/ออกแบบที่เมื่อไม่กี่สิบปีก่อนคงระดับซูเปอร์คอมพิวเตอร์
สิ่งที่ AI ทำได้คือสำรวจผลลัพธ์ที่เป็นไปได้ทั้งหมดแบบ breadth-first แล้วเลือกตัวที่มี performance ดีที่สุด ซึ่งต่างจากวิธีที่มนุษย์บอกว่า “เส้นทางนี้ดูดี ลองขุดต่อกันเถอะ”
- มันจำเป็นต้องเหมือนเวทมนตร์ด้วยหรือ ถึงจะน่าสนใจหรือมีประโยชน์?

AI เรียนรู้ “มนตร์ดำ” ของการออกแบบ RFIC

เหตุผลที่การออกแบบ RFIC ยังถูกมองเป็น “มนตร์ดำ”

เวิร์กโฟลว์การออกแบบ RFIC แบบดั้งเดิมและคอขวด

แนวทางออกแบบด้วย AI ที่หลุดจากเทมเพลต

การผสาน reinforcement learning กับ inverse design

อีมูเลเตอร์ AI ที่ลดการวนซ้ำในการออกแบบแม่เหล็กไฟฟ้า

ผลลัพธ์สถาปัตยกรรม RF ที่ต่างจากมนุษย์

การออกแบบ AI ที่ตีความได้

ข้อจำกัดที่เหลือและโจทย์ด้านข้อมูล

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News