AI เรียนรู้ “มนตร์ดำ” ของการออกแบบ RFIC
(spectrum.ieee.org)- RFIC เป็นรากฐานของเทคโนโลยีไร้สายอย่าง 5G, เรดาร์รถยนต์ และการสื่อสารผ่านดาวเทียม แต่ยังคงเป็น โจทย์ยากที่พึ่งพางานด้วยมือเป็นหลัก เพราะต้องปรับให้สอดคล้องกันทั้งแม่เหล็กไฟฟ้า ความร้อน และความน่าเชื่อถือของแพ็กเกจจิง
- นักวิจัยจาก Princeton ไม่ได้เริ่มจากเทมเพลตการออกแบบของมนุษย์ แต่ผสาน reinforcement learning กับ inverse design เพื่อสำรวจตั้งแต่ศูนย์ทั้งสถาปัตยกรรม โทโพโลยีของวงจร พารามิเตอร์ของอุปกรณ์ และอินเทอร์เฟซแม่เหล็กไฟฟ้า
- อีมูเลเตอร์ที่ขับเคลื่อนด้วย AI คาดการณ์ scattering parameters ของโครงสร้างแม่เหล็กไฟฟ้า 2 มิติใด ๆ ได้ในระดับมิลลิวินาที ช่วยลดการวนซ้ำของ electromagnetic solver แบบเดิมที่ใช้เวลาระดับนาทีถึงชั่วโมงได้อย่างมาก
- ในปี 2023 งานออกแบบ power amplifier ย่านมิลลิเมตรเวฟ 30~100GHz ให้ผลลัพธ์ที่มี การผสมผสานระหว่าง bandwidth, output และ efficiency ดีที่สุดในบรรดา power amplifier แบบซิลิคอนในเวลานั้น และในปี 2024 ยังสร้างโครงสร้าง multiport IC ได้ภายในระดับนาที
- AI อาจสร้างวงจรที่ใช้งานไม่ได้ จึงยังต้องมีมนุษย์กำกับในการตรวจสอบ และหากจะไปสู่โมเดลทั่วไป จำเป็นต้องมี ระบบนิเวศแบบเปิด สำหรับแบ่งปันข้อมูลการออกแบบ RFIC และแอนะล็อกที่ติดข้อจำกัด NDA
เหตุผลที่การออกแบบ RFIC ยังถูกมองเป็น “มนตร์ดำ”
- RFIC คือวงจรสำคัญที่ทำให้อุปกรณ์ส่งและรับข้อมูลแบบไร้สายได้ และความก้าวหน้าของ รถยนต์ไร้คนขับ, การสื่อสารควอนตัม, 6G และการสื่อสารผ่านดาวเทียมก็ล้วนพึ่งพาชิป RF ที่ก้าวหน้ากว่าเดิม
- การออกแบบ CPU หรือ GPU ใกล้เคียงกับวิทยาศาสตร์ที่มีมาตรฐานมากขึ้นแล้ว แต่การออกแบบ RF ยังมีลักษณะเป็น ทักษะที่พึ่งพางานด้วยมือ ซึ่งต้องสั่งสมจากประสบการณ์ยาวนาน
- การออกแบบ RFIC ต้องรับมือกับหลายโดเมนทางฟิสิกส์พร้อมกัน
- สมการ Maxwell กำหนดวิธีที่สนามแม่เหล็กไฟฟ้ามีปฏิสัมพันธ์กับอุปกรณ์ active และ passive
- เทอร์โมไดนามิกส์กำหนดวิธีที่ความร้อนถูกสร้างและถูกระบายออกระหว่างการทำงาน
- การขยายตัวและหดตัวจากความร้อนเกี่ยวข้องกับการที่ชิปและแพ็กเกจจะทนต่อการเปลี่ยนแปลงอุณหภูมิได้อย่างเสถียรหรือไม่
- เพราะต้องพิจารณาข้อจำกัดทางฟิสิกส์ทั้งหมดพร้อมกัน พื้นที่การออกแบบจึงใหญ่มาก และมักเกิด trade-off ที่เมื่อเพิ่มตัวชี้วัดประสิทธิภาพหนึ่ง อีกตัวชี้วัดกลับแย่ลง
เวิร์กโฟลว์การออกแบบ RFIC แบบดั้งเดิมและคอขวด
- หากต้องออกแบบ power amplifier 28GHz สำหรับสมาร์ตโฟน 5G ย่านมิลลิเมตรเวฟ ต้องเริ่มจากการกำหนดสถาปัตยกรรมและโทโพโลยีของวงจรก่อน
- สถาปัตยกรรม RFIC กำหนดองค์ประกอบที่ต้องมีและเส้นทางสัญญาณ คล้ายพิมพ์เขียวของบ้าน
- ใน power amplifier จำนวนสเตจขยายสัญญาณเป็นองค์ประกอบสำคัญ
- พื้นที่ส่วนใหญ่ของ RFIC ไม่ได้ถูกครอบครองโดยทรานซิสเตอร์ แต่เป็น อุปกรณ์ passive อย่างอินดักเตอร์ สายส่งสัญญาณ และโครงสร้างแม่เหล็กไฟฟ้า
- สัญญาณ 5G ทำงานที่ 28GHz และ 39GHz, การสื่อสารผ่านดาวเทียมทำงานที่ 26.5~40GHz ขึ้นไป และเรดาร์รถยนต์ทำงานที่ 77GHz โดย RFIC จะจัดการพลังงานสัญญาณที่ความถี่สูงเหล่านี้ผ่านโครงสร้างแม่เหล็กไฟฟ้าที่ละเอียดซับซ้อน
- หากเส้นทางสัญญาณไม่เข้ากันกับองค์ประกอบถัดไปอย่างเหมาะสม จะเกิดปัญหา impedance matching ที่พลังงานไม่ไหลไปข้างหน้าแต่สะท้อนกลับ
- วิศวกรออกแบบโครงสร้าง transition ขนาดเล็กระหว่างองค์ประกอบต่าง ๆ เพื่อลดการสะท้อน
- โครงสร้างนี้ใช้ได้ทั้งการส่งผ่านสัญญาณ รวมถึงการแยก การรวม และการกระจายไปหลายเส้นทาง
- หากไม่ผ่านสเปก ต้องกลับไปแก้โทโพโลยีหรือสถาปัตยกรรมแล้วทำซิมูเลชันซ้ำ และการออกแบบชิปใหม่หนึ่งตัวอาจใช้เวลาหลายปีและเงินหลายสิบล้านถึงหลายร้อยล้านดอลลาร์
แนวทางออกแบบด้วย AI ที่หลุดจากเทมเพลต
- งานวิจัยก่อนหน้าใช้ machine learning เพื่อปรับแต่งเทมเพลตวงจรให้เหมาะสม แต่ยังคงพึ่งพา ไลบรารีการออกแบบเดิม ที่มนุษย์สร้างไว้
- เป้าหมายของนักวิจัยจาก Princeton คือให้อัลกอริทึมกำหนดพารามิเตอร์ทั้งหมดของสถาปัตยกรรม วงจรประกอบ และโครงสร้าง passive ทางแม่เหล็กไฟฟ้า ตั้งแต่ต้นโดยไม่มีโทโพโลยีที่เตรียมไว้ล่วงหน้า
- วิธีนี้มีจุดเริ่มต้นต่างจากการ optimize แบบเดิม
- วิธีเดิมปรับพารามิเตอร์อย่างขนาดทรานซิสเตอร์หรือรูปทรงของอุปกรณ์ passive บนโครงสร้างที่มนุษย์สร้างขึ้น
- วิธีใหม่เริ่มจากสภาพที่เกือบว่างเปล่า สร้างชุดวงจรผู้สมัคร ทำแผนที่ trade-off ด้านประสิทธิภาพ และสำรวจพื้นที่การออกแบบ
- แนวทางนี้พัฒนากลยุทธ์การออกแบบด้วยการสำรวจและประเมินด้วยตัวเอง มากกว่าการเลียนแบบตัวอย่างมนุษย์ คล้าย AlphaGo Zero
- อัลกอริทึมเรียนรู้วงจร แม่เหล็กไฟฟ้า และ co-design ระหว่างทั้งสอง เพื่อมุ่งสู่การออกแบบ RFIC แบบ end-to-end
การผสาน reinforcement learning กับ inverse design
- ขั้นแรกคือเฟรมเวิร์ก reinforcement learning เพื่อกำหนดสถาปัตยกรรมระบบที่เหมาะที่สุด โทโพโลยีของวงจร พารามิเตอร์ของอุปกรณ์ และลักษณะของอินเทอร์เฟซแม่เหล็กไฟฟ้า
- เอเจนต์ reinforcement learning ลองชุดค่าต่าง ๆ คล้ายคอมพิวเตอร์ที่เรียนรู้เกม สังเกตความสัมพันธ์ระหว่างการกระทำกับคะแนน แล้วค้นหาวงจรที่ดีขึ้นเรื่อย ๆ
- การฝึกใช้เวลา หลายวันถึงหนึ่งสัปดาห์
- หลังฝึกเสร็จแล้ว สามารถออกแบบวงจรได้เร็วมาก
- ขั้นที่สองคือ inverse design เพื่อค้นหาโครงสร้างแม่เหล็กไฟฟ้าทางกายภาพที่สร้าง scattering parameters ตามต้องการ
- scattering parameters วัดว่าสัญญาณเมื่อเข้าไปในองค์ประกอบแล้วเดินหน้าไปต่อหรือสะท้อนกลับ
- คล้ายวิธีในวิศวกรรมโครงสร้างที่ค้นหารูปโค้งหรือโครงค้ำเพื่อสร้างพื้นที่เป้าหมาย
- inverse design สำหรับ RFIC แก้ด้วยการค้นหาแบบทำมือซ้ำ ๆ ได้ยาก เพราะต้องปรับให้การทำงานของวงจรเข้ากับการตอบสนองแม่เหล็กไฟฟ้าของ interconnect และอุปกรณ์ passive พร้อมกัน
อีมูเลเตอร์ AI ที่ลดการวนซ้ำในการออกแบบแม่เหล็กไฟฟ้า
- นักวิจัยแทนที่ RF circuit simulator ด้วย อีมูเลเตอร์ ที่ขับเคลื่อนด้วย AI
- โมเดลนี้รับโครงสร้าง 2 มิติใด ๆ เป็นอินพุต แล้วคาดการณ์ scattering parameters โดยไม่ต้องคำนวณสมการ Maxwell โดยตรง
- งานที่ electromagnetic solver แบบเดิมใช้เวลาระดับนาทีถึงชั่วโมง ถูกลดเหลือระดับ มิลลิวินาที
- อีมูเลเตอร์สร้างขึ้นบนพื้นฐานของ convolutional neural network ซึ่งเก่งด้านการประมวลผลภาพ
- ภาพของโครงสร้างมีข้อมูลเชิงพื้นที่ที่ใช้คาดการณ์ประสิทธิภาพทางแม่เหล็กไฟฟ้าได้
- นักวิจัยฝึกโมเดลด้วยโครงสร้างพิกเซลแบบสุ่มจำนวนมากที่มี scattering parameters เป็น label
- การผสาน inverse design ที่ใช้ reinforcement learning กับอีมูเลเตอร์ AI ทำให้เกิด end-to-end AI designer และนำไปใช้กับการออกแบบ power amplifier
ผลลัพธ์สถาปัตยกรรม RF ที่ต่างจากมนุษย์
- proof of concept ที่เผยแพร่ในปี 2023 มุ่งเป้าไปที่ power amplifier ย่านมิลลิเมตรเวฟ 30~100GHz
- ช่วงนี้ครอบคลุมความถี่ส่วนใหญ่ที่เกี่ยวข้องกับ 5G และเรดาร์
- การออกแบบสุดท้ายมีการผสมผสานของ wide bandwidth, output power และ efficiency ที่ดีที่สุดในบรรดา power amplifier แบบซิลิคอนในเวลานั้น และยังรักษา record efficiency ไว้ได้
- เส้นทางแม่เหล็กไฟฟ้าที่สร้างขึ้นดูเหมือนแพตเทิร์นสุ่มหรือ QR code ต่างจากโครงสร้างปกติและสมมาตรที่มนุษย์มักพิจารณา
- ผลลัพธ์นี้แสดงให้เห็นว่าไม่มีหลักประกันว่าเทมเพลตที่ใช้กันมาในอดีตจะใกล้เคียงกับจุดเหมาะสมที่สุดสำหรับเป้าหมายการออกแบบยุคใหม่
- ต่อมานักวิจัยขยายโมเดลไปยังโครงสร้างที่มีพอร์ตอินพุตและเอาต์พุตจำนวนมาก
- พอร์ต 2 พอร์ตมี scattering parameters 4 ค่า ส่วน 4 พอร์ตมี 16 ค่า ทำให้ความซับซ้อนเพิ่มขึ้นอย่างรวดเร็ว
- งานวิจัย multiport integrated circuits ปี 2024 แสดงให้เห็นว่าอัลกอริทึม AI สามารถจัดการโครงสร้าง multiport ได้เช่นกัน
- ก่อนหน้านี้การจำลองแม่เหล็กไฟฟ้าแบบ multiport ต้องใช้เวลาหลายวันหรือหลายสัปดาห์ แต่โมเดลนี้วิวัฒน์โครงสร้างใหม่ได้ในระดับนาที
- มีการแสดงเวิร์กโฟลว์ที่ผสานเฟรมเวิร์ก reinforcement learning กับ inverse design เพื่อสร้างจากสเปกไปจนถึง fabrication-ready layout และนำไปใช้กับ low-noise amplifier, subterahertz และ broadband power amplifiers
การออกแบบ AI ที่ตีความได้
- การทดสอบและดีบัก RFIC อาจใช้เวลานานเท่ากับการออกแบบหรือยากกว่า วิศวกรจึงชอบ โครงสร้างที่ตีความได้ ซึ่งสามารถเข้าใจและแก้ไขได้เมื่อเกิดปัญหา
- นักวิจัยนำ diffusion models ที่ใช้ใน AI สร้างภาพมาใช้กับการสร้างโครงสร้าง RFIC
- แทนที่จะใช้ text prompt ใช้ scattering parameters เป็นอินพุต และสร้างโครงสร้างแม่เหล็กไฟฟ้าของ RFIC เป็นเอาต์พุต
- ใส่ spatial-frequency dial เข้าไปในอินพุต เพื่อให้ผู้ออกแบบควบคุมรูปร่างของโครงสร้างผลลัพธ์ได้
- spatial frequency ต่ำ: รูปทรงคลาสสิกและตีความได้
- spatial frequency ปานกลาง: โครงสร้างคล้ายเขาวงกต
- spatial frequency สูง: โครงสร้างแบบพิกเซลหรือใกล้เคียงรูปทรงสุ่ม
- กระบวนการทั้งหมดตั้งแต่ prompt จนถึงเอาต์พุตใช้เวลาประมาณ 6 นาที และหากเป็น scattering parameters ที่สามารถเกิดขึ้นได้ทางกายภาพภายใต้สมการ Maxwell ก็สามารถสร้างโครงสร้างที่สอดคล้องกันได้
ข้อจำกัดที่เหลือและโจทย์ด้านข้อมูล
- วิธีออกแบบที่ใช้ AI ได้รับความสนใจจากชุมชน RF และเริ่มพลิกเวิร์กโฟลว์การออกแบบแบบ bottom-up ดั้งเดิม
- ยังมีคำถามที่ยังไม่ได้รับคำตอบ
- วิธีนี้จะ generalize ได้มากแค่ไหน
- สามารถให้ประสิทธิภาพสูงอย่างสม่ำเสมอได้หรือไม่
- สามารถ optimize trade-off ทั้งหมดที่เป็นไปได้แบบองค์รวมได้หรือไม่
- สามารถประดิษฐ์วงจรอื่น ๆ ที่มนุษย์ไม่เคยสร้างมาก่อน นอกเหนือจาก RFIC ได้หรือไม่
- AI อาจเกิด hallucination โดยสร้างวงจรแย่ ๆ ที่ใช้งานไม่ได้ จึงยังต้องมีมนุษย์กำกับในการตรวจสอบต่อไป
- การสร้าง foundational model แบบทั่วไปต้องใช้ข้อมูลขนาดใหญ่เพื่อเรียนรู้กฎที่ควบคุมแม่เหล็กไฟฟ้าและการทำงานของวงจร
- ImageNet เป็นตัวอย่างที่ทำให้โมเดล image recognition generalize ได้ ด้วยภาพหลากหลาย 14 ล้านภาพที่มี label จากมนุษย์
- การออกแบบ RFIC และแอนะล็อกก็ต้องการข้อมูลที่มีขนาดและความหลากหลายใกล้เคียงกัน
- ข้อมูลจำนวนมากมีอยู่ในการจำลองของบริษัทและห้องวิจัยทั่วโลก แต่ส่วนใหญ่ถูกกั้นไว้หลัง NDA
- Natcast ดำเนิน U.S. CHIPS and Science Act’s R&D program และเคยสามารถเสริมโครงสร้างพื้นฐานร่วมกับนวัตกรรมสำหรับเทคโนโลยีไร้สายยุคถัดไป การรับรู้ และการป้องกันประเทศได้ แต่ตัวองค์กรและ โปรแกรม ที่เกี่ยวข้องกับ machine learning และ RFIC ถูกยุติลง
- หากวงการ RFIC ขยายความร่วมมือระหว่างนักวิจัย AI กับนักออกแบบชิป และสร้างระบบนิเวศแบบเปิด ก็จะสามารถใช้ศักยภาพของการออกแบบ IC ที่ขับเคลื่อนด้วย AI ได้มากขึ้น
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ทำให้นึกถึง การค้นหาด้วยอัลกอริทึมเชิงพันธุกรรม ในอดีต วิธีเดาแล้วตรวจสอบอาจทรงพลังได้มาก โดยเฉพาะถ้าสามารถใส่การชี้นำจากเอเจนต์ไว้ระหว่างทางได้
https://en.wikipedia.org/wiki/Evolved_antenna
สำหรับจุดเริ่มต้น: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
สงสัยว่าความคาดหวังทั่วไปที่ว่าทฤษฎีที่แท้จริงควรมีความ งดงามและสง่างาม อยู่ที่ใดสักแห่ง จะอยู่รอดไปได้อีกศตวรรษไหม ถ้าปรากฏการณ์ธรรมชาติจริง ๆ แล้วอธิบายได้ดีที่สุดด้วยกองสมการที่ยุ่งเหยิงน่ากลัว ซึ่งมีแต่เครื่องจักรเท่านั้นที่จัดการและอนุมานได้ ก็คงน่าเศร้าไม่น้อย
มุกที่ว่านักฟิสิกส์สมมติว่าเป็น “วัวทรงกลมสมบูรณ์แบบ” ก็อยู่ในบริบทนี้ และจริง ๆ แล้วแก่นของเรียงความ “ประสิทธิผลอันไร้เหตุผลของคณิตศาสตร์” ก็ใกล้เคียงกัน คือเป็นเรื่องที่น่าทึ่งอย่างไร้เหตุผลว่าการประมาณทางคณิตศาสตร์อธิบายโลกได้ดีขนาดนั้น
มีดโกนของอ็อกคัมเป็นฮิวริสติกที่มีประโยชน์ แต่ก็ทำให้เราเอนเอียงไปทางคำอธิบายที่เรียบง่ายกว่าเช่นกัน
หนึ่งในการใช้งานที่ยอดเยี่ยมของการออกแบบด้วย AI คือ การปนเปื้อนสิทธิบัตร ใช้ AI สร้างแบบดัดแปลงจำนวนมากแล้วเผยแพร่ไว้บนเว็บไซต์ ต่อมาเมื่อมีสิทธิบัตรออกมา ก็ใช้ส่วนที่ทับซ้อนกันทำให้สิทธิบัตรเป็นโมฆะ หรืออย่างน้อยก็ทำให้ขอบเขตแคบลงได้ เพราะการทำให้สิทธิบัตรมีลักษณะทั่วไปถูกจำกัดด้วยงานก่อนหน้า
ต่อมาเขาอธิบายตรรกะของตัวเองในงาน TEDx ท้องถิ่นและได้รับความสนใจพอสมควร [1] เท่าที่จำได้ นักวิเคราะห์กฎหมายไม่ค่อยตื่นเต้น โดยบอกว่าผู้พิพากษาแยกแยะความแตกต่างที่ละเอียดกว่านี้มากเป็นเรื่องปกติอยู่แล้ว ถึงอย่างนั้นก็เป็นความพยายามที่น่ารักดี
[0] https://allthemusic.info/
[1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
https://www.the-independent.com/tech/music-copyright-algorit...
น่าหงุดหงิดนิดหน่อย AI ทำอะไรได้มากก็จริง แต่การเอา LLM, มอนติคาร์โล, อัลกอริทึมเชิงพันธุกรรม, ระบบผู้เชี่ยวชาญ และเวทมนตร์เชิงสถิติอื่น ๆ แบบดั้งเดิมอย่าง แมชชีนเลิร์นนิง มาปะปนกันเรื่อย ๆ ทำให้กิจกรรมแมชชีนเลิร์นนิงที่เป็นกลางทางศีลธรรมและเป็นที่ยอมรับอยู่แล้ว ถูกผูกเข้ากับความกังวลเกี่ยวกับ LLM และ Stable Diffusion อย่างก้าวร้าวเกินไป
และก็อดคิดไม่ได้ว่านั่นอาจเป็นเจตนา
เวลาต้องการบอกว่ามีความก้าวหน้าครั้งใหญ่ในบางสิ่ง การเชื่อมเข้ากับความเข้าใจแบบวิทยาศาสตร์ยอดนิยมที่ว่าไซไฟทำนายความสำเร็จของมนุษย์ เป็นวิธีที่ใช้แรงน้อยแต่ได้ผลมาก ถ้าลำดับความสำคัญอันดับหนึ่งคือทำให้คนตื่นเต้น ก็ไม่ใช่การสื่อสารอย่างแม่นยำ
คำว่า “มนุษย์ไม่เคยแม้แต่จะจินตนาการได้” ดูเหมือนจะพูดเกินจริง ถึงอย่างนั้น ก็ดูเป็นไปได้มากที่อัลกอริทึม machine learning จะใช้ brute-force search ไปถึงการออกแบบชิปที่ไม่มีใครเคยลองมาก่อน และบางส่วนในนั้นอาจมีประโยชน์กับเรา นับว่าเป็นงานที่ค่อนข้างสมเหตุสมผลสำหรับคอมพิวเตอร์
สิ่งหนึ่งที่พอได้จากบทความคือ เพื่อสร้างความก้าวหน้าแบบนี้ จำเป็นต้องทิ้งบล็อกพื้นฐานของการออกแบบชิปที่ผ่านการพิสูจน์แล้วไป ผมสงสัยว่าเรื่องเดียวกันนี้จะใช้กับการเขียนโค้ดทั่วไปด้วยไหม นวัตกรรมสุดน่าทึ่งของการเขียนโค้ดด้วย AI จริง ๆ แล้วถูก Rust และ Python ขวางทางอยู่หรือเปล่า? เราควรปล่อยให้เครื่องมือ AI เขียนโค้ดในระดับต่ำที่สุดเท่าที่จะเป็นไปได้ไปเลยไหม?
ทำให้นึกถึงบทความเก่านี้: https://www.damninteresting.com/on-the-origin-of-circuits/
เป็นหนึ่งในขุมทรัพย์เล็ก ๆ ที่เจอบนอินเทอร์เน็ต
ในคอมเมนต์แถว ๆ นี้มีคนพูดถึงความแข็งแกร่งทนทานของดีไซน์ที่เติบโตในแล็บ และส่วนที่น่าสนใจที่สุดในบทความ Damn Interesting สำหรับผมก็คือข้อเท็จจริงที่ว่าโปรแกรมที่วิวัฒน์ขึ้นมานั้นแยกออกจาก FPGA ทางกายภาพเพียงตัวเดียวที่ใช้ในการฝึกไม่ได้ โมเดลเรียนรู้ RFIC ครั้งนี้ใช้ซิมูเลเตอร์ เลยสงสัยว่าคุณสมบัติของฮาร์ดแวร์กายภาพที่รันซิมูเลเตอร์จะถูกแยกออกจากการเรียนรู้ได้เพียงพอหรือไม่ จนเมื่อรันซิมูเลเตอร์บนฮาร์ดแวร์ต่างกัน ดีไซน์เหล่านั้นจะทำงานคล้ายกันหรือเปล่า
คำถามที่ชัดเจนกว่านั้นคือ ดีไซน์ที่วิวัฒน์ในซิมูเลเตอร์จะมีความหวังไหมว่าจะทำงานได้ตามคาดบนฮาร์ดแวร์กายภาพจริง สัญชาตญาณของผมสำหรับข้อหลังคือไม่น่าใช่ แต่ก็ยังดูเป็นงานวิจัยที่น่าสนใจ และผมมักคิดว่าการเข้าใจให้ถ่องแท้ว่าจริง ๆ แล้วเกิดอะไรขึ้นใน FPGA อาจเป็นเงื่อนไขเบื้องต้นก่อนจะจัดการกับ reinforcement learning ได้อย่างจริงจัง
ดีใจที่คุณโพสต์บทความนี้ และถ้ามีบทความโปรดอื่น ๆ ที่เกี่ยวข้องกับสาขานี้ก็อยากให้ส่งมาให้ด้วย
คำถามที่ใหญ่ที่สุดคือดีไซน์แบบนี้ ทนทาน แค่ไหน
ใน论文แสดงให้เห็นว่าค่าที่วัดจากอุปกรณ์จริงสอดคล้องกับการคาดการณ์ได้ดี แต่ผมหาส่วนที่พูดถึงเรื่องนี้อย่างชัดเจนในเนื้อหาไม่เจอ อีกทั้งระบบบางส่วนที่นำเสนอก็มีบล็อกย่อยที่ออกแบบแบบดั้งเดิมอยู่ด้วย ซึ่งฝั่งนั้นอาจรับภาระบางอย่างไปก็ได้
บางทีผมอาจมองในแง่ลบโดยไม่จำเป็นเพราะมันเหมือนจะมาแย่งงานผม หรือบางทีพวกเขาอาจอยากให้เราคิดแบบนั้นก็ได้
ผมคิดว่าสิ่งที่ชนะจริง ๆ คือไอเดียง่าย ๆ ที่ทนต่อความแปรปรวนจากการผลิตและสภาพแวดล้อม รวมถึงข้อจำกัดของโมเดลได้ เช่น feedback หรือ symmetry แต่สิ่งที่เห็นตรงนี้แทบจะตรงกันข้าม ผมเคย blind-optimize พารามิเตอร์วงจรมาหลายครั้ง และสุดท้ายพอรู้ตัวว่า “ตรงนี้ต้องมี symmetry” หรือ “ตรงนี้ต้องมี bandwidth มากกว่านี้” ซึ่งเป็นไอเดียง่าย ๆ ที่พลาดไป ทุกอย่างก็สมเหตุสมผลขึ้นทันที เลยสงสัยว่าถ้าปรับแค่ไม่กี่พิกเซลของโครงสร้างนี้ อะไรที่ง่ายกว่านี้จะปรากฏออกมาหรือเปล่า
และก็คงต้องกล่าวถึง “evolved antenna” ตามธรรมเนียมด้วย
ตามเนื้อหา บทบาทของ AI คือแทนที่ซิมูเลเตอร์แม่เหล็กไฟฟ้าในกระบวนการ optimization เพื่อประเมินพฤติกรรมของโครงสร้าง และบอกว่าเร็วกว่า simulation หลายลำดับขนาด
ฟังดูเข้าท่า แต่ถ้าจะให้เชื่อ ผมอยากเห็นความแตกต่างระหว่างการประเมินของ AI กับการวัดจริงสำหรับเรขาคณิตที่ต่างจากที่ใช้ฝึก AI มาก ๆ และยังต้องเห็นด้วยว่าเอาความเร็วของโมเดล AI ไปเทียบกับซิมูเลเตอร์ตัวไหนกันแน่
ในสนามแม่เหล็กไฟฟ้าและวงจรอิเล็กทรอนิกส์ มีแนวทาง simulation หลายแบบที่แลกความแม่นยำกับความเร็ว ดังนั้นผมยังไม่แน่ใจว่า inference ของ AI จะใช้เวลาน้อยกว่า simulation ความแม่นยำต่ำที่เร็วกว่าอย่างมีนัยสำคัญเสมอไป simulation แบบนั้นก็อาจแม่นยำและน่าเชื่อถือกว่า AI ประเมินด้วยซ้ำ
ในเมื่อมีคนพูดไปก่อนแล้ว ขอเสริมเกี่ยวกับประเด็น “ตระหนักถึงไอเดียที่ค่อนข้างเรียบง่าย” ว่าผมคิดว่าข้อดีใหญ่ข้อหนึ่งของการออกแบบโดยมีคอมพิวเตอร์ช่วยแบบนี้คือ “innovization”[1] แม้จะเป็นคำที่ค่อนข้างเก้ ๆ กัง ๆ แต่แก่นของมันคือระบบแบบนี้พาเราไปสู่ความเข้าใจที่ลึกขึ้นเกี่ยวกับกระบวนการบางอย่าง เวลาเจอกับตัวจริง ๆ แล้วเป็นความรู้สึกที่ค่อนข้างสนุก
[1]: https://dl.acm.org/doi/10.1145/1143997.1144266
วิธีที่อธิบายในบทความนี้ไม่ใช่ของใหม่ นักวิทยาศาสตร์ออกแบบเสาอากาศด้วย genetic algorithms มาหลายสิบปีแล้ว เป็นของที่ไม่มีใครเข้าใจแต่ทำงานได้ดี
มันไม่ได้มหัศจรรย์ขนาดนั้น อย่างที่บทความบอก การออกแบบ RFIC เป็นเหมือนมนตร์ดำที่พึ่งพาความรู้และประสบการณ์ของผู้ออกแบบอย่างมาก เกินกว่า RF engineering ทั่วไปไปไกล และได้รับความช่วยเหลือจากเครื่องมือ modeling/ออกแบบที่เมื่อไม่กี่สิบปีก่อนคงระดับซูเปอร์คอมพิวเตอร์
สิ่งที่ AI ทำได้คือสำรวจผลลัพธ์ที่เป็นไปได้ทั้งหมดแบบ breadth-first แล้วเลือกตัวที่มี performance ดีที่สุด ซึ่งต่างจากวิธีที่มนุษย์บอกว่า “เส้นทางนี้ดูดี ลองขุดต่อกันเถอะ”