1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • RFIC เป็นรากฐานของเทคโนโลยีไร้สายอย่าง 5G, เรดาร์รถยนต์ และการสื่อสารผ่านดาวเทียม แต่ยังคงเป็น โจทย์ยากที่พึ่งพางานด้วยมือเป็นหลัก เพราะต้องปรับให้สอดคล้องกันทั้งแม่เหล็กไฟฟ้า ความร้อน และความน่าเชื่อถือของแพ็กเกจจิง
  • นักวิจัยจาก Princeton ไม่ได้เริ่มจากเทมเพลตการออกแบบของมนุษย์ แต่ผสาน reinforcement learning กับ inverse design เพื่อสำรวจตั้งแต่ศูนย์ทั้งสถาปัตยกรรม โทโพโลยีของวงจร พารามิเตอร์ของอุปกรณ์ และอินเทอร์เฟซแม่เหล็กไฟฟ้า
  • อีมูเลเตอร์ที่ขับเคลื่อนด้วย AI คาดการณ์ scattering parameters ของโครงสร้างแม่เหล็กไฟฟ้า 2 มิติใด ๆ ได้ในระดับมิลลิวินาที ช่วยลดการวนซ้ำของ electromagnetic solver แบบเดิมที่ใช้เวลาระดับนาทีถึงชั่วโมงได้อย่างมาก
  • ในปี 2023 งานออกแบบ power amplifier ย่านมิลลิเมตรเวฟ 30~100GHz ให้ผลลัพธ์ที่มี การผสมผสานระหว่าง bandwidth, output และ efficiency ดีที่สุดในบรรดา power amplifier แบบซิลิคอนในเวลานั้น และในปี 2024 ยังสร้างโครงสร้าง multiport IC ได้ภายในระดับนาที
  • AI อาจสร้างวงจรที่ใช้งานไม่ได้ จึงยังต้องมีมนุษย์กำกับในการตรวจสอบ และหากจะไปสู่โมเดลทั่วไป จำเป็นต้องมี ระบบนิเวศแบบเปิด สำหรับแบ่งปันข้อมูลการออกแบบ RFIC และแอนะล็อกที่ติดข้อจำกัด NDA

เหตุผลที่การออกแบบ RFIC ยังถูกมองเป็น “มนตร์ดำ”

  • RFIC คือวงจรสำคัญที่ทำให้อุปกรณ์ส่งและรับข้อมูลแบบไร้สายได้ และความก้าวหน้าของ รถยนต์ไร้คนขับ, การสื่อสารควอนตัม, 6G และการสื่อสารผ่านดาวเทียมก็ล้วนพึ่งพาชิป RF ที่ก้าวหน้ากว่าเดิม
  • การออกแบบ CPU หรือ GPU ใกล้เคียงกับวิทยาศาสตร์ที่มีมาตรฐานมากขึ้นแล้ว แต่การออกแบบ RF ยังมีลักษณะเป็น ทักษะที่พึ่งพางานด้วยมือ ซึ่งต้องสั่งสมจากประสบการณ์ยาวนาน
  • การออกแบบ RFIC ต้องรับมือกับหลายโดเมนทางฟิสิกส์พร้อมกัน
    • สมการ Maxwell กำหนดวิธีที่สนามแม่เหล็กไฟฟ้ามีปฏิสัมพันธ์กับอุปกรณ์ active และ passive
    • เทอร์โมไดนามิกส์กำหนดวิธีที่ความร้อนถูกสร้างและถูกระบายออกระหว่างการทำงาน
    • การขยายตัวและหดตัวจากความร้อนเกี่ยวข้องกับการที่ชิปและแพ็กเกจจะทนต่อการเปลี่ยนแปลงอุณหภูมิได้อย่างเสถียรหรือไม่
  • เพราะต้องพิจารณาข้อจำกัดทางฟิสิกส์ทั้งหมดพร้อมกัน พื้นที่การออกแบบจึงใหญ่มาก และมักเกิด trade-off ที่เมื่อเพิ่มตัวชี้วัดประสิทธิภาพหนึ่ง อีกตัวชี้วัดกลับแย่ลง

เวิร์กโฟลว์การออกแบบ RFIC แบบดั้งเดิมและคอขวด

  • หากต้องออกแบบ power amplifier 28GHz สำหรับสมาร์ตโฟน 5G ย่านมิลลิเมตรเวฟ ต้องเริ่มจากการกำหนดสถาปัตยกรรมและโทโพโลยีของวงจรก่อน
  • สถาปัตยกรรม RFIC กำหนดองค์ประกอบที่ต้องมีและเส้นทางสัญญาณ คล้ายพิมพ์เขียวของบ้าน
    • ใน power amplifier จำนวนสเตจขยายสัญญาณเป็นองค์ประกอบสำคัญ
    • พื้นที่ส่วนใหญ่ของ RFIC ไม่ได้ถูกครอบครองโดยทรานซิสเตอร์ แต่เป็น อุปกรณ์ passive อย่างอินดักเตอร์ สายส่งสัญญาณ และโครงสร้างแม่เหล็กไฟฟ้า
  • สัญญาณ 5G ทำงานที่ 28GHz และ 39GHz, การสื่อสารผ่านดาวเทียมทำงานที่ 26.5~40GHz ขึ้นไป และเรดาร์รถยนต์ทำงานที่ 77GHz โดย RFIC จะจัดการพลังงานสัญญาณที่ความถี่สูงเหล่านี้ผ่านโครงสร้างแม่เหล็กไฟฟ้าที่ละเอียดซับซ้อน
  • หากเส้นทางสัญญาณไม่เข้ากันกับองค์ประกอบถัดไปอย่างเหมาะสม จะเกิดปัญหา impedance matching ที่พลังงานไม่ไหลไปข้างหน้าแต่สะท้อนกลับ
    • วิศวกรออกแบบโครงสร้าง transition ขนาดเล็กระหว่างองค์ประกอบต่าง ๆ เพื่อลดการสะท้อน
    • โครงสร้างนี้ใช้ได้ทั้งการส่งผ่านสัญญาณ รวมถึงการแยก การรวม และการกระจายไปหลายเส้นทาง
  • หากไม่ผ่านสเปก ต้องกลับไปแก้โทโพโลยีหรือสถาปัตยกรรมแล้วทำซิมูเลชันซ้ำ และการออกแบบชิปใหม่หนึ่งตัวอาจใช้เวลาหลายปีและเงินหลายสิบล้านถึงหลายร้อยล้านดอลลาร์

แนวทางออกแบบด้วย AI ที่หลุดจากเทมเพลต

  • งานวิจัยก่อนหน้าใช้ machine learning เพื่อปรับแต่งเทมเพลตวงจรให้เหมาะสม แต่ยังคงพึ่งพา ไลบรารีการออกแบบเดิม ที่มนุษย์สร้างไว้
  • เป้าหมายของนักวิจัยจาก Princeton คือให้อัลกอริทึมกำหนดพารามิเตอร์ทั้งหมดของสถาปัตยกรรม วงจรประกอบ และโครงสร้าง passive ทางแม่เหล็กไฟฟ้า ตั้งแต่ต้นโดยไม่มีโทโพโลยีที่เตรียมไว้ล่วงหน้า
  • วิธีนี้มีจุดเริ่มต้นต่างจากการ optimize แบบเดิม
    • วิธีเดิมปรับพารามิเตอร์อย่างขนาดทรานซิสเตอร์หรือรูปทรงของอุปกรณ์ passive บนโครงสร้างที่มนุษย์สร้างขึ้น
    • วิธีใหม่เริ่มจากสภาพที่เกือบว่างเปล่า สร้างชุดวงจรผู้สมัคร ทำแผนที่ trade-off ด้านประสิทธิภาพ และสำรวจพื้นที่การออกแบบ
  • แนวทางนี้พัฒนากลยุทธ์การออกแบบด้วยการสำรวจและประเมินด้วยตัวเอง มากกว่าการเลียนแบบตัวอย่างมนุษย์ คล้าย AlphaGo Zero
  • อัลกอริทึมเรียนรู้วงจร แม่เหล็กไฟฟ้า และ co-design ระหว่างทั้งสอง เพื่อมุ่งสู่การออกแบบ RFIC แบบ end-to-end

การผสาน reinforcement learning กับ inverse design

  • ขั้นแรกคือเฟรมเวิร์ก reinforcement learning เพื่อกำหนดสถาปัตยกรรมระบบที่เหมาะที่สุด โทโพโลยีของวงจร พารามิเตอร์ของอุปกรณ์ และลักษณะของอินเทอร์เฟซแม่เหล็กไฟฟ้า
  • เอเจนต์ reinforcement learning ลองชุดค่าต่าง ๆ คล้ายคอมพิวเตอร์ที่เรียนรู้เกม สังเกตความสัมพันธ์ระหว่างการกระทำกับคะแนน แล้วค้นหาวงจรที่ดีขึ้นเรื่อย ๆ
    • การฝึกใช้เวลา หลายวันถึงหนึ่งสัปดาห์
    • หลังฝึกเสร็จแล้ว สามารถออกแบบวงจรได้เร็วมาก
  • ขั้นที่สองคือ inverse design เพื่อค้นหาโครงสร้างแม่เหล็กไฟฟ้าทางกายภาพที่สร้าง scattering parameters ตามต้องการ
    • scattering parameters วัดว่าสัญญาณเมื่อเข้าไปในองค์ประกอบแล้วเดินหน้าไปต่อหรือสะท้อนกลับ
    • คล้ายวิธีในวิศวกรรมโครงสร้างที่ค้นหารูปโค้งหรือโครงค้ำเพื่อสร้างพื้นที่เป้าหมาย
  • inverse design สำหรับ RFIC แก้ด้วยการค้นหาแบบทำมือซ้ำ ๆ ได้ยาก เพราะต้องปรับให้การทำงานของวงจรเข้ากับการตอบสนองแม่เหล็กไฟฟ้าของ interconnect และอุปกรณ์ passive พร้อมกัน

อีมูเลเตอร์ AI ที่ลดการวนซ้ำในการออกแบบแม่เหล็กไฟฟ้า

  • นักวิจัยแทนที่ RF circuit simulator ด้วย อีมูเลเตอร์ ที่ขับเคลื่อนด้วย AI
  • โมเดลนี้รับโครงสร้าง 2 มิติใด ๆ เป็นอินพุต แล้วคาดการณ์ scattering parameters โดยไม่ต้องคำนวณสมการ Maxwell โดยตรง
    • งานที่ electromagnetic solver แบบเดิมใช้เวลาระดับนาทีถึงชั่วโมง ถูกลดเหลือระดับ มิลลิวินาที
  • อีมูเลเตอร์สร้างขึ้นบนพื้นฐานของ convolutional neural network ซึ่งเก่งด้านการประมวลผลภาพ
    • ภาพของโครงสร้างมีข้อมูลเชิงพื้นที่ที่ใช้คาดการณ์ประสิทธิภาพทางแม่เหล็กไฟฟ้าได้
    • นักวิจัยฝึกโมเดลด้วยโครงสร้างพิกเซลแบบสุ่มจำนวนมากที่มี scattering parameters เป็น label
  • การผสาน inverse design ที่ใช้ reinforcement learning กับอีมูเลเตอร์ AI ทำให้เกิด end-to-end AI designer และนำไปใช้กับการออกแบบ power amplifier

ผลลัพธ์สถาปัตยกรรม RF ที่ต่างจากมนุษย์

  • proof of concept ที่เผยแพร่ในปี 2023 มุ่งเป้าไปที่ power amplifier ย่านมิลลิเมตรเวฟ 30~100GHz
    • ช่วงนี้ครอบคลุมความถี่ส่วนใหญ่ที่เกี่ยวข้องกับ 5G และเรดาร์
    • การออกแบบสุดท้ายมีการผสมผสานของ wide bandwidth, output power และ efficiency ที่ดีที่สุดในบรรดา power amplifier แบบซิลิคอนในเวลานั้น และยังรักษา record efficiency ไว้ได้
  • เส้นทางแม่เหล็กไฟฟ้าที่สร้างขึ้นดูเหมือนแพตเทิร์นสุ่มหรือ QR code ต่างจากโครงสร้างปกติและสมมาตรที่มนุษย์มักพิจารณา
  • ผลลัพธ์นี้แสดงให้เห็นว่าไม่มีหลักประกันว่าเทมเพลตที่ใช้กันมาในอดีตจะใกล้เคียงกับจุดเหมาะสมที่สุดสำหรับเป้าหมายการออกแบบยุคใหม่
  • ต่อมานักวิจัยขยายโมเดลไปยังโครงสร้างที่มีพอร์ตอินพุตและเอาต์พุตจำนวนมาก
    • พอร์ต 2 พอร์ตมี scattering parameters 4 ค่า ส่วน 4 พอร์ตมี 16 ค่า ทำให้ความซับซ้อนเพิ่มขึ้นอย่างรวดเร็ว
    • งานวิจัย multiport integrated circuits ปี 2024 แสดงให้เห็นว่าอัลกอริทึม AI สามารถจัดการโครงสร้าง multiport ได้เช่นกัน
    • ก่อนหน้านี้การจำลองแม่เหล็กไฟฟ้าแบบ multiport ต้องใช้เวลาหลายวันหรือหลายสัปดาห์ แต่โมเดลนี้วิวัฒน์โครงสร้างใหม่ได้ในระดับนาที
  • มีการแสดงเวิร์กโฟลว์ที่ผสานเฟรมเวิร์ก reinforcement learning กับ inverse design เพื่อสร้างจากสเปกไปจนถึง fabrication-ready layout และนำไปใช้กับ low-noise amplifier, subterahertz และ broadband power amplifiers

การออกแบบ AI ที่ตีความได้

  • การทดสอบและดีบัก RFIC อาจใช้เวลานานเท่ากับการออกแบบหรือยากกว่า วิศวกรจึงชอบ โครงสร้างที่ตีความได้ ซึ่งสามารถเข้าใจและแก้ไขได้เมื่อเกิดปัญหา
  • นักวิจัยนำ diffusion models ที่ใช้ใน AI สร้างภาพมาใช้กับการสร้างโครงสร้าง RFIC
  • แทนที่จะใช้ text prompt ใช้ scattering parameters เป็นอินพุต และสร้างโครงสร้างแม่เหล็กไฟฟ้าของ RFIC เป็นเอาต์พุต
  • ใส่ spatial-frequency dial เข้าไปในอินพุต เพื่อให้ผู้ออกแบบควบคุมรูปร่างของโครงสร้างผลลัพธ์ได้
    • spatial frequency ต่ำ: รูปทรงคลาสสิกและตีความได้
    • spatial frequency ปานกลาง: โครงสร้างคล้ายเขาวงกต
    • spatial frequency สูง: โครงสร้างแบบพิกเซลหรือใกล้เคียงรูปทรงสุ่ม
  • กระบวนการทั้งหมดตั้งแต่ prompt จนถึงเอาต์พุตใช้เวลาประมาณ 6 นาที และหากเป็น scattering parameters ที่สามารถเกิดขึ้นได้ทางกายภาพภายใต้สมการ Maxwell ก็สามารถสร้างโครงสร้างที่สอดคล้องกันได้

ข้อจำกัดที่เหลือและโจทย์ด้านข้อมูล

  • วิธีออกแบบที่ใช้ AI ได้รับความสนใจจากชุมชน RF และเริ่มพลิกเวิร์กโฟลว์การออกแบบแบบ bottom-up ดั้งเดิม
  • ยังมีคำถามที่ยังไม่ได้รับคำตอบ
    • วิธีนี้จะ generalize ได้มากแค่ไหน
    • สามารถให้ประสิทธิภาพสูงอย่างสม่ำเสมอได้หรือไม่
    • สามารถ optimize trade-off ทั้งหมดที่เป็นไปได้แบบองค์รวมได้หรือไม่
    • สามารถประดิษฐ์วงจรอื่น ๆ ที่มนุษย์ไม่เคยสร้างมาก่อน นอกเหนือจาก RFIC ได้หรือไม่
  • AI อาจเกิด hallucination โดยสร้างวงจรแย่ ๆ ที่ใช้งานไม่ได้ จึงยังต้องมีมนุษย์กำกับในการตรวจสอบต่อไป
  • การสร้าง foundational model แบบทั่วไปต้องใช้ข้อมูลขนาดใหญ่เพื่อเรียนรู้กฎที่ควบคุมแม่เหล็กไฟฟ้าและการทำงานของวงจร
    • ImageNet เป็นตัวอย่างที่ทำให้โมเดล image recognition generalize ได้ ด้วยภาพหลากหลาย 14 ล้านภาพที่มี label จากมนุษย์
    • การออกแบบ RFIC และแอนะล็อกก็ต้องการข้อมูลที่มีขนาดและความหลากหลายใกล้เคียงกัน
  • ข้อมูลจำนวนมากมีอยู่ในการจำลองของบริษัทและห้องวิจัยทั่วโลก แต่ส่วนใหญ่ถูกกั้นไว้หลัง NDA
  • Natcast ดำเนิน U.S. CHIPS and Science Act’s R&D program และเคยสามารถเสริมโครงสร้างพื้นฐานร่วมกับนวัตกรรมสำหรับเทคโนโลยีไร้สายยุคถัดไป การรับรู้ และการป้องกันประเทศได้ แต่ตัวองค์กรและ โปรแกรม ที่เกี่ยวข้องกับ machine learning และ RFIC ถูกยุติลง
  • หากวงการ RFIC ขยายความร่วมมือระหว่างนักวิจัย AI กับนักออกแบบชิป และสร้างระบบนิเวศแบบเปิด ก็จะสามารถใช้ศักยภาพของการออกแบบ IC ที่ขับเคลื่อนด้วย AI ได้มากขึ้น

1 ความคิดเห็น

 
GN⁺ 4 시간 전
ความคิดเห็นจาก Hacker News
  • ทำให้นึกถึง การค้นหาด้วยอัลกอริทึมเชิงพันธุกรรม ในอดีต วิธีเดาแล้วตรวจสอบอาจทรงพลังได้มาก โดยเฉพาะถ้าสามารถใส่การชี้นำจากเอเจนต์ไว้ระหว่างทางได้
    https://en.wikipedia.org/wiki/Evolved_antenna

    • กำลังจะพูดเรื่องคล้ายกันเลย จำได้ว่ามีเกร็ดเรื่องการใช้อัลกอริทึมเชิงพันธุกรรมสร้าง ออสซิลเลเตอร์ ที่มีจำนวนชิ้นส่วนน้อยที่สุด สุดท้ายสำเร็จด้วยสายไฟเส้นเดียวจนทำให้คนประหลาดใจ กล่าวคือมันเป็นเสาอากาศที่รับสัญญาณ RF รบกวนในบริเวณใกล้เคียงนั่นเอง
    • มีอันนี้ด้วย: https://en.wikipedia.org/wiki/Evolvable_hardware
      สำหรับจุดเริ่มต้น: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
  • สงสัยว่าความคาดหวังทั่วไปที่ว่าทฤษฎีที่แท้จริงควรมีความ งดงามและสง่างาม อยู่ที่ใดสักแห่ง จะอยู่รอดไปได้อีกศตวรรษไหม ถ้าปรากฏการณ์ธรรมชาติจริง ๆ แล้วอธิบายได้ดีที่สุดด้วยกองสมการที่ยุ่งเหยิงน่ากลัว ซึ่งมีแต่เครื่องจักรเท่านั้นที่จัดการและอนุมานได้ ก็คงน่าเศร้าไม่น้อย

    • คำว่า “ความคาดหวังทั่วไป” นั้นดูจะเกินไปหน่อย คนส่วนใหญ่เข้าใจทฤษฎีวิทยาศาสตร์ว่าเป็น การประมาณ F=ma ก็ถูกต้องเฉพาะในขอบเขตของกลศาสตร์นิวตันเท่านั้น และแต่ละพจน์ก็มีเงื่อนไขกำกับมากมาย การวัดจริงจึงเป็นเพียงการประมาณเสมอ
      มุกที่ว่านักฟิสิกส์สมมติว่าเป็น “วัวทรงกลมสมบูรณ์แบบ” ก็อยู่ในบริบทนี้ และจริง ๆ แล้วแก่นของเรียงความ “ประสิทธิผลอันไร้เหตุผลของคณิตศาสตร์” ก็ใกล้เคียงกัน คือเป็นเรื่องที่น่าทึ่งอย่างไร้เหตุผลว่าการประมาณทางคณิตศาสตร์อธิบายโลกได้ดีขนาดนั้น
    • มักคิดแบบนี้เวลาเห็นการแพทย์กับร่างกายมนุษย์ เราอยากเชื่อว่าร่างกายเป็นเครื่องจักรที่หล่อลื่นมาอย่างดีราวปาฏิหาริย์ แต่ในความเป็นจริง หลายครั้งมันดูเหมือน ถุงเละเทะ ที่แทบจะประคองตัวอยู่ได้มากกว่า
    • ช่วงนี้ฉันก็คิดเรื่องนี้บ่อย โดยเฉพาะเมื่อเห็นว่ามี บทพิสูจน์ที่เครื่องจักรตรวจสอบได้ จำนวนมากที่เข้าใจยาก
      มีดโกนของอ็อกคัมเป็นฮิวริสติกที่มีประโยชน์ แต่ก็ทำให้เราเอนเอียงไปทางคำอธิบายที่เรียบง่ายกว่าเช่นกัน
    • กลับกัน มันคงเจ๋งมาก ระดับต่ำสุด เรารู้อยู่แล้วว่าทุกอย่างเป็น เมฆความน่าจะเป็น มีความงามและความสบายใจอยู่ในความจริงที่ว่าไม่มีสิ่งใดกำหนดได้อย่างแน่นอนตลอดกาล
    • “ความคาดหวังทั่วไป” ดูจะพลาดประเด็นไป ไม่ได้หมายความว่าทฤษฎีพื้นฐานต้องเรียบง่ายหรือสง่างาม แต่ใกล้เคียงกับความหมายที่ว่า ถ้าต้องเลือกระหว่างทฤษฎีที่ซับซ้อนกว่ากับทฤษฎีที่เรียบง่ายกว่า โดยทั่วไป ทฤษฎีที่เรียบง่ายที่สุด มักเป็นตัวเลือกที่ถูกต้องกว่า สมการฟิสิกส์ควอนตัมเองก็ค่อนข้างไม่สวยเหมือนกัน
  • หนึ่งในการใช้งานที่ยอดเยี่ยมของการออกแบบด้วย AI คือ การปนเปื้อนสิทธิบัตร ใช้ AI สร้างแบบดัดแปลงจำนวนมากแล้วเผยแพร่ไว้บนเว็บไซต์ ต่อมาเมื่อมีสิทธิบัตรออกมา ก็ใช้ส่วนที่ทับซ้อนกันทำให้สิทธิบัตรเป็นโมฆะ หรืออย่างน้อยก็ทำให้ขอบเขตแคบลงได้ เพราะการทำให้สิทธิบัตรมีลักษณะทั่วไปถูกจำกัดด้วยงานก่อนหน้า

    • นึกถึงการตอบโต้เชิงการแสดงของทนาย Damien Riehl ตอนคดีตัดสินการละเมิดของ Sam Smith ในปี 2019/2020 เขาอ้างว่าได้ร่วมกับโปรแกรมเมอร์ Noah Rubin สร้างเมโลดี้ที่เป็นไปได้ทั้งหมดภายในปริภูมิการจัดชุดหนึ่งด้วยอัลกอริทึมในรูปแบบ MIDI และเผยแพร่ภายใต้ ไลเซนส์ CC-0 [0]
      ต่อมาเขาอธิบายตรรกะของตัวเองในงาน TEDx ท้องถิ่นและได้รับความสนใจพอสมควร [1] เท่าที่จำได้ นักวิเคราะห์กฎหมายไม่ค่อยตื่นเต้น โดยบอกว่าผู้พิพากษาแยกแยะความแตกต่างที่ละเอียดกว่านี้มากเป็นเรื่องปกติอยู่แล้ว ถึงอย่างนั้นก็เป็นความพยายามที่น่ารักดี
      [0] https://allthemusic.info/
      [1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
      https://www.the-independent.com/tech/music-copyright-algorit...
  • น่าหงุดหงิดนิดหน่อย AI ทำอะไรได้มากก็จริง แต่การเอา LLM, มอนติคาร์โล, อัลกอริทึมเชิงพันธุกรรม, ระบบผู้เชี่ยวชาญ และเวทมนตร์เชิงสถิติอื่น ๆ แบบดั้งเดิมอย่าง แมชชีนเลิร์นนิง มาปะปนกันเรื่อย ๆ ทำให้กิจกรรมแมชชีนเลิร์นนิงที่เป็นกลางทางศีลธรรมและเป็นที่ยอมรับอยู่แล้ว ถูกผูกเข้ากับความกังวลเกี่ยวกับ LLM และ Stable Diffusion อย่างก้าวร้าวเกินไป
    และก็อดคิดไม่ได้ว่านั่นอาจเป็นเจตนา

    • ปัญหาคือเวลาคนพูดว่า AI ทำอะไรได้ ก็มักสื่อเป็นนัยเหมือนว่า LLM ทำสิ่งนั้นได้ด้วย จึงดูเหมือน LLM ล้วน ๆ ทำได้แทบทุกอย่าง ในทางกลับกัน ก็มีคนบอกว่า AI จะไม่มีวันทำ X ได้ เพียงเพราะ LLM ทำสิ่งนั้นได้ไม่ดีโดยพื้นฐาน คำว่า AI คลุมเครือจนประโยชน์ลดลงแล้ว
    • อยากโบกไม้กายสิทธิ์แล้วลบ คำว่า AI ออกไปเลย มันแทบไม่มีความหมายจริง ๆ จะใช้เรียกอะไรก็ได้ตั้งแต่ตัวละครคู่แข่งใน Mario Kart ไปจนถึง Stable Diffusion
    • “AI” เป็นคำที่ถูกสาปด้วยนัยแบบไซไฟเท่ ๆ จึงทรงพลังในฐานะคำการตลาด คนจำนวนมากคุ้นเคยกับ AI ในไซไฟ และความเชื่อที่ว่า “สื่อบางอย่างทำนายเทคโนโลยีบางอย่างไว้” ก็แพร่หลายพอสมควรสำหรับ X อย่าง Star Trek, The Hitchhiker's Guide to the Galaxy, Arthur C. Clarke กับ Y อย่างอินเทอร์เน็ต โทรศัพท์มือถือ VR
      เวลาต้องการบอกว่ามีความก้าวหน้าครั้งใหญ่ในบางสิ่ง การเชื่อมเข้ากับความเข้าใจแบบวิทยาศาสตร์ยอดนิยมที่ว่าไซไฟทำนายความสำเร็จของมนุษย์ เป็นวิธีที่ใช้แรงน้อยแต่ได้ผลมาก ถ้าลำดับความสำคัญอันดับหนึ่งคือทำให้คนตื่นเต้น ก็ไม่ใช่การสื่อสารอย่างแม่นยำ
    • ดังนั้นจึงกำลังฝึกเรียกแมชชีนเลิร์นนิงแบบดั้งเดิมว่า ML และเรียกโมเดลภาษาขนาดใหญ่ว่า LLM จะพยายามไม่ใช้คำว่า AI อีกแล้ว คลุมเครือเกินไป แม้ตอนพูดถึง AI ในเกม ก็พยายามใช้ตัวย่อของอัลกอริทึมที่ AI นั้นน่าจะใช้ บางทีก็เรียกว่าโฟลว์ชาร์ต แต่ก็ไม่แน่ใจว่าภายในจริง ๆ เป็นโฟลว์ชาร์ตหรือไม่
    • เหมือนกับที่สาขาแมชชีนเลิร์นนิงที่ประสบความสำเร็จกว่าในช่วง AI winter เคยตีตัวออกห่างจากคำนี้ ตอนนี้เป็น AI summer แล้ว ก็คงได้เห็นคนหันกลับมายอมรับคำนั้นอีก และบางทีตอนนี้ก็อาจกำลังเป็นแบบนั้นอยู่แล้ว
  • คำว่า “มนุษย์ไม่เคยแม้แต่จะจินตนาการได้” ดูเหมือนจะพูดเกินจริง ถึงอย่างนั้น ก็ดูเป็นไปได้มากที่อัลกอริทึม machine learning จะใช้ brute-force search ไปถึงการออกแบบชิปที่ไม่มีใครเคยลองมาก่อน และบางส่วนในนั้นอาจมีประโยชน์กับเรา นับว่าเป็นงานที่ค่อนข้างสมเหตุสมผลสำหรับคอมพิวเตอร์

    • เป็นคำโฆษณาไร้สาระ ข้อแรก มันเหมือนกับการพิสูจน์สิ่งที่เป็นปฏิเสธ จึงพิสูจน์ไม่ได้ว่ามนุษย์ไม่สามารถจินตนาการถึงสิ่งนั้นได้ ข้อสอง มนุษย์เคยจินตนาการถึง ของแปลกประหลาด มาแล้วไม่น้อย
    • เหมือน เค้กเป็นชั้น ๆ ของ machine learning ที่โรยเศษ brute-force search ไว้ข้างบน
  • สิ่งหนึ่งที่พอได้จากบทความคือ เพื่อสร้างความก้าวหน้าแบบนี้ จำเป็นต้องทิ้งบล็อกพื้นฐานของการออกแบบชิปที่ผ่านการพิสูจน์แล้วไป ผมสงสัยว่าเรื่องเดียวกันนี้จะใช้กับการเขียนโค้ดทั่วไปด้วยไหม นวัตกรรมสุดน่าทึ่งของการเขียนโค้ดด้วย AI จริง ๆ แล้วถูก Rust และ Python ขวางทางอยู่หรือเปล่า? เราควรปล่อยให้เครื่องมือ AI เขียนโค้ดในระดับต่ำที่สุดเท่าที่จะเป็นไปได้ไปเลยไหม?

    • เป็นคำถามที่น่าสนใจ แต่ดูเหมือนจะมีนัยที่ค่อนข้างน่ากังวลต่อ portability
  • ทำให้นึกถึงบทความเก่านี้: https://www.damninteresting.com/on-the-origin-of-circuits/
    เป็นหนึ่งในขุมทรัพย์เล็ก ๆ ที่เจอบนอินเทอร์เน็ต

    • ผมก็กำลังจะโพสต์อันนี้เหมือนกัน ตอนอ่านครั้งแรกผมช็อกมาก เลยดีใจที่เห็นคนอื่น ๆ ก็ชอบมันด้วย
      ในคอมเมนต์แถว ๆ นี้มีคนพูดถึงความแข็งแกร่งทนทานของดีไซน์ที่เติบโตในแล็บ และส่วนที่น่าสนใจที่สุดในบทความ Damn Interesting สำหรับผมก็คือข้อเท็จจริงที่ว่าโปรแกรมที่วิวัฒน์ขึ้นมานั้นแยกออกจาก FPGA ทางกายภาพเพียงตัวเดียวที่ใช้ในการฝึกไม่ได้ โมเดลเรียนรู้ RFIC ครั้งนี้ใช้ซิมูเลเตอร์ เลยสงสัยว่าคุณสมบัติของฮาร์ดแวร์กายภาพที่รันซิมูเลเตอร์จะถูกแยกออกจากการเรียนรู้ได้เพียงพอหรือไม่ จนเมื่อรันซิมูเลเตอร์บนฮาร์ดแวร์ต่างกัน ดีไซน์เหล่านั้นจะทำงานคล้ายกันหรือเปล่า
      คำถามที่ชัดเจนกว่านั้นคือ ดีไซน์ที่วิวัฒน์ในซิมูเลเตอร์จะมีความหวังไหมว่าจะทำงานได้ตามคาดบนฮาร์ดแวร์กายภาพจริง สัญชาตญาณของผมสำหรับข้อหลังคือไม่น่าใช่ แต่ก็ยังดูเป็นงานวิจัยที่น่าสนใจ และผมมักคิดว่าการเข้าใจให้ถ่องแท้ว่าจริง ๆ แล้วเกิดอะไรขึ้นใน FPGA อาจเป็นเงื่อนไขเบื้องต้นก่อนจะจัดการกับ reinforcement learning ได้อย่างจริงจัง
      ดีใจที่คุณโพสต์บทความนี้ และถ้ามีบทความโปรดอื่น ๆ ที่เกี่ยวข้องกับสาขานี้ก็อยากให้ส่งมาให้ด้วย
    • นี่ยังเป็นตัวอย่างของสปีชีส์ที่เฉพาะทางและถูกปรับให้เหมาะสมมากจนปรับตัวต่อไม่ได้อีกแล้วด้วย และยังเป็นตัวอย่างของ POSIWID ด้วย
  • คำถามที่ใหญ่ที่สุดคือดีไซน์แบบนี้ ทนทาน แค่ไหน
    ใน论文แสดงให้เห็นว่าค่าที่วัดจากอุปกรณ์จริงสอดคล้องกับการคาดการณ์ได้ดี แต่ผมหาส่วนที่พูดถึงเรื่องนี้อย่างชัดเจนในเนื้อหาไม่เจอ อีกทั้งระบบบางส่วนที่นำเสนอก็มีบล็อกย่อยที่ออกแบบแบบดั้งเดิมอยู่ด้วย ซึ่งฝั่งนั้นอาจรับภาระบางอย่างไปก็ได้
    บางทีผมอาจมองในแง่ลบโดยไม่จำเป็นเพราะมันเหมือนจะมาแย่งงานผม หรือบางทีพวกเขาอาจอยากให้เราคิดแบบนั้นก็ได้
    ผมคิดว่าสิ่งที่ชนะจริง ๆ คือไอเดียง่าย ๆ ที่ทนต่อความแปรปรวนจากการผลิตและสภาพแวดล้อม รวมถึงข้อจำกัดของโมเดลได้ เช่น feedback หรือ symmetry แต่สิ่งที่เห็นตรงนี้แทบจะตรงกันข้าม ผมเคย blind-optimize พารามิเตอร์วงจรมาหลายครั้ง และสุดท้ายพอรู้ตัวว่า “ตรงนี้ต้องมี symmetry” หรือ “ตรงนี้ต้องมี bandwidth มากกว่านี้” ซึ่งเป็นไอเดียง่าย ๆ ที่พลาดไป ทุกอย่างก็สมเหตุสมผลขึ้นทันที เลยสงสัยว่าถ้าปรับแค่ไม่กี่พิกเซลของโครงสร้างนี้ อะไรที่ง่ายกว่านี้จะปรากฏออกมาหรือเปล่า
    และก็คงต้องกล่าวถึง “evolved antenna” ตามธรรมเนียมด้วย

    • นี่แหละคือส่วนที่ทำให้ผมติดใจกับบทความนี้และบทความคล้าย ๆ กันในอดีต ไม่มี หลักฐาน รองรับข้ออ้างว่า AI มีประโยชน์ในการออกแบบ
      ตามเนื้อหา บทบาทของ AI คือแทนที่ซิมูเลเตอร์แม่เหล็กไฟฟ้าในกระบวนการ optimization เพื่อประเมินพฤติกรรมของโครงสร้าง และบอกว่าเร็วกว่า simulation หลายลำดับขนาด
      ฟังดูเข้าท่า แต่ถ้าจะให้เชื่อ ผมอยากเห็นความแตกต่างระหว่างการประเมินของ AI กับการวัดจริงสำหรับเรขาคณิตที่ต่างจากที่ใช้ฝึก AI มาก ๆ และยังต้องเห็นด้วยว่าเอาความเร็วของโมเดล AI ไปเทียบกับซิมูเลเตอร์ตัวไหนกันแน่
      ในสนามแม่เหล็กไฟฟ้าและวงจรอิเล็กทรอนิกส์ มีแนวทาง simulation หลายแบบที่แลกความแม่นยำกับความเร็ว ดังนั้นผมยังไม่แน่ใจว่า inference ของ AI จะใช้เวลาน้อยกว่า simulation ความแม่นยำต่ำที่เร็วกว่าอย่างมีนัยสำคัญเสมอไป simulation แบบนั้นก็อาจแม่นยำและน่าเชื่อถือกว่า AI ประเมินด้วยซ้ำ
    • ผมก็เข้ามาเพื่อพูดถึง evolved antenna เหมือนกัน
      ในเมื่อมีคนพูดไปก่อนแล้ว ขอเสริมเกี่ยวกับประเด็น “ตระหนักถึงไอเดียที่ค่อนข้างเรียบง่าย” ว่าผมคิดว่าข้อดีใหญ่ข้อหนึ่งของการออกแบบโดยมีคอมพิวเตอร์ช่วยแบบนี้คือ “innovization”[1] แม้จะเป็นคำที่ค่อนข้างเก้ ๆ กัง ๆ แต่แก่นของมันคือระบบแบบนี้พาเราไปสู่ความเข้าใจที่ลึกขึ้นเกี่ยวกับกระบวนการบางอย่าง เวลาเจอกับตัวจริง ๆ แล้วเป็นความรู้สึกที่ค่อนข้างสนุก
      [1]: https://dl.acm.org/doi/10.1145/1143997.1144266
    • ก็แค่ บทความขยะที่อวยเกินจริง
  • วิธีที่อธิบายในบทความนี้ไม่ใช่ของใหม่ นักวิทยาศาสตร์ออกแบบเสาอากาศด้วย genetic algorithms มาหลายสิบปีแล้ว เป็นของที่ไม่มีใครเข้าใจแต่ทำงานได้ดี

  • มันไม่ได้มหัศจรรย์ขนาดนั้น อย่างที่บทความบอก การออกแบบ RFIC เป็นเหมือนมนตร์ดำที่พึ่งพาความรู้และประสบการณ์ของผู้ออกแบบอย่างมาก เกินกว่า RF engineering ทั่วไปไปไกล และได้รับความช่วยเหลือจากเครื่องมือ modeling/ออกแบบที่เมื่อไม่กี่สิบปีก่อนคงระดับซูเปอร์คอมพิวเตอร์
    สิ่งที่ AI ทำได้คือสำรวจผลลัพธ์ที่เป็นไปได้ทั้งหมดแบบ breadth-first แล้วเลือกตัวที่มี performance ดีที่สุด ซึ่งต่างจากวิธีที่มนุษย์บอกว่า “เส้นทางนี้ดูดี ลองขุดต่อกันเถอะ”

    • มันจำเป็นต้องเหมือนเวทมนตร์ด้วยหรือ ถึงจะน่าสนใจหรือมีประโยชน์?