- ตรงกันข้ามกับความคาดหวังเกี่ยวกับการ ใช้ AI ในงานวิจัยฟิสิกส์พลาสมา ผลลัพธ์จากการใช้งานจริงกลับชี้ไปที่ ความสำเร็จที่ถูกพูดเกินจริงและข้อจำกัด
- วิธีการแก้ PDE (สมการเชิงอนุพันธ์ย่อย) ด้วย AI เช่น PINN ยังไม่ได้แสดงความได้เปรียบที่ชัดเจน เหนือวิธีเชิงตัวเลขแบบเดิมในด้าน ความน่าเชื่อถือและประสิทธิภาพ
- เนื่องจาก baseline ที่อ่อน (weak baseline) และ อคติในการรายงานผล งานวิจัยส่วนใหญ่เกี่ยวกับผลงานของ AI จึงประเมินผลในเชิงบวกมากเกินจริงเมื่อเทียบกับความเป็นจริง
- แม้การใช้ AI ในงานวิทยาศาสตร์จะเพิ่มขึ้นอย่างรวดเร็ว แต่มีน้ำหนักมากกว่าที่จะมองว่าเป็น การมีส่วนร่วมแบบค่อยเป็นค่อยไปและมีข้อจำกัด มากกว่าจะเป็น เครื่องมือที่ขับเคลื่อนความก้าวหน้าทางวิทยาศาสตร์แบบพลิกโฉม
- เนื่องจากโครงสร้างของบทความวิชาการและแรงจูงใจของนักวิจัย จึงเกิดการ ไม่เปิดเผยกรณีล้มเหลวและการรายงานเกินจริง ซ้ำแล้วซ้ำเล่า ทำให้จำเป็นต้องมี มุมมองเชิงสงสัยอย่างเป็นสาระสำคัญ เมื่อต้องประเมินผลกระทบของ AI ต่อวิทยาศาสตร์
บทนำและภูมิหลังของการวิจัย
- ผู้เขียน Nick McGreivy จบปริญญาเอกจาก Princeton ด้านฟิสิกส์พลาสมา แล้วหันมาศึกษาการใช้แมชชีนเลิร์นนิงด้วยความคาดหวังว่า AI จะช่วยพลิกโฉมงานวิจัยทางวิทยาศาสตร์ โดยเฉพาะฟิสิกส์
- เขาสนใจว่า AI จะสามารถเปลี่ยนแปลงวงการวิทยาศาสตร์โดยรวมได้อย่างก้าวกระโดด เหมือนเทคโนโลยีอเนกประสงค์อย่าง อิเล็กทรอนิกส์ อินเทอร์เน็ต และวงจรรวม หรือไม่
- แต่ในความเป็นจริง จากการวิจัยด้าน การแก้ PDE (สมการเชิงอนุพันธ์ย่อย) ด้วย AI เขากลับพบว่าผลลัพธ์เมื่อนำไปใช้จริงต่ำกว่าที่คาด เมื่อเทียบกับผลงานที่ประกาศไว้ในงานวิจัยชื่อดัง
ประสบการณ์การใช้ PINN (Physics-Informed Neural Network)
- ในสาขาการแก้ PDE ด้วย AI นั้น PINN ได้กลายเป็นวิธีที่โดดเด่นขึ้นมาอย่างรวดเร็ว และผู้เขียนเองก็ได้ลองใช้แนวทางนี้เชิงทดลอง
- งานวิจัยก่อนหน้าเคยรายงานว่า PINN ให้ โซลูชันที่มีประสิทธิภาพ สำหรับปัญหา PDE ในหลายสาขา เช่น ของไหลแบบคลาสสิก กลศาสตร์ควอนตัม และระบบปฏิกิริยา-การแพร่ แต่เมื่อใช้งานจริงกลับพบผลลัพธ์ที่ ไม่เสถียรหรือความน่าเชื่อถือต่ำมาก แม้กับ PDE ที่ง่ายมากอย่าง 1D Vlasov
- การปรับแต่งแบบง่าย ๆ ก็แทบไม่ช่วยให้ดีขึ้น และกับ PDE ที่ซับซ้อนกว่าอย่าง 1D Vlasov-Poisson ก็ไม่สามารถหาคำตอบที่เหมาะสมได้เลย
- นักวิจัยรอบตัวเขาก็พบความล้มเหลวลักษณะเดียวกัน แต่ ผลลัพธ์เชิงลบเหล่านี้แทบไม่ถูกตีพิมพ์เป็นงานวิจัย
บทเรียนจากการทดลอง PINN
- แม้แต่ผู้เขียนงานต้นฉบับที่ทรงอิทธิพลก็ยังรับรู้ว่า PINN ล้มเหลวในบางการตั้งค่า แต่เลือกเผยแพร่เฉพาะผลลัพธ์ที่โน้มน้าวใจได้
- ในระบบนิเวศของบทความวิทยาศาสตร์ การ รายงานเน้นผลลัพธ์เชิงบวก และธรรมเนียมไม่เผยแพร่การทดลอง AI ที่ล้มเหลว ยิ่งทำให้อคติแบบ survivorship bias รุนแรงขึ้น
- ผู้เขียนเล่าว่า แม้แนวทาง PINN จะเป็นแนวคิดที่สวยงามในเชิงตัวเลข แต่ด้วยข้อจำกัดเชิงปฏิบัติอย่าง ความไม่เสถียร ความยากในการปรับละเอียด และความเร็วในการประมวลผลที่ลดลง จึงตัดสินใจเลิกใช้แนวทางนี้
- งานต้นฉบับถูกอ้างอิงมากกว่า 14,000 ครั้ง และเป็นหนึ่งในงานที่ถูกอ้างอิงสูงสุดในสาขาวิธีเชิงตัวเลข แต่ในการแก้ PDE จริงกลับ ไม่มีความได้เปรียบในการแข่งขันเหนือวิธีเดิม
- ช่วงหลังมีข้ออ้างว่า PINN อาจใช้ได้ผลในบางด้านเฉพาะ เช่น inverse problems แต่ประเด็นนี้ยังเป็นที่ถกเถียงกันในหมู่นักวิจัย
การมองโลกในแง่ดีเกินไปที่เกิดจากเกณฑ์เปรียบเทียบที่ไม่เหมาะสม
- ต่อมาผู้เขียนได้ลองแนวทางดีปเลิร์นนิงที่ จัดการคำตอบของ PDE เป็นชุดของกริดหรือพิกเซลบนกราฟ คล้ายกับเทคนิคเชิงตัวเลขแบบดั้งเดิม
- หลายงานวิจัยประกาศว่า AI สามารถแก้ PDE ได้เร็วกว่าวิธีเดิมตั้งแต่หลักพันถึงหลักหมื่นเท่า แต่ในความเป็นจริง ส่วนใหญ่แล้ว baseline ที่ใช้เปรียบเทียบนั้นเป็นวิธีที่อ่อนอยู่แล้ว
- จากการวิเคราะห์งานเด่น พบว่าใน 76 บทความที่อ้างว่า AI มีจุดแข็งนั้น มีถึง 60 บทความ (79%) ที่ไม่ได้เปรียบเทียบอย่างเป็นธรรมกับวิธีเชิงตัวเลขแบบเดิมที่มีประสิทธิภาพเพียงพอ
- baseline ที่อ่อนเช่นนี้ ประกอบกับ การไม่เปิดเผยผลลัพธ์เชิงลบ ทำให้คำกล่าวว่า “AI สร้างผลงานแบบปฏิวัติวงการ” มีแนวโน้มถูกพูดเกินจริงกว่าความเป็นจริง
- ผลการวิจัยที่เกี่ยวข้องก่อให้เกิดข้อถกเถียงทั้งในแวดวงวิชาการและอุตสาหกรรม โดยบางส่วนชี้ถึง ทิศทางการวิจัยในอนาคต และการเสริมศักยภาพของ AI ขณะที่อีกบางส่วนย้ำให้ ระวังปัญหาการประเมินค่าสูงเกินจริงในปัจจุบัน
บทบาทและข้อจำกัดของ AI ในวิทยาศาสตร์
- ตัวอย่างความสำเร็จที่โดดเด่น ได้แก่ AlphaFold กับการทำนายการพับตัวของโปรตีน การพยากรณ์อากาศที่เพิ่มความแม่นยำได้สูงสุด 20% และการพัฒนายาที่เพิ่มอัตราความสำเร็จในระยะทดลองทางคลินิกเฟส 1 แต่โดยรวมแล้วยังเป็น ความก้าวหน้าแบบเสริมและค่อยเป็นค่อยไป เมื่อเทียบกับเทคโนโลยีเดิม มากกว่าจะเป็นนวัตกรรมพลิกโฉมในวงกว้าง
- Big Tech ระดับโลก สื่อ และแวดวงวิชาการ มักนำเสนอ AI ว่าเป็น “เครื่องมือปฏิวัติวิทยาศาสตร์” หรือ “ตัวแสดงสำคัญที่จะเปลี่ยนกระบวนทัศน์ทางวิทยาศาสตร์” แต่ก็มีข้อจำกัดที่ชัดเจนว่า AI ในระดับปัจจุบันยังไม่สามารถสร้างนวัตกรรมเชิงแก่นสารได้มากเท่าที่คาดหวัง
แรงจูงใจในการรับ AI มาใช้และปัญหาเชิงโครงสร้างของระบบวิจัย
- เหตุผลหลักที่นักวิทยาศาสตร์นำ AI มาใช้ มักไม่ใช่เพื่อ ความก้าวหน้าของวิทยาศาสตร์เอง แต่เป็นเพราะผลลัพธ์ต่อความสำเร็จส่วนบุคคล เช่น เงินเดือนที่สูงขึ้น เส้นทางอาชีพ การอ้างอิงงานวิจัย หรือการดึงทุนวิจัย
- ในความเป็นจริง มีปรากฏการณ์ที่นักวิจัยที่ใช้ AI ได้รับสภาพแวดล้อมที่เอื้อกว่า ในด้าน บทความที่ถูกอ้างอิงสูงและความสามารถในการแข่งขันทางวิจัย เมื่อเทียบกับนักวิทยาศาสตร์ทั่วไป
- นักวิจัยที่ใช้ AI มักเผชิญกับกับดักเชิงโครงสร้าง คือไม่ได้เริ่มจากการนิยามว่า “ปัญหาวิทยาศาสตร์อะไรควรแก้” แต่กลับเริ่มจากการมองย้อนกลับว่า “มีปัญหาอะไรบ้างที่ AI พอจะใช้แก้ได้”
- ด้วยเหตุนี้ หลายกรณีจึงมุ่งเน้นไปที่ การสาธิตศักยภาพของ AI มากกว่าความก้าวหน้าทางวิทยาศาสตร์จริง และมักได้เพียงผลกับปัญหาที่ถูกแก้ไปแล้ว หรือได้ผลข้างเคียงเล็กน้อย
ข้อจำกัดเชิงโครงสร้างของการรายงานงานวิจัยและอคติแบบมองโลกสวยในวิทยาศาสตร์
- การไม่รายงานผลลัพธ์เชิงลบ หรือ survivorship bias ทำให้มีแต่ กรณีความสำเร็จของการใช้ AI ที่ถูกเผยแพร่ออกมา ขณะที่ความล้มเหลวไม่ถูกเปิดเผย ส่งผลให้การประเมินภาพรวมบิดเบือน
- ด้วยโครงสร้างของบทความวิจัยเอง ปัญหาอย่าง data leakage, baseline ที่อ่อน, cherry-picking และการไม่รายงานผล จึงเกิดเป็นความคลาดเคลื่อนหรืออคติอย่างเป็นระบบซ้ำ ๆ
- เนื่องจากผู้ประเมินกับผู้มีส่วนได้ส่วนเสียอยู่ในชุมชนเดียวกัน การประเมินผลงานจึงเกิดขึ้นภายใต้โครงสร้าง ผลประโยชน์ทับซ้อน ที่ผลลัพธ์เชื่อมโยงกับผลประโยชน์โดยตรง
- ปรากฏการณ์เหล่านี้ชี้ว่า เมื่อต้องประเมินผลกระทบของ AI ในวิทยาศาสตร์ เราจำเป็นต้องมี ความสงสัยเชิงหลักการและนิสัยในการตรวจสอบอย่างวิพากษ์ คล้ายกับท่าทีที่ไม่เชื่อผลจากงานวิจัยโภชนาการเพียงชิ้นเดียวโดยไม่มีการทดสอบซ้ำ
บทสรุป
- ในระยะสั้น AI มีแนวโน้มจะเป็น เครื่องมือเสริมแบบค่อยเป็นค่อยไปและเลือกใช้เฉพาะจุดของแนวทางเดิม มากกว่าจะเป็น เครื่องมือปฏิวัติ ที่ขับเคลื่อนนวัตกรรมทางวิทยาศาสตร์
- เนื่องจากปัญหาอย่าง แรงจูงใจเชิงโครงสร้างของระบบวิจัย การประเมินค่าสูงเกินจริง การไม่รายงานความล้มเหลว และ baseline ที่อ่อน จึงจำเป็นต้องรักษามุมมองเชิงวิพากษ์และเชิงสงสัยไว้เสมอเมื่อประเมินผลงานทางวิทยาศาสตร์ที่เกี่ยวกับ AI
- ข้อความสำคัญคือ นวัตกรรม AI ในอุดมคติจะเกิดขึ้นได้ก็ต่อเมื่อมีการปฏิรูปเชิงโครงสร้างควบคู่กันไป เช่น การตั้งโจทย์ท้าทาย การเปิดเผยกรณีล้มเหลว และการพัฒนาระบบเปรียบเทียบที่เป็นธรรม
1 ความคิดเห็น
ความเห็นจาก Hacker News
สับสนว่าเปลี่ยนชื่อเรื่องหรือเปล่า ตอนนี้ชื่อคือ "I got fooled by AI-for-science hype—here's what it taught me"
ชื่อเรื่องถูกเปลี่ยนจากเดิม และส่วนตัวรู้สึกว่าแย่ลงด้วย ควรใช้ชื่อเดิมมากกว่า และคิดว่าชื่อเดิมของบทความนี้ก็ไม่ได้มีปัญหาอะไร เนื้อหาคือการที่นักศึกษาปริญญาเอกวิเคราะห์อย่างวิพากษ์กรณีชวนกังขาที่อ้างว่า AI ช่วยงานวิจัยทางวิทยาศาสตร์
ไม่ใช่เข้าใจผิด แต่ยืนยันว่าเปลี่ยนชื่อจริง พร้อมยกตัวอย่างลิงก์ archive มาด้วย
เคยมี “โชค” ได้ใช้โซลเวอร์วิเคราะห์โครงสร้างสไตล์ FEM ที่ขับเคลื่อนด้วย AI อยู่บ้าง ใช้พอได้กับปัญหาเชิงเส้นการเปลี่ยนรูปขนาดเล็ก แต่พอซับซ้อนขึ้นประสิทธิภาพก็ตกฮวบ วิธีเดิมใช้เวลา 5 นาทีแล้วได้คำตอบที่แม่นยำ ขณะที่มันใช้ 30 วินาทีเพื่อแก้แบบคร่าว ๆ พอใช้กับกรณีไม่เชิงเส้นก็พังยับ ใช้ได้แค่ระดับเลือกแนวคิดกว้าง ๆ ซึ่งก็ยังไม่ค่อยดี โมเดลบางตัวก็แทบเป็นแค่ตัวตรวจจับความโค้ง เส้นตรงเป็นสีน้ำเงิน ความโค้งมากเป็นสีแดง ที่เหลือก็แค่การอินเตอร์โพเลต
สุดท้ายให้ความรู้สึกเหมือนโซลเวอร์แบบ “second principles” มากกว่า และมีข้อจำกัดตรงที่แก้สถานการณ์ใหม่ที่ไม่เคยเห็นมาก่อนไม่ได้เลย
สงสัยว่าโมเดลแบบนี้จะเอาไปใช้เป็น preconditioner ในวิธีแก้เชิงวนซ้ำได้หรือไม่
เทคโนโลยีใหม่ที่กำลังร้อนแรงมักมีความเสี่ยงจากการได้รับความสนใจเกินจริงเสมอ คำพูดสำคัญในบทความคือ “นักวิทยาศาสตร์ส่วนใหญ่ไม่ได้ตั้งใจหลอกใคร แต่มีแรงกดดันอย่างมากให้ต้องแสดงผลลัพธ์ที่ดูดี จึงมีโอกาสชี้นำผิดได้ในที่สุด” ย้ำว่าการเข้าใจแรงจูงใจของแต่ละคนมีประโยชน์มากในการตีความข้อมูล
สุดท้ายแล้วนี่ก็เป็นการวนซ้ำของปัญหาเรื้อรังในวงวิชาการ คือสนใจจำนวนการอ้างอิงและความก้าวหน้าในอาชีพมากกว่าการแสวงหาความจริง ส่วน AI ก็เป็นแค่หนึ่งในหัวข้อแบบนั้น
ไม่อยากเหมารวม แต่จากที่เคยวนไปตามศูนย์ HPC หลายแห่งในเยอรมนี รูปแบบที่เห็นคือมีคนจำนวนมากที่เรียนฟิสิกส์มาแล้วไปไม่รอด และงบประมาณด้าน AI ก็มักตกไปอยู่กับคนกลุ่มนี้เป็นส่วนใหญ่ จนโปรเจกต์แนว ML4Science ผุดเต็มไปหมด ทั้งที่ศูนย์ HPC ไม่ได้มีไว้เพื่อฟิสิกส์เพียงอย่างเดียว เลยเสียดายการกระจุกตัวของงบ และรู้สึกว่าเยอรมนีควรลงทุนกับงานวิจัย AI แท้ ๆ ให้มากกว่านี้
ในทางปฏิบัติ ปัญหาการยึดติดกับความก้าวหน้าในอาชีพเป็นผลข้างเคียงที่เกิดขึ้นเมื่อวงวิชาการค่อย ๆ รับตรรกะตลาดเอกชนเข้ามา สิ่งที่ผมเรียนรู้จากการเป็นนักพัฒนาซอฟต์แวร์คือทุกการตัดสินใจล้วนขับเคลื่อนด้วยผลประโยชน์ตัวเองและอาชีพ แต่ละคนสนใจแค่ความเก่งของตัวเอง และพองานจบก็โทษคนอื่น ถ้าไม่สู้กับวิธีคิดแบบนี้กลับจะเสียเปรียบ สุดท้ายก็ไปลงเอยแบบเดียวกันพร้อมกับตัวเองเสียหายอยู่ฝ่ายเดียว
จริง ๆ แล้วไม่เข้าใจว่าทำไมถึงใช้คำว่า "no longer"
ตรงที่บอกว่า “หลังล้มเหลวอยู่หลายสัปดาห์ ฉันก็ติดต่อเพื่อนจากมหาวิทยาลัยอีกคน แล้วเขาก็บอกว่าไม่ได้ผลดีกับ PINNs เหมือนกัน” ทำให้รู้สึกถึงความสำคัญของการร่วมมืออย่างต่อเนื่องในงานวิจัย ไม่เกี่ยวกับ AI โดยตรง แต่ช่วยไม่ให้คนอื่นต้องเดินซ้ำบนเส้นทางที่ล้มเหลวมาแล้ว
มีการเสนอว่านักวิจัยควรตีพิมพ์การทดลองที่ล้มเหลวเป็นงานวิจัยด้วย
นี่เป็นอีกเหตุผลที่ทำให้แนวคิด AI agent เพื่อวิทยาศาสตร์ดูไม่น่าเชื่อถือสำหรับผม เพราะงานวิจัยโดยเนื้อแท้เป็นกระบวนการที่อาศัยความร่วมมือสูงมาก ไม่ว่าจะทบทวนวรรณกรรมได้ดีแค่ไหน ถ้าไม่ได้พบปะและพูดคุยกันจริง ๆ ก็อดสงสัยไม่ได้ว่าจะเป็นนักวิจัยที่ดีได้หรือไม่
ไม่ได้เป็นสายเชียร์ AI แต่ผลลัพธ์เชิงลบไม่ค่อยถูกตีพิมพ์ และทุกคนก็มักโหมโปรโมตงานตัวเองเกินจริงในบทความ ซึ่งไม่ใช่ปัญหาเฉพาะของ AI แต่เป็นปัญหาวิธีประเมินนักวิทยาศาสตร์และโครงสร้างอุตสาหกรรมวารสาร คล้ายสื่อดั้งเดิมที่หมกมุ่นกับการดึงความสนใจจากผู้ชม อย่างไรก็ดี ก็รู้สึกเหมือนฤดูหนาวกำลังมา
บ่อยครั้งบทความ AI จะวนอยู่กับแนว “ถ้าระดม GPU หลายพันล้านตัวแล้วปล่อยให้รันไปไม่จำกัดเวลา มันจะให้ผลมหัศจรรย์” หรือ “ทดสอบด้วยชุดข้อมูลจริงแบบปิดแล้วได้อันดับหนึ่ง” งานจากบริษัทใหญ่แม้มีช่องโหว่ชัดเจนก็ปล่อยผ่านไม่ได้ สุดท้ายคือสงครามทรัพยากร นักวิจัยมหาวิทยาลัยงบน้อยอย่างผมทำซ้ำก็ไม่ได้ ทำได้แค่เชื่อตัวเลขในบทความ
เมื่อ 15 ปีก่อนเคยเขียนงานวิจัย AI เชิงประยุกต์แล้วก็ย้ายไปสาขาอื่น ก่อนจะเพิ่งกลับมาไม่นานนี้ ปัญหานี้มีอยู่ทุกสาขา แต่ AI ดึงดูดนักวิจัยที่ไล่ล่าชื่อเสียงและเงินเป็นพิเศษ ดูเหมือนทั้งคำกล่าวอ้างเกินจริงและข้อมูลที่คัดแต่งก็หนักกว่า นักวิจัยที่มีความรับผิดชอบเองหากอยากแข่งขันก็ต้องพูดเกินจริงไปบ้าง
AI เป็นเพียงแม่เหล็กของกระแสในเวลานี้ จึงทำให้ปัญหาต่าง ๆ ปรากฏชัดขึ้น
AI ทำให้การเขียน “บทความที่ดูน่าเชื่อ” ง่ายขึ้นเป็นพิเศษ
สงสัยว่าทำไมมุมมองต่อ AI/ML บน HN ถึงแตกเป็นสองขั้วขนาดนี้ มันเป็นพื้นที่ใหม่ที่ไม่เคยเห็นมาก่อน ความสามารถในการสร้างโค้ดจากแค่ข้อความไม่เคยมีมาก่อน ไม่นานมานี้สั่งให้ claude ทำสคริปต์แบ่งส่วนภาพพร้อม UI ก็ได้ออกมาใน 1 นาที นี่ไม่ใช่ตัวอย่างนวัตกรรมแบบเดียว ภาพที่สร้างด้วย AI ก็เหมือนโลกใหม่ บล็อกนี้อาจมีส่วนที่พูดเกินจริง แต่จากมุมมองนักวิจัย แค่เรื่องเพิ่มผลิตภาพการเขียนโค้ดด้วย AI ก็มีประสิทธิภาพมากแล้ว ที่น่าสนใจกว่านั้นคือการเปลี่ยนมุมมองต่อข้อมูล เมื่อก่อนพูดว่า “อินเทอร์เน็ตไม่มีวันลืม” แต่ตอนนี้ทั้งการลบหน้าเว็บและฟังก์ชันแคชก็หายไปจริง ๆ เราค่อย ๆ ลืมวิธีจัดการข้อมูลไปแล้ว แต่เมื่อ AI มาถึง คุณค่าของข้อมูลก็กลับมาสูงอีกครั้ง เรากำลังก้าวเข้าสู่ยุคของการป้อนฟีดแบ็กแล้วสะท้อนกลับสู่ผลลัพธ์ ความก้าวหน้ากำลังเกิดขึ้นในทุกด้าน ทั้งฮาร์ดแวร์ อัลกอริทึม ข้อมูล เครื่องมือ และโปรโตคอล เรายังต้องการการทดลองเพิ่ม GPU เพิ่ม และดาต้าเซ็นเตอร์ขนาดใหญ่อีกมาก ตอนนี้ยังติดคอขวดอยู่ และบริษัทใหญ่กำลังใช้เวลาหลายสัปดาห์หรือหลายเดือนฝึกโมเดลขนาดใหญ่
คำว่า “ช่วยสร้างโค้ดแบ่งส่วนภาพ” จริง ๆ ก็เป็นแค่การคัดลอกแปะข้อมูลจาก Stack Overflow แบบดูหรูขึ้น เมื่อก่อนเราก็หาแบบนี้ด้วย Google อยู่แล้ว ภายนอกอาจดูใหม่และน่าทึ่ง แต่โดยแก่นก็ให้ความรู้สึกเหมือนใช้ GIS หาร้านอาหาร ในโลกจริงมันไม่มี reasoning อะไรเลย มีแค่การแสดงความสัมพันธ์จากข้อมูล แม้ยังมีประโยชน์ แต่ข้อจำกัดก็ชัดเจน
เรื่องที่บรรยากาศต่อ AI/ML บน HN แตกต่างจากเทคโนโลยีอื่นมาก ควรตีความจากจุดยืนที่สมเหตุสมผลของแต่ละคน ทั้งมุมที่มองว่าเป็นนวัตกรรม และความกังวลเรื่องการขโมยข้อมูลกับการละเลยความเป็นส่วนตัว ต่างก็มีเหตุผลรองรับทั้งคู่ ควรยอมรับก่อนว่ามีหลายมุมมอง และพยายามวางจุดยืนของตัวเองลงชั่วคราวเพื่อทำความเข้าใจจุดยืนของอีกฝ่ายอย่างจริงจัง
บทบาทพื้นฐานของโปรแกรมเมอร์คือแปลงภาษามนุษย์เป็นภาษาคอมพิวเตอร์ และ LLM คือสิ่งที่เข้ามาล้ำเส้นนั้นอย่างชัดเจน แม้ยังไม่แน่ชัดว่าจะลึกแค่ไหน แต่กำแพงได้พังไปแล้ว สถานการณ์นี้ตีความได้ตั้งแต่ความกลัวไปจนถึงความรู้สึกวิกฤต มันคุกคามทักษะรายได้สูงที่ขัดเกลามาหลายปี แม้โปรแกรมเมอร์จะไม่ถูกแทนที่ทั้งหมด แต่ถ้าต้องแค่พยายามรักษาเงินเดือนระดับหลายแสนดอลลาร์ไว้ให้ได้ ก็ถือว่าเป็นภัยคุกคามเพียงพอแล้ว
HN เดิมทีก็แตกแยกกันอยู่เสมอในเรื่อง “เทคโนโลยีกระแสนี้ของจริงหรือภาพลวง” การถกเถียงแบบนี้เกิดซ้ำในหลายเทคโนโลยี และบางครั้งจุดยืนของผมเองก็เคยเปลี่ยน สุดท้ายเลยรู้สึกว่ามันก็ไม่ได้ต่างจากที่เห็นภายนอกมากนัก
ตรงกันข้ามกับเรื่องนี้ วาทกรรมว่า “AI จะปฏิวัติวิทยาศาสตร์” ดูเหมือนจะวิ่งนำหน้าหลักฐานไปมากเกินไป
ตอนต้นบทความดูเหมือนจะบอกว่า AI โดยรวมถูกโฆษณาเกินจริง แต่จริง ๆ สิ่งที่วิจารณ์คือสถาปัตยกรรมเฉพาะอย่าง PINN และตอนท้ายก็ยังกล่าวถึงความสำเร็จของโมเดล DL ที่ใช้แก้ PDE ได้เร็วขึ้นด้วย
ไม่ใช่ปัญหาเฉพาะของ PINN แต่กว้างกว่านั้นมาก เป็นที่รู้กันมานานแล้วว่า PINN ไม่ค่อยดี แต่ความล้มเหลวทั่วไปของการใช้ ML กับปัญหาทางฟิสิกส์ก็มีอยู่เต็มไปหมด สถานการณ์ที่ ML ได้ผลดีคือ (1) มีข้อมูลมหาศาลและอยู่ในขอบเขตแคบมาก เช่น MLIP หรือ (2) ใช้ข้อมูลมหาศาลกับโมเดลขนาดใหญ่มาก เช่น Alphafold แต่ปัญหาฟิสิกส์ส่วนใหญ่ที่ใช้ ML อยู่ตรงกลางระหว่างสองแบบนั้น คือข้อมูลการทดลองมีน้อยและซิมูเลชันก็แพง ขนาดชุดข้อมูลและโมเดลก็ไม่ถึงกับใหญ่มาก สุดท้ายทุกคนเลยลองแล้วล้มเหลว แต่ก็ยังตีพิมพ์งานออกมา ถ้าเป็นแล็บดัง PI ดัง หรือดูแปลกใหม่ ก็ได้ลงวารสารดี ๆ และจำนวนการอ้างอิงก็ขึ้น สุดท้ายเหลือเพียงข้อจำกัดว่าโมเดลทำได้แค่ลอกบางส่วนของข้อมูล และคนอื่นต้องมารับภาระเสริมความเป็นสากลต่อไป
สิ่งที่ผู้เขียนทำไม่ได้จำกัดแค่ PINN เขายังเขียนงานที่วิเคราะห์โมเดลหลายแบบอย่างเป็นระบบ และมีแยกเป็นอีกหัวข้อหนึ่งด้วย
ต่อให้เปลี่ยน PINN เป็นโซลูชัน AI แบบอื่น ก็ยังเจอส่วนที่เกินจริงอยู่ดี จนถึงตอนนี้ การประเมินประโยชน์ของ AI แบบสมจริงคือ “ทำงานง่าย ๆ ของผู้เชี่ยวชาญให้เป็นอัตโนมัติ และต้องตรวจทานซ้ำสามชั้น”
เป็นการวิเคราะห์และยกตัวอย่างที่ยอดเยี่ยม อีกปัญหาหนึ่งคือบทความ AI ส่วนใหญ่แม้จะใหม่และมีสัดส่วนที่ตีพิมพ์ในวารสาร “ทางการ” ไม่มาก แต่กลับมีจำนวนการอ้างอิงสูง ทำให้การทำซ้ำหรือพิสูจน์คำกล่าวอ้างทำได้ยากมาก เพราะแนวทางวิจัยและข้อมูลเปลี่ยนทุกปี จึงไม่ชัดว่าข้อสรุปเกิดจากลักษณะของโมเดลในอดีต หรือเป็นข้อสรุปที่สรุปทั่วไปได้จริง
เห็นชื่อเจ้าของบล็อก ("Timothy B. Lee") แล้วตกใจว่า ผู้ประดิษฐ์ HTTP และเว็บที่อายุมากกว่า 70 ปี ยังทำบล็อกล้ำสมัยแบบนี้อยู่