ข้อจำกัดและปัญหาของ AI ในปัจจุบัน
เหตุใดจึงยากที่จะใช้ AI กับงานที่จริงจัง
- จากมุมมองวิศวกรรมซอฟต์แวร์ ระบบ AI ในปัจจุบันขาดความน่าเชื่อถือ เพราะจัดการความซับซ้อนและขนาดของระบบได้อย่างมีประสิทธิภาพได้ยาก
- ซอฟต์แวร์ที่มีผลกระทบสูงควรมีความโปร่งใส ความสามารถในการจัดการ และความรับผิดชอบ แต่ AI ในปัจจุบันยังไม่สามารถตอบโจทย์เหล่านี้ได้
- ยังขาดความรับผิดชอบต่อที่มาของข้อมูล และความรับผิดชอบต่อผลลัพธ์ของอัลกอริทึม AI ก็ยังไม่ชัดเจน
- แม้จะมีความพยายามเรื่อง 'Explainable AI' และการลดอคติ แต่ปัญหาเชิงรากฐานด้านความรับผิดชอบของข้อมูลและความยากด้านวิศวกรรมก็ยังไม่ได้รับการแก้ไข
AI ที่อิงโครงข่ายประสาททำงานอย่างไร
- AI ในปัจจุบันอาศัยโครงข่ายประสาทขนาดใหญ่ (LLM, Generative AI เป็นต้น) ซึ่งมีนิวรอนหลายล้านตัวเชื่อมต่อกัน
- การฝึกส่วนใหญ่ทำในรูปแบบการเรียนรู้แบบไม่มีผู้สอนหรือการเรียนรู้แบบกำกับตนเอง โดยมีการแทรกแซงจากมนุษย์น้อยที่สุด
- ความสามารถของระบบถูกกำหนดผ่านกระบวนการฝึกให้เรียนรู้จากข้อมูลที่ได้รับเพื่อให้บรรลุเป้าหมายของผลลัพธ์
- ต้องใช้ทรัพยากรการประมวลผลจำนวนมหาศาล ทำให้มีต้นทุนและการใช้พลังงานสูงมาก
ลักษณะที่ไร้โครงสร้างของโครงข่ายประสาทและ 'พฤติกรรมเกิดใหม่'
- ระบบ AI ในปัจจุบันแสดง พฤติกรรมเกิดใหม่ ซึ่งยากจะอธิบายการทำงานของทั้งระบบด้วยนิยามทางคณิตศาสตร์ของนิวรอนแต่ละตัว
- โครงสร้างภายในของระบบไม่ได้มีความเชื่อมโยงอย่างมีความหมายกับหน้าที่ จึงไม่สามารถนำกลับมาใช้ซ้ำหรือพัฒนาแบบโมดูลาร์ได้
- ไม่มีโมเดลขั้นกลางหรือวิธีพัฒนาแบบเป็นลำดับขั้น ทำให้ยากต่อการอธิบายเหตุผลและตรรกะของระบบ
- วิธีแบบ 'ให้มนุษย์เป็นตัวกลาง' ก็ไม่ได้ช่วยอธิบายผลลัพธ์ของระบบได้อย่างเป็นรูปธรรม
แนวทางเชิงประกอบในวิศวกรรมซอฟต์แวร์กับปัญหาของ AI
- แนวทางเชิงประกอบ (compositionality) คือวิธีอธิบายทั้งระบบผ่านความเข้าใจความหมายของชิ้นส่วนแต่ละส่วนและวิธีที่ชิ้นส่วนเหล่านั้นประกอบเข้าด้วยกัน
- AI ในปัจจุบันไม่รองรับแนวทางนี้ และก่อให้เกิดปัญหาดังต่อไปนี้:
- โครงสร้างภายในไม่มีความหมาย จึงไม่สามารถนำฟังก์ชันกลับมาใช้ซ้ำได้
- ไม่สามารถพัฒนาแบบเป็นขั้นตอนหรือทำการตรวจสอบยืนยันเป็นลำดับได้
- ไม่มีโมเดลความรู้แบบชัดแจ้ง ทำให้ระบบไม่สามารถอธิบาย 'เหตุผล' ได้
ข้อจำกัดของการตรวจสอบยืนยัน
- ระบบ AI ในปัจจุบันมีพื้นที่อินพุตและสถานะที่ใหญ่เกินไป ทำให้การทดสอบอย่างครอบคลุมเป็นไปไม่ได้
- ผลลัพธ์ที่ถูกต้องของระบบเชิงความน่าจะเป็นแสดงได้เพียงความเป็นไปได้สำหรับอินพุตนั้น ๆ แต่ไม่อาจรับประกันผลลัพธ์ที่เชื่อถือได้เสมอไป
- ไม่สามารถทำการตรวจสอบยืนยันบางส่วน เช่น unit test หรือ integration test ได้ และทำได้เพียงตรวจสอบทั้งระบบ
- แม้จะทดสอบทั้งระบบแล้ว ความครอบคลุมก็ยังไม่เพียงพอ ทำให้ยากต่อการสร้างความน่าเชื่อถือ
ปัญหาเรื่องข้อผิดพลาดและการแก้ไข
- อาจเกิดข้อผิดพลาดจากข้อมูลฝึกที่ไม่เพียงพอหรือความไม่สมบูรณ์ของข้อมูลอินพุต
- ต่อให้ฝึกใหม่เพื่อแก้ไขข้อผิดพลาด ก็ไม่สามารถแก้เฉพาะจุดได้ และยังทำ regression test ได้ยาก
- มีโอกาสสูงที่จะเกิดข้อผิดพลาดใหม่แทรกเข้ามา และก็ยากที่จะตรวจพบ
บทสรุปและข้อเสนอ
- ระบบ AI ในปัจจุบันยังขาดความน่าเชื่อถือและความปลอดภัย จึงไม่เหมาะสำหรับการนำไปใช้กับงานประยุกต์ที่จริงจัง
- เทคโนโลยีปัจจุบันสามารถปรับปรุงได้อย่างจำกัดจากการเพิ่มข้อมูลฝึกและทรัพยากรการประมวลผลเท่านั้น โดยยังไม่ทำให้ความน่าเชื่อถือดีขึ้นอย่างเป็นรากฐาน
- ข้อเสนอ:
- พัฒนาระบบไฮบริดที่ผสานโครงข่ายประสาทกับ symbolic AI
- สร้างโมเดลความรู้แบบชัดแจ้งและระดับความเชื่อมั่น หรือผสานเข้ากับเทคนิคการค้นคืนข้อมูลและการพิสูจน์ที่มีอยู่เดิม
- ใช้งานในขอบเขตที่จำกัดซึ่งสามารถจัดการข้อผิดพลาดได้อย่างน่าเชื่อถือ
- นำไปใช้ในบางสาขาเฉพาะ เช่น การพยากรณ์อากาศ ที่เหมาะกับการคาดการณ์เชิงความน่าจะเป็น
13 ความคิดเห็น
ประเด็นสำคัญคือ AI ในปัจจุบันพึ่งพาการตรวจสอบแบบอุปนัยว่า เมื่อวานปลอดภัย วันนี้ก็ปลอดภัย ดังนั้นพรุ่งนี้ก็น่าจะปลอดภัย โดยแทบไม่มีการพิสูจน์ตรวจสอบเชิงนิรนัยเลย
เหมือนกับทฤษฎีหงส์ดำ ความเป็นไปได้ที่จะเกิดความผิดปกติร้ายแรงในวันใดวันหนึ่งก็ยังคงมีอยู่ และในมุมหนึ่ง ความปลอดภัยในปัจจุบันก็กำลังพึ่งพาโชคอยู่
ในวิศวกรรมซอฟต์แวร์แบบเดิม ปัญหาแบบนี้สามารถตรวจสอบเชิงนิรนัยเป็นรายหน่วยได้ โดยระบุและวิเคราะห์องค์ประกอบแต่ละส่วน แล้วจัดทำสถานการณ์จำลองและการทดสอบ แต่สำหรับ AI ตอนนี้ยังเป็นไปไม่ได้โดยสมบูรณ์
เป็นปัญหาที่ Tesla Autopilot แก้ไขอยู่แล้ว..
ดูเหมือนว่าประเด็นใหญ่คือโมเดลไม่สามารถตรวจสอบยืนยันเชิงระบบได้ จึงทำให้ความน่าเชื่อถือไปไม่ถึง 100% แล้วในระบบขับขี่อัตโนมัติเขาแก้ปัญหานี้กันอย่างไรครับ?
Tesla กำลังแสดงตัวอย่างของการนำ AI ไปใช้กับโลกจริงอย่างแท้จริง
อะไรก็ตามย่อมเป็นไปไม่ได้ที่จะได้ 100% อยู่แล้ว 100% คือการหลอกลวงหรือภาพลวงตา
เหมือนสตาร์ทอัพทั่วไป เราเดินหน้าทีละ step แบบ agile
ในสถานการณ์ที่มีปัญหาก็สามารถ remote control ได้ และตอนนี้กำลังรันแบบ supervised อยู่
ประเด็นไม่ใช่ตัวเลขที่บอกว่าความน่าเชื่อถือ 100% แต่เป็นเรื่องที่โครงสร้างของโมเดลอธิบายได้ไม่ชัดเจนมากกว่าหรือเปล่าครับ?
สำหรับผลลัพธ์การอนุมานของโมเดล ดูเหมือนว่าประเด็นสำคัญคือ deep learning ในปัจจุบัน โดยเฉพาะโมเดลที่อิง neural network จำนวนมากนั้น อธิบายได้ยากเพียงแค่แสดงโครงสร้างภายในของมัน
ช่วงหลังมานี้ก็เริ่มมีงานวิจัยหลายชิ้นรวมถึงจากบริษัทอย่าง Anthropic ที่เสนอวิธีแก้ปัญหา black box กันอยู่ เลยคิดว่าอีกไม่นานก็น่าจะเป็นปัญหาที่ถูกแก้ได้อีกเรื่องครับ
ผมคิดว่าไม่ว่าจะเป็น 100% หรือความสามารถในการอธิบายได้ ล้วนเป็นภาพลวงตา
ประเด็นสำคัญเหมือนกับข้อถกเถียง "ห้องภาษาจีน" คือ ในท้ายที่สุด Tesla Autopilot มีความปลอดภัยทางสถิติมากกว่าการที่มนุษย์ขับรถเอง และปัญญาประดิษฐ์จะขยายต่อไปและทำงานได้ดีใน "เกือบ" ทุกกรณีที่ใกล้เคียง 100%
กูรูหลายคน (เช่น Elon Musk, Eric Schmidt เป็นต้น) พูดว่าปัญญาประดิษฐ์จำเป็นต้องมีราวป้องกันด้านความปลอดภัย ก็เพราะพวกเขารู้ว่าปัญญาประดิษฐ์นั้นอธิบายไม่ได้
เป็นความเห็นด้านล่างใน Hacker News
ถ้าเราไม่พิจารณาว่าโมเดลอธิบายการตัดสินใจได้หรือไม่ และดูแค่ความแม่นยำของผลลัพธ์ แล้วเราจะเชื่อถือและใช้งานผลิตภัณฑ์ได้อย่างไร
คุณพูดมาอย่างกำกวมเกินไปจนผมไม่ค่อยเข้าใจนัก แต่ประเด็นสำคัญไม่ใช่ว่า การที่การทำงานภายในของโมเดลต้อง
อธิบายได้จึงจะสามารถตรวจสอบยืนยันได้ในระดับหนึ่งไม่ใช่หรือ?ตามความเห็นของคุณ kandik ความมีอยู่ของ Functional Safety ก็จะหมดความหมายไป
จิตใจของมนุษย์สามารถอธิบายได้หรือไม่? ในเมื่อเราไม่สามารถอธิบายจิตใจของมนุษย์ได้ แล้วเราคัดเลือกพนักงานใหม่กันอย่างไร?
กลศาสตร์ควอนตัมเป็นแบบจำลองทางสถิติ 100% และมันก็อธิบายโลกได้เป็นอย่างดี
แม้แต่สิ่งที่เรียกว่า "ความไว้วางใจ" เอง ก็อาจมีการเปลี่ยนแปลงแนวคิดไปได้จากพัฒนาการของเทคโนโลยี
ไม่ว่าอย่างไร จากมุมมองของนักพัฒนาแล้วก็คงเป็นสถานการณ์ที่ชวนเหนื่อยใจอยู่ดี อุตส่าห์ใช้ AI เพื่อให้ทำงานได้สบายขึ้น แต่กลับไม่รู้ว่าต้องเข้มงวดกับการทดสอบเพิ่มอีกแค่ไหนเพื่อให้มั่นใจในความน่าเชื่อถือ
การสร้างผลิตภัณฑ์นั้น หากสามารถอธิบายได้ก็ย่อมดีกว่า ท้ายที่สุดแล้ว คนไม่ใช่ผลิตภัณฑ์ จึงสามารถให้บุคคลนั้นรับผิดชอบต่อปัญหาบางอย่างได้ แต่ถ้าเป็นผลิตภัณฑ์ เมื่อมีข้อบกพร่อง ความรับผิดชอบก็จะตกไปที่ผู้สร้างมัน
เพราะแบบนี้เอง ยิ่งจำเป็นต้องทำให้สภาพแวดล้อมการทดสอบใกล้เคียงกับโลกจริงมากขึ้นด้วย เนื่องจากเราไม่รู้หลักการภายใน จึงแทบไม่มีทางอื่นนอกจากฝึกให้มันเรียนรู้โดยพยายามไม่ให้มีสถานการณ์ยกเว้นมากที่สุด
ความเห็นจาก Hacker News
ติดตามพัฒนาการของโครงข่ายประสาทมาตั้งแต่ช่วงกลางทศวรรษ 1990 และสังเกตว่าในแต่ละช่วงของโครงข่ายประสาทล้วนไปถึงทางตัน ซึ่งเป็นเพราะแนวทางแบบคณิตศาสตร์ขัดขวางความเข้าใจเชิงสัญชาตญาณ โดยมองว่า LLM น่าสนใจเพราะทำให้การค้นหาเชิงความหมายเป็นเรื่องง่าย
ยังไม่สามารถคาดการณ์ความสามารถในการขยายตัวของระบบ AI ปัจจุบันได้ เมื่อเทียบกับสมองมนุษย์แล้ว จำนวนการเชื่อมต่อของโครงข่ายประสาทยังน้อยมาก
AI ที่อิงกับ LLM มีข้อบกพร่องในมุมมองของการพัฒนาซอฟต์แวร์ และไม่เหมาะกับแอปพลิเคชันที่สำคัญ
มนุษย์ก็ทำผิดพลาดได้แม้ในงานสำคัญ และระบบ AI ก็เช่นกัน
กำลังใช้งาน AI อย่างจริงจัง และได้รับความช่วยเหลืออย่างมากในโปรเจกต์ส่วนตัว
การขยายข้อมูลไม่ได้ให้ผลตอบแทนมากอีกต่อไปแล้ว LLM ไม่ใช่เส้นทางไปสู่ AGI
มีการถกเถียงกันมากว่า AI เป็นตัวแทนของความฉลาดหรือไม่ สมองมนุษย์เองก็ไม่น่าเชื่อถือเช่นกัน และมีการพูดถึงความเหมาะสมของ LLM ในด้านความมั่นคงปลอดภัยไซเบอร์