- บทความว่าด้วยความสำคัญทางประวัติศาสตร์ของงานวิจัย "Backpropagation Applied to Handwritten Zip Code Recognition" ที่ Yann LeCun และคณะตีพิมพ์ในปี 1989 โดยงานนี้ถือเป็นหนึ่งในกรณีใช้งานจริงยุคแรกสุดที่ฝึกโครงข่ายประสาทเทียมแบบต้นจนจบด้วย backpropagation
- ผู้เขียนพยายามทำซ้ำงานในบทความดังกล่าวด้วยเครื่องมือสมัยใหม่อย่าง PyTorch และระบุว่าเครือข่ายต้นฉบับถูกพัฒนาใน Lisp โดยใช้โปรแกรมจำลอง backpropagation ชื่อ SN ของ Bottou และ LeCun ปี 1988 (ภายหลังเปลี่ยนชื่อเป็น Lush)
- เครือข่ายต้นฉบับใช้เวลาฝึก 3 วันบนเวิร์กสเตชัน SUN-4/260 แต่ฉบับที่ผู้เขียนทำซ้ำโดยใช้ CPU ของ MacBook Air (M1) ใช้เวลาราว 90 วินาที
- ผู้เขียนยังทดลองใช้เทคนิคดีปเลิร์นนิงสมัยใหม่ เช่น ตัวปรับเหมาะ Adam การทำ data augmentation และ dropout รวมถึงเปลี่ยนฟังก์ชันกระตุ้นจาก tanh เป็น ReLU ซึ่งทำให้อัตราความผิดพลาดลดลงประมาณ 60%
- ผู้เขียนเสนอว่ายังสามารถปรับปรุงได้อีกด้วยการขยายขนาดของเครือข่ายหรือชุดข้อมูล แต่สิ่งนี้จะเพิ่มต้นทุนการคำนวณและอาจทำให้เกิดความหน่วงในการอนุมาน
- เมื่อมองย้อนดูความก้าวหน้าของดีปเลิร์นนิงตลอด 33 ปีที่ผ่านมา ผู้เขียนชี้ว่าหลักการพื้นฐานยังคงเดิม แต่ขนาดของชุดข้อมูลและโมเดลเพิ่มขึ้นอย่างมาก ขณะที่เวลาที่ต้องใช้ในการฝึกโมเดลลดลงอย่างมาก
- ผู้เขียนคาดการณ์ว่าภายในปี 2055 โครงข่ายประสาทเทียมจะมีขนาดใหญ่ขึ้นอีก และแอปพลิเคชันส่วนใหญ่จะเกิดขึ้นจากการปรับจูนบางส่วนของเครือข่ายแบบเบา ๆ, prompt engineering หรือการกลั่นข้อมูลหรือโมเดลให้เป็นเครือข่ายอนุมานขนาดเล็กที่มีวัตถุประสงค์เฉพาะทาง
1 ความคิดเห็น
ความเห็นจาก Hacker News