รายการอ่านที่อิลยา ซุตสเคเวอร์แนะนำเกี่ยวกับแมชชีนเลิร์นนิง/AI
- The Annotated Transformer
- The First Law of Complexodynamics
- The Unreasonable Effectiveness of RNNs
- Understanding LSTM Networks
- Recurrent Neural Network Regularization
- Keeping Neural Networks Simple by Minimizing the Description Length of the Weights
- Pointer Networks
- ImageNet Classification with Deep CNNs
- Order Matters: Sequence to sequence for sets
- GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism
- Deep Residual Learning for Image Recognition
- Multi-Scale Context Aggregation by Dilated Convolutions
- Neural Quantum Chemistry
- Attention Is All You Need
- Neural Machine Translation by Jointly Learning to Align and Translate
- Identity Mappings in Deep Residual Networks
- A Simple NN Module for Relational Reasoning
- Variational Lossy Autoencoder
- Relational RNNs
- Quantifying the Rise and Fall of Complexity in Closed Systems: The Coffee Automaton
- Neural Turing Machines
- Deep Speech 2: End-to-End Speech Recognition in English and Mandarin
- Scaling Laws for Neural LMs
- A Tutorial Introduction to the Minimum Description Length Principle
- Machine Super Intelligence Dissertation
- PAGE 434 onwards: Komogrov Complexity
- CS231n Convolutional Neural Networks for Visual Recognition
รวมลิงก์: https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE
3 ความคิดเห็น
ดูเหมือนว่าจะมีปัญหาเรื่องการครอว์ลของบอต Neo นะ
ดูเหมือนว่า Reddit จะบล็อกครับ ผมเลยใส่ไว้ให้แบบทำมือ ;)
ความคิดเห็นจาก Hacker News
สรุปรวมคอมเมนต์จาก Hacker News
พาดหัวทำให้ขอบเขตของงานนี้ดูเล็กกว่าความเป็นจริง ถ้าคลิกเข้าไปดูว่าแต่ละอย่างคืออะไร:
เมื่อสักพักก่อนผมก็ได้คัดลอกรายการไว้ที่ ลิงก์ เพื่อให้ wget ได้ง่ายขึ้น (เช่น ดึง pdf จาก arxiv ทั้งหมด)
โปรดจำไว้ว่า ยังไม่มีการยืนยันว่ารายการนี้เป็นรายการจริง
ถ้าไม่มีพื้นฐาน CS มาก่อน ต้องใช้เวลานานแค่ไหนกว่าจะเรียน prerequisite เพื่อจะมาเรียนสิ่งเหล่านี้ได้?
สิ่งที่ผู้คนมักลืมคือ ถ้าไม่มีเป้าหมายที่เหมาะสมและจับต้องได้ ต่อให้อ่าน paper แกนหลักหรือน่าสนใจมากแค่ไหน สุดท้ายก็จะจำอะไรไม่ได้อยู่ดี
มีการพูดคุยกันมาก่อนหน้านี้อยู่บ้าง ย้อนกลับไปถึงเดือนตุลาคม 2022 เลยสงสัยว่าตอนนี้รายการนี้ล้าสมัยไปแค่ไหนแล้ว
นี่ก็แค่โฟลเดอร์บุ๊กมาร์กของใครสักคน มีหลักฐานตรงไหนว่ามันเป็นสิ่งที่ Ilya แนะนำ?
ข้ออ้างว่านี่คือ 90% ของสิ่งสำคัญใน ML ดูจะกล้าเกินไปหน่อย
ในนี้ไม่มีอะไรเกี่ยวกับ llms เลย ทั้งที่ตอนนี้เรื่อง in-context learning, retrieval augmentation, tool using และ multimodality กำลังเป็นแนวหน้าที่ร้อนแรงมาก
การอ่านงานวิจัย 30 ชิ้นไม่ได้แปลว่า "ได้เรียนรู้และเข้าใจแล้ว"