ขณะนี้เราอยู่ในยุคทองครั้งที่สามของ AI ในยุคทองสองครั้งก่อนหน้า (ทศวรรษ 1950-1960 และทศวรรษ 1980) มีความผิดหวังเกิดขึ้นจากข้อจำกัดของเทคโนโลยี อย่างไรก็ตาม เทคโนโลยี AI ในปัจจุบันกำลังก้าวข้ามความคาดหวัง โดยเฉพาะ Transformer ที่เปิดตัวในปี 2017 ซึ่งเริ่มต้นจากการเป็นโมเดลแปลภาษาด้วยเครื่อง แต่ปัจจุบันกำลังส่งผลกระทบต่อแทบทุกสาขา และถือเป็นความรู้ที่จำเป็นสำหรับวิศวกรยุคใหม่ เป้าหมายแรกของเอกสารนี้คือมอบเส้นทางที่สั้นที่สุดให้วิศวกรได้เข้าใจ Transformer
สิ่งที่เอกสารนี้มอบให้
- คู่มือที่กระชับ: ให้ข้อมูลที่เพียงพอสำหรับการเรียนรู้ Transformer
- ตัวอย่างโค้ด Python ที่ลงมือทำได้จริง: มีตัวอย่างโค้ด Python ที่ผู้อ่านสามารถรันได้ด้วยตนเองเพื่อช่วยให้เข้าใจมากขึ้น
- แหล่งอ้างอิงสำหรับการสำรวจเพิ่มเติม: แนะนำตัวเลือกของเอกสารหลากหลายแบบเพื่อให้ผู้อ่านเข้าถึงได้ง่ายขึ้น
สารบัญ
- Part 1: โครงข่ายประสาทเทียม: แนะนำแนวคิดพื้นฐานของโครงข่ายประสาทเทียม
- Part 2: โครงข่ายประสาทเทียมแบบวนซ้ำ (RNNs): สำรวจ RNN รวมถึง LSTM และ GRU
- Part 3: การประมวลผลภาษาธรรมชาติ (NLP) และกลไกความสนใจ: ให้หลักการพื้นฐานของ NLP รวมถึงการแปลภาษาด้วยเครื่องและกลไกความสนใจ
- Part 4: Transformer: อธิบายโมเดล Transformer
- ภาคผนวก: ความรู้พื้นฐาน: ให้ความรู้ขั้นต่ำด้าน Python และคณิตศาสตร์ที่จำเป็นต่อการทำความเข้าใจ Transformer
FAQ
- ใครบ้างที่สามารถใช้เอกสารนี้ได้อย่างอิสระ?
- ครูหรือนักเรียนที่สังกัดสถาบันการศึกษาสามารถใช้เอกสารนี้และภาพประกอบได้อย่างอิสระ สามารถใช้เอกสารนี้และภาพประกอบในการประชุมและการบรรยายที่ไม่แสวงหากำไรได้ โดยต้องระบุลิงก์ของเว็บไซต์นี้และลิขสิทธิ์ มิฉะนั้นโปรดติดต่อผู้จัดทำ
- สามารถใช้กับคอนเทนต์เชิงพาณิชย์ได้หรือไม่?
- แบ่งปันรายได้: สามารถใช้คอนเทนต์นี้ได้หลังจากทำข้อตกลงแบ่งปันรายได้ โดยตามข้อตกลงนี้ต้องแบ่ง 20% ของยอดขายที่เกิดจากการใช้คอนเทนต์นี้
- ซื้อสิทธิทั้งหมด: ในกรณีที่พบได้ยากมาก จะพิจารณาคำขอซื้อสิทธิของคอนเทนต์ทั้งหมด ค่าใช้จ่ายสำหรับการซื้อทั้งหมดคือ €10,000,000
- ทำไมผู้เขียนจึงไม่สละลิขสิทธิ์ของเอกสารนี้หรือใช้สัญญาอนุญาต Creative Commons?
- หากมีข้อสงสัยว่าการคงลิขสิทธิ์ไว้มีปัญหาหรือไม่ โปรดสอบถามทางอีเมล เมื่อส่งอีเมลต้องระบุที่อยู่ SNS อย่างน้อยสองแห่ง (เช่น LinkedIn, Twitter) หลังเหตุการณ์ XZ backdoor จะไม่รับการติดต่อแบบไม่เปิดเผยตัวตน
ข้อยกเว้น
สถาบันการศึกษาสามารถใช้เอกสารนี้ได้อย่างอิสระ
สรุปโดย GN⁺
- เอกสารนี้เป็นคู่มือแบบกระชับที่ให้ความรู้พื้นฐานที่จำเป็นต่อการทำความเข้าใจโมเดล Transformer
- จุดเด่นคือมีตัวอย่างโค้ด Python ที่ลงมือทำได้จริงและแหล่งอ้างอิงหลากหลาย เพื่อช่วยให้ผู้อ่านเรียนรู้ได้ด้วยตนเอง
- โมเดล Transformer เป็นแกนสำคัญของเทคโนโลยี AI สมัยใหม่ และการทำความเข้าใจเรื่องนี้มีความสำคัญอย่างมากสำหรับวิศวกร
- เอกสารนี้สามารถใช้งานได้อย่างอิสระในสถาบันการศึกษา ส่วนการใช้งานเชิงพาณิชย์ต้องได้รับอนุญาตจากผู้ถือลิขสิทธิ์
- เป็นแหล่งข้อมูลที่มีประโยชน์สำหรับผู้ที่ต้องการสำรวจเทคโนโลยีหรือโครงการอื่น ๆ ที่เกี่ยวข้องกับ Transformer
ยังไม่มีความคิดเห็น