พนักงาน Google 8 คนประดิษฐ์ AI ยุคใหม่: เรื่องราวเบื้องหลัง
- บทความวิชาการชื่อ "Attention Is All You Need" ที่เขียนขึ้นในฤดูใบไม้ผลิปี 2017 มีผู้เขียน 8 คน
- ทั้งหมดเป็นนักวิจัยของ Google และ Noam Shazeer ผู้มีประสบการณ์มากที่สุดในบรรดาผู้มีส่วนร่วม รู้สึกประหลาดใจเมื่อเห็นว่าชื่อของตนถูกจัดไว้เป็นลำดับแรก
- ผู้เขียนตัดสินใจ "ทำลาย" ธรรมเนียมการจัดอันดับตามระดับการมีส่วนร่วม โดยใส่เครื่องหมายดอกจันไว้ข้างชื่อทุกคน และเพิ่มเชิงอรรถว่า "ลำดับการระบุชื่อเป็นแบบสุ่ม"
จุดเริ่มต้นของการเปลี่ยนแปลงครั้งใหญ่
- บทความนี้ได้พัฒนาเทคโนโลยีที่เรียกว่าโครงข่ายประสาทเทียมในวงการ AI จนเปลี่ยนมันให้กลายเป็นระบบดิจิทัลทรงพลังที่ให้ความรู้สึกเหมือนเป็นผลผลิตจากสติปัญญาต่างดาว
- สถาปัตยกรรมนี้ถูกใช้เป็นส่วนประกอบลับของผลิตภัณฑ์ปัญญาประดิษฐ์อย่าง ChatGPT, Dall-E และ Midjourney
- บทความนี้กำลังจะครบรอบ 7 ปีนับจากการเผยแพร่ และได้รับสถานะระดับตำนาน
สถาปัตยกรรมแห่งการเปลี่ยนแปลง: Transformer
- เรื่องราวของ Transformer เริ่มต้นจากผู้เขียนคนที่สี่ชื่อ Jakob Uszkoreit
- Uszkoreit ออกแบบแนวทางใหม่โดยอาศัยไอเดียของเขาที่เรียกว่า self-attention
- เครือข่ายนี้สามารถอ้างอิงส่วนต่าง ๆ ของประโยคเพื่อแปลคำได้ ซึ่งช่วยให้ระบบสร้างคำแปลที่ดีขึ้น
ความร่วมมือและนวัตกรรม
- Uszkoreit คิดว่าโมเดล self-attention อาจเร็วและมีประสิทธิภาพมากกว่าโครงข่ายประสาทแบบเวียนกลับ
- ไอเดียนี้พัฒนาต่อผ่านความร่วมมือกับนักวิจัยคนอื่น ๆ เช่น Illia Polosukhin และ Ashish Vaswani
- พวกเขาเขียนเอกสารออกแบบชื่อ "Transformers: Iterative Self-Attention and Processing for Various Tasks"
การตีพิมพ์บทความและอิทธิพล
- ทีมวิจัยใช้โมเดล Transformer เพื่อทำงานแปลภาษา และวัดประสิทธิภาพด้วยเบนช์มาร์ก BLEU
- โมเดลใหม่ของพวกเขาเอาชนะคู่แข่งได้ และโมเดลขนาดใหญ่กว่าที่ชื่อ Big ก็ทำคะแนน BLEU ได้สูงพอจะทำลายสถิติเดิม
- บทความถูกส่งก่อนเส้นตายไม่นาน และ Google ก็รีบยื่นจดสิทธิบัตรชั่วคราวสำหรับผลงานนี้
ปฏิกิริยาของ Google และการเปลี่ยนแปลง
- ภายใน Google มองว่านี่เป็นเพียงอีกหนึ่งโปรเจกต์ AI ที่น่าสนใจ และ Google เริ่มผนวก Transformer เข้ากับผลิตภัณฑ์ตั้งแต่ปี 2018
- แต่การเปลี่ยนแปลงนี้ดูค่อนข้างระมัดระวังเมื่อเทียบกับการก้าวกระโดดแบบสุดขั้วของ OpenAI และการผสานระบบที่อิง Transformer เข้ากับสายผลิตภัณฑ์อย่างกล้าหาญของ Microsoft
ผู้เขียนที่ออกจาก Google
- ผู้เขียนทุกคนได้ออกจาก Google และกำลังทำงานในรูปแบบต่าง ๆ บนพื้นฐานของระบบที่พวกเขาสร้างขึ้น
- หลายคนในกลุ่มนี้ออกจาก Google ไปสู่สตาร์ตอัป AI แห่งใหม่
ความเห็นของ GN⁺
- บทความนี้อธิบายกำเนิดและพัฒนาการของโมเดล Transformer ซึ่งมีบทบาทสำคัญในวงการ AI ได้อย่างละเอียด จึงมอบมุมมองเชิงลึกที่น่าสนใจต่อวิวัฒนาการของเทคโนโลยี AI
- ปัจจุบันโมเดล Transformer คือเทคโนโลยีแกนหลักของการประมวลผลภาษาด้วยปัญญาประดิษฐ์ และเป็นสิ่งประดิษฐ์สำคัญที่เป็นรากฐานของ AI แบบสนทนาอย่าง ChatGPT
- บทความนี้แสดงให้เห็นว่าสภาพแวดล้อมการวิจัยที่เปี่ยมนวัตกรรมภายใน Google ทำให้เกิดความก้าวหน้าทางเทคนิคครั้งสำคัญได้อย่างไร
- อย่างไรก็ตาม ข้อเท็จจริงที่ว่า Google ใช้แนวทางค่อนข้างอนุรักษนิยมในการนำเทคโนโลยีนี้ไปใช้เชิงพาณิชย์ ก็เป็นบทเรียนสำคัญเกี่ยวกับความเร็วและกลยุทธ์ด้านนวัตกรรมขององค์กร
- บริษัทหรือผู้พัฒนาที่ต้องการนำเทคโนโลยีนี้ไปใช้ควรคำนึงถึงความซับซ้อนและความต้องการทรัพยากรของโมเดล Transformer แต่ประโยชน์ที่ได้รับจากมันนั้นมีมหาศาล
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
การอภิปรายเกี่ยวกับโมเดลแบบ attention:
การหวนรำลึกถึงยุครุ่งเรืองของ Google:
บทสนทนาเกี่ยวกับประวัติศาสตร์ AI:
การเปรียบเทียบระหว่าง Google กับ OpenAI:
การกล่าวถึงความร่วมมือของพนักงาน Google:
คำวิจารณ์ต่อกลยุทธ์ AI ของ Google:
เอกสารประวัติศาสตร์ AI ภายใน Google:
การให้ความสนใจกับความหลากหลายของผู้เขียน:
การสนับสนุนแผนก R&D: