ช่วงเวลาแบบ Stable Diffusion กำลังมาถึง LLM
(simonwillison.net)- การเปิดตัว Stable Diffuion (SD) ในเดือนสิงหาคม 2022 เป็นช่วงเวลาสำคัญ และได้จุดชนวนให้นวัตกรรมระเบิดขึ้นอย่างต่อเนื่องมาจนถึงตอนนี้
- ช่วงหลังมานี้ ControlNet ก้าวล้ำหน้า MidJourney และ DALL-E ในด้านความสามารถไปแล้ว
- การเปิดตัว SD ได้สร้างความสนใจรอบใหม่ต่อ generative AI และคลื่นนั้นก็ยิ่งรุนแรงขึ้นจากการเปิดตัว ChatGPT ในเดือนพฤศจิกายน
- ช่วงเวลาแบบ SD กำลังมาถึงโมเดลภาษาขนาดใหญ่ (LLM) เช่นกัน
- ตอนนี้สามารถรันโมเดลภาษาระดับ GPT-3 บนโน้ตบุ๊กส่วนตัวได้แล้ว
LLaMA
- LLM อย่าง GPT-3 มีต้นทุนในการสร้างและดูแลระบบสูงกว่าโมเดลสร้างภาพอย่างมาก
- โมเดลที่ดีที่สุดถูกสร้างโดยบริษัทอย่าง OpenAI และเข้าถึงได้ผ่าน API แต่ไม่ได้เปิดให้รันได้ด้วยตนเอง
- ตัวโมเดลเองก็มีขนาดใหญ่มาก ต่อให้ได้โมเดล GPT-3 มาก็ไม่สามารถรันบนฮาร์ดแวร์เชิงพาณิชย์ทั่วไปได้ (ต้องใช้ GPU ระดับ A100 หลายใบที่ราคาเกิน $8000 ต่อใบ)
- แม้ในช่วงหลายปีที่ผ่านมา จะมีโมเดลภาษาที่เปิดเผยสู่สาธารณะจำนวนมาก แต่ส่วนใหญ่ก็ไม่เหมาะกับการนำไปรันเองโดยตรง
- ทุกอย่างเปลี่ยนไปเพราะโมเดล LLaMA ของ Facebook และ LLama.cpp
- LLaMA ไม่ได้เป็นโอเพนอย่างสมบูรณ์ หากต้องการเข้าถึงโมเดลต้องยอมรับเงื่อนไขที่เข้มงวดบางประการ
- แต่มีใครบางคนอัปโหลด PR ที่ไม่เป็นทางการซึ่งดาวน์โหลดได้ผ่าน torrent ทำให้สามารถดาวน์โหลดได้
llama.cpp
- ถ้า LLaMA ยังรันบนโน้ตบุ๊กส่วนตัวได้ยาก มันก็ยังไม่ได้น่าสนใจเท่าไร
- Georgi Gerganov จากบัลแกเรีย เคยสร้าง Whisper.cpp ที่พอร์ตโมเดลรู้จำเสียง Whisper ของ OpenAI มาเป็น C++ มาก่อน
- และเขาก็ทำสิ่งเดียวกันกับ LLaMA
- เขาตั้งเป้าให้มันรันบน MacBook ได้ โดยใช้ 4-bit quantization (เทคนิคที่ลดขนาดโมเดลเพื่อให้ทำงานบนฮาร์ดแวร์ที่ช้ากว่าได้)
- ทำให้ขนาดของโมเดลลดลงเหลือ 4GB สำหรับโมเดล 7B และต่ำกว่า 8GB สำหรับโมเดล 13B
- มันทำงานบน MacBook ได้ดีมาก
- ทำให้สามารถรันโมเดล 13B ที่ Facebook อ้างว่าสามารถแข่งขันกับ GPT-3 ได้บนโน้ตบุ๊ก
- เมื่อเห็นข้อความที่ถูกสร้างขึ้นบนโน้ตบุ๊ก ก็ให้ความรู้สึกเหมือนโลกกำลังเปลี่ยนอีกครั้ง
- ผมเคยคิดว่าคงต้องรออีกหลายปีกว่าจะรันโมเดลระดับ GPT-3 บนอุปกรณ์ที่ผมมีได้ แต่ผมคิดผิด "อนาคตมาถึงที่นี่แล้ว"
นี่คือสถานการณ์ที่เลวร้ายที่สุดหรือเปล่า?
- ไม่ได้กังวลกับฉากทัศน์แบบนิยายวิทยาศาสตร์ และ LLM ที่รันบนโน้ตบุ๊กก็ไม่ได้จะกลายเป็น "AGI ที่ครองโลก"
- แต่ก็มีหลายวิธีที่เทคโนโลยีนี้อาจถูกนำไปใช้ในทางที่ไม่ดี
- การสร้างสแปม, การหลอกลวงเชิงรักแบบอัตโนมัติ, การปั่นป่วนและคำพูดแสดงความเกลียดชัง, ข่าวปลอมและข้อมูลเท็จ, การทำให้สุดโต่งแบบอัตโนมัติ
- ก่อนถึงช่วงเวลานี้ ยังมีแนวป้องกันบางๆ อยู่ เช่น บริษัทอย่าง OpenAI ที่ควบคุมวิธีที่ผู้คนโต้ตอบกับโมเดลเหล่านี้
- แต่ตอนนี้เมื่อแต่ละคนสามารถรันมันบนฮาร์ดแวร์ของตัวเองได้ กลไกควบคุมเหล่านั้นก็หายไป
แล้วจะใช้มันเพื่อจุดประสงค์ที่ดีได้อย่างไร?
- ผมคิดว่าสิ่งนี้จะส่งผลกระทบอย่างมากต่อสังคม และสิ่งที่ผมให้ความสำคัญอันดับแรกคือการชี้นำผลกระทบนั้นไปในทางบวก
- มันง่ายที่จะตกอยู่ในมุมมองแบบถากถางที่คิดว่า generative AI มีแต่โทษหรือเป็นการเสียเวลา
- โดยส่วนตัวแล้วผมใช้เครื่องมือ generative AI ทุกวัน มันช่วยเพิ่มผลิตภาพอย่างเป็นรูปธรรม และที่สำคัญกว่านั้นคือช่วยขยายความทะเยอทะยานต่อโปรเจกต์ที่ผมทำอยู่
- เมื่อสัปดาห์ก่อนผมใช้ ChatGPT เพื่อเรียนรู้ AppleScript ที่จำเป็นสำหรับโปรเจกต์ใหม่ได้ภายในเวลาเพียงหนึ่งชั่วโมง
- ผมจะยังคงสำรวจและแบ่งปันวิธีนำเทคโนโลยีนี้ไปใช้ในทางบวกต่อไป
สิ่งที่ควรจับตาต่อไป
- หาก Facebook ไม่ผ่อนปรนเงื่อนไขด้านไลเซนส์ LLaMA ก็คงจะจบลงแค่การเป็น PoC ว่าโมเดลลักษณะนี้สามารถรันบนฮาร์ดแวร์สำหรับผู้บริโภคได้
- ตอนนี้ได้เกิดการแข่งขันขึ้นแล้วในการปล่อยโมเดลภาษาแบบเปิดอย่างแท้จริง ที่ให้ความสามารถคล้าย ChatGPT บนอุปกรณ์ของผู้ใช้เอง
3 ความคิดเห็น
มีเนื้อหาว่ารันบน MacBook ได้ หากต้องการดูวิธีตั้งค่า LLAMA บน MacBook กรุณาอ้างอิงอันนี้: https://dev.l1x.be/posts/2023/03/12/using-llama-with-m1-mac/
(ถ้าท่านอื่นจะช่วยทำเป็นข่าวให้ก็ยินดีนะ :) b)
ขอบคุณสำหรับการแชร์
นี่เป็นบทความของ Simon Willison ที่คุ้นหน้าคุ้นตากันดีใน GeekNews ครับ
ผมคิดว่าตามที่เขาว่าไว้ หากเราสามารถรันโมเดลภาษาแบบนี้บนอุปกรณ์ส่วนตัวได้ "ความทะเยอทะยาน/ขอบเขตการพัฒนาของโปรเจกต์จะขยายออกไป"
แม้แต่ตอนที่ผมจะลองเพิ่มฟีเจอร์เกี่ยวกับ ChatGPT ให้ GeekNews เอง ก็ยังต้องกลับมาคิดอีกรอบเพราะค่าใช้จ่ายของ API
ตอนนี้เราเริ่มสามารถรัน LLM ที่ใช้งานได้ดีพอสมควรบนอุปกรณ์ส่วนตัวได้แล้ว เลยคาดหวังว่าจะเกิดขอบเขตการประยุกต์ใช้ที่หลากหลายขึ้นอีกมาก
อย่างที่ผมเขียนไว้ใน GeekNews Weekly ที่ออกวันนี้ด้วย
เพราะถ้าอยากให้เทรนด์เทคโนโลยีถูกพูดถึงต่อเนื่อง สิ่งสำคัญคือธุรกิจจริงที่อยู่บนฐานของเทคโนโลยีนั้นจะต้องถูกสร้างและเปิดตัวออกมาในระดับที่ช่วยผู้ใช้ได้จริง