- เวอร์ชันที่ใหญ่ที่สุดของ Llama 3 มีกำหนดเปิดตัวในช่วงฤดูร้อนนี้ และโมเดลขนาดเล็กสองรุ่นจะเปิดตัวในสัปดาห์หน้า
- การเปิดตัวโมเดลขนาดเล็กจะช่วยกระตุ้นความคาดหวังต่อ Llama 3
- คาดว่า Llama 3 จะมีความสามารถในการตอบคำถามจากภาพเช่นเดียวกับ GPT-4 ของ OpenAI
- เวอร์ชันที่ใหญ่ที่สุดจะเป็นโมเดลมัลติโหมดที่สามารถเข้าใจและสร้างได้ทั้งข้อความและภาพ
- ในทางกลับกัน โมเดลขนาดเล็กสองรุ่นที่จะเปิดตัวในสัปดาห์หน้าจะไม่ใช่มัลติโหมด
ข้อดีและข้อเสียตามขนาดของโมเดล
- โดยทั่วไป โมเดลขนาดเล็กมีต้นทุนการรันต่ำกว่าและทำงานได้เร็วกว่าโมเดลขนาดใหญ่
- สิ่งนี้ยิ่งมีคุณค่ามากขึ้นเมื่อคำนึงถึงต้นทุนในการรันโมเดลขนาดใหญ่
- โมเดลขนาดเล็กยังมีประโยชน์ต่อผู้พัฒนาที่ต้องการสร้างซอฟต์แวร์ AI บนอุปกรณ์พกพา
ความคืบหน้าการพัฒนาโมเดล Llama ของ Meta
- ก่อนหน้านี้ Meta ได้เปิดตัว Llama 2 สามรุ่น
- รุ่นที่ใหญ่ที่สุดมีพารามิเตอร์ 70 พันล้านตัว
- อีกสองรุ่นมีพารามิเตอร์ 13 พันล้านและ 7 พันล้านตัวตามลำดับ
- คาดว่าเวอร์ชันที่ใหญ่ที่สุดของ Llama 3 จะมีพารามิเตอร์มากกว่า 140 พันล้านตัว
- Meta กำลังใช้ Llama 2 เพื่อขับเคลื่อนฟีเจอร์ผู้ช่วย AI ในแอปของบริษัท
- ในช่วงไม่กี่เดือนที่ผ่านมา พนักงานในฝ่าย generative AI ของ Meta พยายามทำให้ Llama 3 เปิดกว้างมากขึ้น เนื่องจากมองว่า Llama 2 ตอบคำถามที่มีประเด็นอ่อนไหวอย่างระมัดระวังเกินไป
ความเห็นของ GN⁺
- การเปิดตัว Llama 3 เวอร์ชันขนาดเล็กของ Meta Platforms แสดงให้เห็นว่าการแข่งขันในตลาดโมเดลภาษา AI กำลังทวีความเข้มข้นขึ้น ขณะที่ผู้เล่นรายใหญ่อย่าง Google และ xAI ของ Elon Musk ต่างก็เปิดตัวโมเดลโอเพนซอร์สอยู่แล้ว การเคลื่อนไหวครั้งนี้ของ Meta จึงอาจตีความได้ว่าเป็นกลยุทธ์เพื่อชิงส่วนแบ่งตลาดและรักษาความเป็นผู้นำทางเทคโนโลยี
- การเปิดตัวโมเดลเวอร์ชันขนาดเล็กอาจเป็นกลยุทธ์การตลาดที่มอบเครื่องมือใหม่ให้แก่นักพัฒนาและนักวิจัย พร้อมทั้งช่วยเพิ่มความสนใจและความคาดหวังต่อโมเดลเวอร์ชันใหญ่ โดยเปิดโอกาสให้ผู้ใช้ได้ทดลองและคุ้นเคยกับโมเดลขนาดเล็กก่อนใช้งานโมเดลขนาดใหญ่จริง
- การเปิดตัวโมเดลภาษาขนาดใหญ่มีความซับซ้อนทางเทคนิคอย่างมาก และต้องใช้ทรัพยากรคอมพิวเตอร์รวมถึงความเชี่ยวชาญจำนวนมากในการฝึกและดูแลโมเดลเหล่านี้อย่างมีประสิทธิภาพ แม้ Meta จะมีทรัพยากรดังกล่าว แต่ประเด็นเรื่องการใช้งานอย่างมีจริยธรรมและปัญหาอคติของโมเดลก็ยังคงเป็นข้อพิจารณาสำคัญ
- ยังไม่ชัดเจนว่าโมเดล Llama 3 ของ Meta จะแตกต่างจากโมเดลโอเพนซอร์สอื่นอย่างไร และจะมอบความสามารถใหม่หรือนวัตกรรมอะไรบ้าง ซึ่งอาจกลายเป็นหัวข้อถกเถียงที่น่าสนใจในชุมชนเทคโนโลยี
- การเปิดตัวโมเดลโอเพนซอร์สช่วยผลักดันการทำให้เทคโนโลยีเข้าถึงได้อย่างทั่วถึงและเอื้อต่อการสร้างนวัตกรรมมากขึ้น อย่างไรก็ตาม เมื่ออิทธิพลของโมเดลเหล่านี้เพิ่มขึ้น ความกังวลเรื่องการแพร่กระจายข้อมูลเท็จ การละเมิดลิขสิทธิ์ และปัญหาความเป็นส่วนตัวก็เพิ่มขึ้นตามไปด้วย
ยังไม่มีความคิดเห็น