Hello OLMo ปรากฏตัวขึ้นในฐานะ LLM แบบเปิดอย่างแท้จริง
(blog.allenai.org)-
AI2 เปิดตัวโมเดล OLMo 7B ซึ่งเป็นโมเดลภาษาขนาดใหญ่แบบโอเพนซอร์สในความหมายที่แท้จริง โดยเปิดเผยทั้งข้อมูลพรีเทรนและโค้ดสำหรับการฝึก
- ทำให้นักวิจัยและนักพัฒนาสามารถใช้โมเดลเปิดที่ดีที่สุดเพื่อร่วมกันผลักดันวิทยาศาสตร์ของโมเดลภาษาให้ก้าวหน้า
- Yann LeCun นักวิทยาศาสตร์ AI ของ Meta กล่าวว่าชุมชนโอเพนซอร์สสามารถสร้างอนาคตของ AI ได้เร็วและมีประสิทธิภาพที่สุด
-
คุณลักษณะสำคัญของเฟรมเวิร์ก OLMo:
- ข้อมูลพรีเทรนแบบครบถ้วน: ใช้ชุดข้อมูล Dolma ของ AI2 และรวมโค้ดที่ใช้สร้างข้อมูลฝึกไว้ด้วย
- โค้ดการฝึกและค่าน้ำหนักของโมเดล: ให้ค่าน้ำหนักของโมเดลทั้งหมด โค้ดสำหรับอนุมาน ตัวชี้วัดการฝึก บันทึกการฝึก ฯลฯ สำหรับโมเดล 4 รุ่นย่อยในสเกล 7B
- การประเมินผล: ภายใต้โครงการ Catwalk ได้เปิดเผยเครื่องมือประเมินที่ใช้ในการพัฒนา เช่น เช็กพอยต์มากกว่า 500 รายการและโค้ดประเมินผล
-
ผ่าน OLMo นักวิจัยและนักพัฒนา AI จะได้รับประสบการณ์ดังต่อไปนี้:
- การวิเคราะห์ที่แม่นยำยิ่งขึ้น: สามารถทำงานได้รวดเร็วยิ่งขึ้นบนพื้นฐานของความเข้าใจเชิงลึกอย่างครบถ้วนเกี่ยวกับข้อมูลฝึก
- ลดการปล่อยคาร์บอน: การเปิดเผยระบบนิเวศทั้งหมดของการฝึกและการประเมินช่วยลดการพัฒนาที่ซ้ำซ้อน
- ผลลัพธ์ที่ต่อเนื่อง: การเปิดเผยโมเดลและชุดข้อมูลช่วยให้เรียนรู้จากโมเดลก่อนหน้าและต่อยอดได้
-
OLMo สามารถพัฒนาได้ผ่านความร่วมมือกับ AMD, CSC (Lumi Supercomputer), University of Washington, Databricks และอีกหลายแห่ง
ความเห็นของ GN⁺
- การเปิดเผยข้อมูลฝึกและโค้ดเพื่อเพิ่มความโปร่งใสของโมเดล AI ดูมีความหมายอย่างมาก อย่างไรก็ตาม อาจยังมีปัญหาอย่างอคติของข้อมูล จึงน่าจะต้องมีการตรวจสอบในประเด็นนี้ด้วย
- คาดว่าการกระตุ้นระบบนิเวศของโมเดลภาษาโอเพนซอร์สจะช่วยเร่งความก้าวหน้าทางเทคโนโลยี แต่ก็คงต้องติดตามว่าจะสร้างผลงานได้มากเพียงใดในการแข่งขันกับโมเดล AI แบบปิดของบริษัทยักษ์ใหญ่ด้านไอที
- ความร่วมมือกับสถาบันหลากหลายแห่งดูมีความสำคัญอย่างยิ่งต่อการจัดหาทรัพยากรคอมพิวต์มหาศาลที่จำเป็นสำหรับการพัฒนา AI และน่าจะเป็นแบบอย่างที่ดีของความร่วมมือระหว่างภาควิชาการกับภาคอุตสาหกรรม
- คาดว่า OLMo จะช่วยให้การวิจัยเชิงวิทยาศาสตร์เกี่ยวกับหลักการทำงานของโมเดลภาษาคึกคักมากขึ้น ซึ่งอาจนำไปสู่การพัฒนา AI ที่ปลอดภัยและน่าเชื่อถือยิ่งขึ้น
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News