- บริษัท AI ชั้นนำและสถาบันวิจัยของยุโรปประกาศโครงการ OpenEuroLLM เพื่อร่วมกันพัฒนาโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพนซอร์สรุ่นถัดไป
- มุ่งสู่ประสิทธิภาพสูงและการรองรับหลายภาษา พร้อมสร้างโมเดลที่โปร่งใสและสอดคล้องตามข้อกำหนด ซึ่งสามารถนำไปใช้ได้ทั้งในบริการเชิงพาณิชย์และภาครัฐ
- พัฒนาเป็นโมเดลโอเพนซอร์สที่โปร่งใสและปฏิบัติตามกฎระเบียบ โดยยึดตามกรอบกำกับดูแลของยุโรประหว่างกระบวนการพัฒนา เพื่อทำให้การเข้าถึงเทคโนโลยี AI คุณภาพสูงเป็นเรื่องทั่วไป และช่วยให้บริษัทในยุโรปมีความสามารถในการแข่งขันในตลาดโลก
- ได้รับการรับรอง STEP (Strategic Technologies for Europe Platform) และได้รับเงินทุนสนับสนุนจากโครงการ Digital Europe Programme ของสหภาพยุโรป โดยเริ่มอย่างเป็นทางการตั้งแต่วันที่ 1 กุมภาพันธ์ 2025
เนื้อหาสำคัญของโครงการ
- ชื่อโครงการ: OpenEuroLLM
- เป้าหมาย
- เสริมสร้างและยกระดับความสามารถในการแข่งขันด้าน AI และอธิปไตยดิจิทัลของยุโรปผ่านโอเพนซอร์ส LLM
- แสดงให้เห็นถึงความสำคัญของความโปร่งใส ความเปิดกว้าง และการมีส่วนร่วมของชุมชนในระบบนิเวศเทคโนโลยีของยุโรป
- พัฒนาภายใต้กรอบกำกับดูแลที่เข้มแข็งของยุโรป เพื่อคงไว้ซึ่งคุณค่าของยุโรปและความเป็นเลิศทางเทคโนโลยี
- เปิดให้ใช้งานได้อย่างอิสระทั้งในภาคธุรกิจและภาครัฐ และสามารถทำการ fine-tuning ให้เหมาะกับแต่ละอุตสาหกรรมได้
- เสริมความแข็งแกร่งให้สภาพแวดล้อมแบบหลายภาษาโดยคำนึงถึงความหลากหลายทางภาษาและวัฒนธรรมในยุโรป และช่วยให้บริษัทในยุโรปพัฒนาผลิตภัณฑ์และบริการคุณภาพสูงในยุค AI ได้
- ขอบเขตการดำเนินงาน
- ร่วมพัฒนาโมเดลและซอฟต์แวร์ใหม่ โดยต่อยอดจากผลงานที่มีอยู่แล้ว เช่น คลังข้อมูลคุณภาพสูงและ LLM ต้นแบบ
- ร่วมมือกับคอมมูนิตี้โอเพนซอร์สและผู้เชี่ยวชาญในอุตสาหกรรม เช่น LAION, open-sci, OpenML
- มุ่งสร้างรากฐานที่ทุกคนสามารถเข้าถึงและปรับปรุงได้ ผ่านแนวทางการพัฒนาและประเมินโมเดลที่โปร่งใส
องค์ประกอบของพันธมิตร
- มหาวิทยาลัยและสถาบันวิจัย
- Charles University (สาธารณรัฐเช็ก, ผู้ประสานงาน), ALT-EDIC (ฝรั่งเศส), Eindhoven University of Technology (เนเธอร์แลนด์), ELLIS Institute Tübingen (เยอรมนี), Fraunhofer IAIS (เยอรมนี) รวมทั้งหมด 11 แห่ง
- รับผิดชอบด้านข้อมูลขนาดใหญ่ การพัฒนาอัลกอริทึม และการตรวจสอบความถูกต้อง โดยอาศัยศักยภาพการวิจัยที่แข็งแกร่ง
- บริษัท
- AMD Silo AI (ฟินแลนด์, ผู้นำร่วม), Aleph Alpha Research (เยอรมนี), ellamind (เยอรมนี), LightOn (ฝรั่งเศส), Prompsit Language Engineering (สเปน) รวมทั้งหมด 5 บริษัท
- รับผิดชอบด้านการปรับแต่งโมเดลให้เหมาะกับภาคอุตสาหกรรม ความรู้ในการทำเชิงพาณิชย์ และการศึกษากรณีการประยุกต์ใช้ทางธุรกิจ
- ศูนย์ EuroHPC
- Barcelona Supercomputing Center (สเปน), Cineca Interuniversity Consortium (อิตาลี), CSC - IT Center for Science (ฟินแลนด์), SURF (เนเธอร์แลนด์)
- รับผิดชอบการสนับสนุนการฝึกและการทดลองผ่านการจัดหาโครงสร้างพื้นฐานคอมพิวเตอร์สมรรถนะสูงมาก
คุณค่าของโครงการและผลที่คาดว่าจะได้รับ
- โมเดลโอเพนซอร์สที่โปร่งใสและสอดคล้องตามกฎหมาย
- ปฏิบัติตามกฎระเบียบที่เข้มงวดและระบบคุณค่าของยุโรป พร้อมเปิดเผยโมเดลภาษาประสิทธิภาพสูงขนาดใหญ่ให้ทุกคนสามารถนำไปใช้ได้
- มีส่วนช่วยต่อความสามารถในการแข่งขันระดับโลกและนวัตกรรมบริการของหน่วยงานภาครัฐและภาคธุรกิจ
- รองรับหลายภาษาและความหลากหลายทางวัฒนธรรม
- วางรากฐานเพื่อช่วยให้สร้างบริการคุณภาพสูงได้ โดยสะท้อนความหลากหลายของภาษาและลักษณะเฉพาะทางวัฒนธรรมในยุโรปไว้ในโมเดล
- สร้างสภาพแวดล้อมที่เอื้อให้บริษัทในยุโรปสามารถนำเสนอผลิตภัณฑ์ที่มั่นคงและครอบคลุมด้วยเทคโนโลยีของตนเอง
- เสริมความแข็งแกร่งให้ระบบนิเวศ AI และความร่วมมือ
- สถาบันวิจัย บริษัท และศูนย์ซูเปอร์คอมพิวเตอร์ของยุโรปร่วมกันผสานโครงสร้างพื้นฐานและความเชี่ยวชาญ
- คาดว่าจะเกิดการปรับปรุงอย่างต่อเนื่องและเพิ่มความสามารถในการขยายผ่านคอมมูนิตี้โอเพนซอร์สและความร่วมมือเชิงกลยุทธ์
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
มีความเห็นเชิงกังขาเกี่ยวกับโครงการที่มีหลายสถาบันเข้าร่วม โดยกังวลว่าแม้จะมีผู้เข้าร่วมจำนวนมาก แต่การร่วมมือกันอาจเป็นเรื่องยากเพราะแต่ละฝ่ายมีลำดับความสำคัญต่างกัน และจากประสบการณ์ที่ผ่านมาอาจลงเอยด้วยการมุ่งทำวิจัยแยกกันมากกว่าร่วมมือกัน
มีความเห็นว่าแม้โครงการ AI ของยุโรปจะยากต่อการแข่งกับห้องวิจัยขนาดใหญ่ แต่ก็อาจเป็นโอกาสในการผลักดัน AI ผ่านโมเดลโอเพนซอร์ส แม้ยุโรปจะลดช่องว่างกับสหรัฐฯ และจีนได้ยาก แต่ก็อาจเป็นตัวเร่งให้ความสามารถในการแข่งขันสูงขึ้น
มีความเห็นว่างบประมาณที่จัดสรรให้โครงการยังไม่เพียงพอ โดยมองว่าโครงการ AI ของยุโรปควรได้รับเงินทุนมากกว่านี้มาก
มีความเห็นว่าโครงการจะมอบโมเดล AI ที่โปร่งใสและสอดคล้องกับข้อกำหนด แต่ในด้านประสิทธิภาพอาจไม่เป็นไปตามความคาดหวัง
มีความเห็นว่าสาเหตุที่ห้องวิจัยและบริษัท AI รายใหญ่ของยุโรปไม่ได้เข้าร่วมโครงการ เป็นเพราะโครงการมีโอกาสล้มเหลวสูง
มีความเห็นที่เน้นย้ำความสำคัญของโครงการ โดยมองว่าการที่ยุโรปสร้างโครงสร้างพื้นฐาน AI ที่เป็นอิสระเป็นสิ่งจำเป็น และคาดหวังว่า Open LLM จะยกระดับมาตรฐานความสำเร็จระยะยาวของ AI
มีความเห็นว่าโครงการมีทั้งข้อมูลที่ดีและโมเดลที่มีอยู่แล้ว อีกทั้งยังอาจคาดหวังผลลัพธ์เชิงพาณิชย์ได้ โดยมีบริษัทอย่าง Red Hat, Volvo และ SAAB เข้าร่วม
มีความเห็นว่ากฎคุ้มครองข้อมูลส่วนบุคคลของยุโรปในทางปฏิบัติยังไม่ได้สร้างความแตกต่างมากนัก และคาดหวังว่ายุโรปจะสามารถแก้ปัญหานี้ได้ในไม่ช้า