โมเดล Phi-2 ของ Microsoft เปลี่ยนเป็นไลเซนส์ MIT
(huggingface.co)- ในคอมมิต
7e10f3eของที่เก็บ Hugging Face สำหรับ Phi-2 มีการเปลี่ยนไฟล์ 3 ไฟล์คือ LICENSE, NOTICE.md, README.md และการระบุไลเซนส์ถูกเปลี่ยนเป็น MIT - LICENSE ใหม่ถูกแทนที่ด้วยข้อความเต็มของ MIT License ทำให้อนุญาตการใช้งาน คัดลอก แก้ไข เผยแพร่ รีไลเซนส์ และจำหน่ายได้อย่างกว้างขวาง
- ข้อกำหนดหลายอย่างใน Microsoft Research License เดิม เช่น ห้ามวิศวกรรมย้อนกลับ, ข้อจำกัดการโฮสต์แบบอิสระ, การจัดการข้อมูลส่วนบุคคล, อนุญาโตตุลาการ, และข้อจำกัดความรับผิดค่าเสียหาย ถูกลบออก
- เมตาดาต้าใน README ใช้
license: mitแทนlicense_name: microsoft-research-licenseและยังคงลิงก์ LICENSE เดิมไว้ - NOTICE.md ใหม่ระบุ flash-attention เป็นคอมโพเนนต์จากบุคคลที่สาม และมีข้อความอนุญาตให้ทำวิศวกรรมย้อนกลับได้อย่างจำกัดเพื่อการดีบักการแก้ไขไลบรารี LGPL พร้อมทั้งรวม BSD 3-Clause License
ไฟล์ที่เปลี่ยนในคอมมิต
- คอมมิตของที่เก็บ
microsoft/phi-2บน Hugging Face แสดงเป็น “Upload 3 files” โดยไฟล์ที่ถูกเปลี่ยนมี 3 ไฟล์คือ LICENSE, NOTICE.md, README.md - สามารถดูรายการไฟล์ในสถานะของคอมมิตนั้นได้ที่ Browse files
LICENSE: เปลี่ยนจาก Microsoft Research License เป็น MIT License
- ไฟล์ LICENSE ถูกลบข้อความไลเซนส์เดิมออกและแทนที่ด้วยข้อความเต็มของ MIT License
- LICENSE ใหม่มี MIT License ต่อจากข้อความ
PhyAGI.และCopyright (c) Microsoft Corporation. - MIT License อนุญาตสิทธิ์ต่อไปนี้โดยไม่คิดค่าใช้จ่ายแก่ทุกคนที่ได้รับซอฟต์แวร์และไฟล์เอกสารที่เกี่ยวข้อง
- ใช้งาน คัดลอก แก้ไข รวมเข้าด้วยกัน
- เผยแพร่ แจกจ่าย รีไลเซนส์
- จำหน่ายสำเนาซอฟต์แวร์
- มอบสิทธิ์เดียวกันนี้ให้แก่ผู้ที่ได้รับซอฟต์แวร์
- เงื่อนไขคือ ต้องรวมประกาศลิขสิทธิ์และประกาศอนุญาตไว้ในสำเนาทั้งหมดหรือส่วนสำคัญของซอฟต์แวร์
- มีข้อปฏิเสธการรับประกันในรูปแบบ AS IS และไม่ให้การรับประกันทั้งโดยชัดแจ้งหรือโดยนัย รวมถึงความสามารถเชิงพาณิชย์ ความเหมาะสมต่อวัตถุประสงค์เฉพาะ และการไม่ละเมิดสิทธิ์
- ผู้ถือลิขสิทธิ์และผู้มีสิทธิ์จะไม่รับผิดชอบต่อคำเรียกร้อง ความเสียหาย หรือความรับผิดที่เกิดจากการใช้ซอฟต์แวร์หรือธุรกรรมอื่นที่เกี่ยวข้อง
ข้อจำกัดเดิมที่ถูกลบ
- ข้อจำกัดและข้อกฎหมายหลายรายการใน LICENSE เดิมถูกลบออก
- ข้อกำหนดที่ถูกลบมีดังนี้
- ห้ามทำ วิศวกรรมย้อนกลับ ดีคอมไพล์ หรือดิแอสเซมเบิลวัสดุ
- ห้ามลบ ลดทอน ปิดกั้น หรือแก้ไขประกาศของ Microsoft หรือซัพพลายเออร์
- ห้ามใช้งานในลักษณะที่ขัดต่อกฎหมาย หรือเพื่อสร้างหรือเผยแพร่มัลแวร์
- ห้ามแชร์ เผยแพร่ แจกจ่าย ให้เช่า จัดหาโซลูชันโฮสต์แบบอิสระ หรือโอนไปยังบุคคลที่สาม
- ข้อจำกัดเกี่ยวกับข้อมูลส่วนบุคคลก็ถูกตัดออกเช่นกัน
- ข้อมูลที่สามารถระบุตัวบุคคลได้ต้องไม่ถูกใช้เกินกว่าวัตถุประสงค์ที่ได้รับอนุมัติหรือได้รับความยินยอม
- ต้องไม่ใช้เพื่อติดต่อบุคคลนั้น
- เมื่อการวิจัยเสร็จสิ้น ต้องทำลายข้อมูลส่วนบุคคลรวมถึงแบ็กอัปและสำเนาทันที
- ข้อกำหนดที่ว่าหากส่งงานแก้ไขให้ Microsoft จะต้องมอบไลเซนส์อย่างกว้างขวางแก่ Microsoft ก็ถูกลบออก
- นอกจากนี้ยังมีการลบข้อกำหนดเกี่ยวกับการเผยแพร่ ฟีดแบ็ก ข้อจำกัดการส่งออก บริการสนับสนุน อนุญาโตตุลาการในสหรัฐฯ และการสละสิทธิ์ฟ้องแบบกลุ่ม กฎหมายที่ใช้บังคับ สิทธิผู้บริโภค ข้อปฏิเสธการรับประกัน และข้อจำกัดความรับผิดค่าเสียหาย
การเปลี่ยนเมตาดาต้าใน README
- การระบุไลเซนส์ในฟรอนต์แมตเตอร์ของ README.md ถูกเปลี่ยน
- รายการที่ถูกลบมีดังนี้
license:license_name: microsoft-research-license
- รายการใหม่คือ
license: mit license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSEยังคงอยู่- รายการ
inference: falseและlanguage: - enยังคงอยู่ใน diff ที่แสดง
NOTICE.md และการแจ้งคอมโพเนนต์จากบุคคลที่สาม
- ไฟล์ NOTICE.md ใหม่เริ่มต้นด้วยข้อความ “NOTICES AND INFORMATION” และ “Do Not Translate or Localize”
- Microsoft ระบุว่าซอฟต์แวร์นี้มีเนื้อหาจากบุคคลที่สามรวมอยู่ด้วย
- โค้ดโอเพนซอร์สบางส่วนของ Microsoft มีให้ที่
https://3rdpartysource.microsoft.comหรือสามารถร้องขอได้โดยส่งเช็คหรือธนาณัติ US $5.00 พร้อมชื่อผลิตภัณฑ์ ชื่อคอมโพเนนต์โอเพนซอร์ส แพลตฟอร์ม และหมายเลขเวอร์ชัน - ไม่ว่าข้อกำหนดอื่นจะว่าอย่างไร สามารถทำ วิศวกรรมย้อนกลับ กับซอฟต์แวร์นี้ได้ในขอบเขตที่จำเป็นต่อการดีบักการแก้ไขไลบรารีที่ใช้ไลเซนส์ GNU Lesser General Public License
- มี flash-attention รวมอยู่เป็นคอมโพเนนต์
- ประกาศของ flash-attention รวม BSD 3-Clause License
- เมื่อนำซอร์สโค้ดไปแจกจ่ายต่อ ต้องคงประกาศลิขสิทธิ์ รายการเงื่อนไข และข้อปฏิเสธความรับผิดไว้
- เมื่อนำไบนารีไปแจกจ่ายต่อ ต้องรวมประกาศและเงื่อนไขเดียวกันรวมถึงข้อปฏิเสธความรับผิดไว้ในเอกสารหรือสื่ออื่น
- ห้ามใช้ชื่อผู้ถือลิขสิทธิ์หรือผู้มีส่วนร่วมเพื่อโปรโมตผลิตภัณฑ์ต่อยอดโดยไม่ได้รับอนุญาตเป็นลายลักษณ์อักษรล่วงหน้า
- ประกาศ BSD 3-Clause ยังระบุว่าซอฟต์แวร์ดังกล่าวให้มาแบบ “AS IS” และจะไม่รับผิดชอบต่อความเสียหายทั้งทางตรง ทางอ้อม โดยบังเอิญ เป็นกรณีพิเศษ เชิงลงโทษ หรือเป็นผลสืบเนื่อง
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
การได้เห็น โมเดลแบบเปิด เหล่านี้ออกมานั้นน่าตื่นเต้นมากจริง ๆ
สิ่งที่น่าสนใจคือ “นักจริยธรรม” ด้าน AI อยากทำตัวเหมือนกลุ่มนักบวชชั้นสูงที่ควบคุมการเข้าถึงโมเดลแมชชีนเลิร์นนิงโดยอ้างเรื่องความปลอดภัย แต่ผมมองว่าความเสี่ยงใหญ่ที่สุดของ AI อยู่ที่คนที่ควบคุมโมเดลจะใช้โมเดลนั้นควบคุมและเซ็นเซอร์ว่าผู้คนสามารถเขียนอะไรได้บ้าง
ผมคิดว่าโมเดลโอเพ่นซอร์สที่อยู่ในมือสาธารณชนคือแนวป้องกันที่ดีที่สุดต่อความเสี่ยงที่แท้จริงของ AI และขอชื่นชม Facebook, Microsoft, Mistral ที่ผลักดันเรื่องนี้
แนะนำให้อ่านเหตุผลจริง ๆ ไม่ใช่แค่สรุปจากโซเชียลมีเดีย มีการถกเถียงที่ลึกกว่าที่คิดมาก ครอบคลุมความเสี่ยงที่กังวลกันอย่างกว้างขวาง และมีแนวทางแก้ไขที่ถูกเสนอไว้ด้วย แนวทางเหล่านั้นมีโอกาสใช้ได้จริงมากกว่าคำกล่าวอ้างว่าเป็น “แนวป้องกันที่ดีที่สุด”
มีคนจำนวนมากที่ให้ความสำคัญทั้งกับการทำให้เครื่องมือเหล่านี้เป็นประชาธิปไตย และการใช้งานอย่างปลอดภัยและมีจริยธรรม
การคาดหวังว่าคนไม่ดีจะเคารพถ้อยคำในไลเซนส์นั้นตั้งแต่แรกก็ไม่ใช่มาตรการควบคุมที่ดีอยู่แล้ว มันแค่ขัดขวางความก้าวหน้าและนวัตกรรมของคนที่มีเจตนาดีพอจะปฏิบัติตามกฎหมายเท่านั้น ส่วนคนที่มีเจตนาอื่นในที่อย่างรัสเซีย เกาหลีเหนือ จีน รวมถึงองค์กรอาชญากรรมและมิจฉาชีพ ไม่ได้ถูกผูกมัดด้วยแนวคิดแบบนั้น
ชุมชนที่ทำงานภายใต้ไลเซนส์โอเพ่นซอร์สที่เหมาะสมกำลังเติบโต และสิ่งที่น่าสนใจก็เกิดขึ้นเร็วขึ้นเรื่อย ๆ ไลเซนส์ทางเลือกมีประสิทธิผลต่ำ ตัดขาดการเชื่อมโยงกับชุมชนนั้น ทำให้การร่วมมือซับซ้อนขึ้น และกลายเป็นส่วนน้อยลงเรื่อย ๆ ในงานวิจัยโดยรวม ดังนั้นไลเซนส์แบบนั้นจึงค่อย ๆ ไร้ความหมาย
การแก้ให้ถูกต้องทำให้สถานะจากมุมมองทางกฎหมายเรียบง่ายและเป็นมาตรฐาน ช่วยให้การนำไปใช้เชิงพาณิชย์ การร่วมมือ และงานวิจัยง่ายขึ้น ดูเหมือนว่า Microsoft ยอมรับอย่างมีเหตุผลว่าตรงนั้นมีคุณค่า และกำลังปรับให้เข้ากับความเป็นจริง
ก่อนหน้านี้เป็น ไลเซนส์แบบไม่ใช่เชิงพาณิชย์ เลยทำให้ความคาดหวังลดลงไปเล็กน้อย
เมื่อพิจารณาจากประสิทธิภาพและขนาด การเปลี่ยนเป็นไลเซนส์ที่เป็นมิตรต่อการใช้งานเชิงพาณิชย์ถือเป็นเรื่องค่อนข้างใหญ่
จุดสำคัญคือโมเดลนี้มี ความสามารถในการให้เหตุผล ที่ยอดเยี่ยม
อย่างไรก็ตาม มันจงใจไม่ได้ฝึกด้วยชุดข้อมูลเว็บครอว์ลขนาดใหญ่ เพื่อไม่ให้เรียนรู้วิธีทำระเบิดหรือทำ “เรื่องไม่ดี”
ดังนั้นเมื่อเทียบกับโมเดลระดับเดียวกัน หรือแม้แต่โมเดลที่มีพารามิเตอร์มากกว่า มันเป็นโมเดลที่ “คิดได้ฉลาดที่สุด” แต่มีความรู้เกี่ยวกับโลกหรือความรู้จิปาถะค่อนข้างน้อย
อนาคตอาจเปลี่ยนไปได้ แต่ผมมองว่าสถานะปัจจุบันเป็นแบบนี้
เพราะผมต้องการให้คำตอบอิงจากข้อมูลที่ผมให้ ไม่ใช่สิ่งที่เรียนรู้มาจากเว็บ
งานจำนวนมากไม่ต้องการความรู้ทั่วไป และโดยเฉพาะใน RAG ข้อดีนี้สำคัญมาก
การให้ข้อมูลผ่าน การค้นคืน น่าจะดีกว่า และผลลัพธ์คือคำตอบแบบ “ดูเหมือนฉลาดอย่างน่าเชื่อ แต่ผิดทั้งหมด” จะลดลง
หากมีข้อมูลที่ฝังอยู่ในตัวน้อยลง ก็จะใช้งานทั่วไปนอกเหนือจากขอบเขตผู้ช่วยแชตได้มากขึ้น เพราะหลายกรณีเราต้องการให้โมเดลรู้เฉพาะข้อมูลที่ผู้ใช้ให้มาเท่านั้น
เช่น ในเกมแฟนตาซียุคกลาง ถ้าตัวละครจู่ ๆ เริ่มพูดเรื่องการเมืองสหรัฐฯ ก็คงแปลกมาก Phi-2 เองก็อาจยังแก้ได้ไม่หมดหากไม่มีการ fine-tune แต่ประเด็นคือทิศทางแบบนั้น
ผมอยากรู้เรื่อง ชุดข้อมูล มากกว่าเรื่องโมเดล
เป็นการเปลี่ยนแปลงที่ยอดเยี่ยม และยังแสดงให้เห็นว่าทำไม โครงการโอเพ่นซอร์ส อิสระจึงสำคัญ
คงยากที่จะบอกว่าการที่ TinyLlama เผยแพร่ภายใต้ไลเซนส์ Apache 2.0 ไม่มีผลต่อการเปลี่ยนแปลงครั้งนี้
ดูเหมือนเป็นสัญญาณว่า Phi-3 และโมเดลรุ่นถัดไปจะทำให้ Phi-2 ล้าสมัย
โมเดลนี้อยู่ในอันดับต้น ๆ มาค่อนข้างนานแล้ว มันดีตรงไหนกัน?
เป็นโมเดลที่ดีที่สุดที่รันได้แม้บนอุปกรณ์ขนาดเล็กอย่างโทรศัพท์มือถือ ขณะเดียวกันก็ให้ประสิทธิภาพใกล้เคียง GPT-3.5
สถาปัตยกรรมและข้อมูลฝึกก็น่าสนใจด้วย เป็นโมเดลแบบ sparse ที่ใช้ข้อมูลสังเคราะห์ที่คัดสรรมา จึงทำความแม่นยำได้สูงกว่าโมเดลที่ฝึกจากข้อความอินเทอร์เน็ตแบบสุ่มมาก