โมเดล Phi-2 ของ Microsoft เปลี่ยนเป็นไลเซนส์ MIT

(huggingface.co)

2 คะแนน โดย GN⁺ 2024-01-08 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ในคอมมิต 7e10f3e ของที่เก็บ Hugging Face สำหรับ Phi-2 มีการเปลี่ยนไฟล์ 3 ไฟล์คือ LICENSE, NOTICE.md, README.md และการระบุไลเซนส์ถูกเปลี่ยนเป็น MIT
LICENSE ใหม่ถูกแทนที่ด้วยข้อความเต็มของ MIT License ทำให้อนุญาตการใช้งาน คัดลอก แก้ไข เผยแพร่ รีไลเซนส์ และจำหน่ายได้อย่างกว้างขวาง
ข้อกำหนดหลายอย่างใน Microsoft Research License เดิม เช่น ห้ามวิศวกรรมย้อนกลับ, ข้อจำกัดการโฮสต์แบบอิสระ, การจัดการข้อมูลส่วนบุคคล, อนุญาโตตุลาการ, และข้อจำกัดความรับผิดค่าเสียหาย ถูกลบออก
เมตาดาต้าใน README ใช้ license: mit แทน license_name: microsoft-research-license และยังคงลิงก์ LICENSE เดิมไว้
NOTICE.md ใหม่ระบุ flash-attention เป็นคอมโพเนนต์จากบุคคลที่สาม และมีข้อความอนุญาตให้ทำวิศวกรรมย้อนกลับได้อย่างจำกัดเพื่อการดีบักการแก้ไขไลบรารี LGPL พร้อมทั้งรวม BSD 3-Clause License

ไฟล์ที่เปลี่ยนในคอมมิต

คอมมิตของที่เก็บ microsoft/phi-2 บน Hugging Face แสดงเป็น “Upload 3 files” โดยไฟล์ที่ถูกเปลี่ยนมี 3 ไฟล์คือ LICENSE, NOTICE.md, README.md
สามารถดูรายการไฟล์ในสถานะของคอมมิตนั้นได้ที่ Browse files

LICENSE: เปลี่ยนจาก Microsoft Research License เป็น MIT License

ไฟล์ LICENSE ถูกลบข้อความไลเซนส์เดิมออกและแทนที่ด้วยข้อความเต็มของ MIT License
LICENSE ใหม่มี MIT License ต่อจากข้อความ PhyAGI. และ Copyright (c) Microsoft Corporation.
MIT License อนุญาตสิทธิ์ต่อไปนี้โดยไม่คิดค่าใช้จ่ายแก่ทุกคนที่ได้รับซอฟต์แวร์และไฟล์เอกสารที่เกี่ยวข้อง
- ใช้งาน คัดลอก แก้ไข รวมเข้าด้วยกัน
- เผยแพร่ แจกจ่าย รีไลเซนส์
- จำหน่ายสำเนาซอฟต์แวร์
- มอบสิทธิ์เดียวกันนี้ให้แก่ผู้ที่ได้รับซอฟต์แวร์
เงื่อนไขคือ ต้องรวมประกาศลิขสิทธิ์และประกาศอนุญาตไว้ในสำเนาทั้งหมดหรือส่วนสำคัญของซอฟต์แวร์
มีข้อปฏิเสธการรับประกันในรูปแบบ AS IS และไม่ให้การรับประกันทั้งโดยชัดแจ้งหรือโดยนัย รวมถึงความสามารถเชิงพาณิชย์ ความเหมาะสมต่อวัตถุประสงค์เฉพาะ และการไม่ละเมิดสิทธิ์
ผู้ถือลิขสิทธิ์และผู้มีสิทธิ์จะไม่รับผิดชอบต่อคำเรียกร้อง ความเสียหาย หรือความรับผิดที่เกิดจากการใช้ซอฟต์แวร์หรือธุรกรรมอื่นที่เกี่ยวข้อง

ข้อจำกัดเดิมที่ถูกลบ

ข้อจำกัดและข้อกฎหมายหลายรายการใน LICENSE เดิมถูกลบออก
ข้อกำหนดที่ถูกลบมีดังนี้
- ห้ามทำ วิศวกรรมย้อนกลับ ดีคอมไพล์ หรือดิแอสเซมเบิลวัสดุ
- ห้ามลบ ลดทอน ปิดกั้น หรือแก้ไขประกาศของ Microsoft หรือซัพพลายเออร์
- ห้ามใช้งานในลักษณะที่ขัดต่อกฎหมาย หรือเพื่อสร้างหรือเผยแพร่มัลแวร์
- ห้ามแชร์ เผยแพร่ แจกจ่าย ให้เช่า จัดหาโซลูชันโฮสต์แบบอิสระ หรือโอนไปยังบุคคลที่สาม
ข้อจำกัดเกี่ยวกับข้อมูลส่วนบุคคลก็ถูกตัดออกเช่นกัน
- ข้อมูลที่สามารถระบุตัวบุคคลได้ต้องไม่ถูกใช้เกินกว่าวัตถุประสงค์ที่ได้รับอนุมัติหรือได้รับความยินยอม
- ต้องไม่ใช้เพื่อติดต่อบุคคลนั้น
- เมื่อการวิจัยเสร็จสิ้น ต้องทำลายข้อมูลส่วนบุคคลรวมถึงแบ็กอัปและสำเนาทันที
ข้อกำหนดที่ว่าหากส่งงานแก้ไขให้ Microsoft จะต้องมอบไลเซนส์อย่างกว้างขวางแก่ Microsoft ก็ถูกลบออก
นอกจากนี้ยังมีการลบข้อกำหนดเกี่ยวกับการเผยแพร่ ฟีดแบ็ก ข้อจำกัดการส่งออก บริการสนับสนุน อนุญาโตตุลาการในสหรัฐฯ และการสละสิทธิ์ฟ้องแบบกลุ่ม กฎหมายที่ใช้บังคับ สิทธิผู้บริโภค ข้อปฏิเสธการรับประกัน และข้อจำกัดความรับผิดค่าเสียหาย

การเปลี่ยนเมตาดาต้าใน README

การระบุไลเซนส์ในฟรอนต์แมตเตอร์ของ README.md ถูกเปลี่ยน
รายการที่ถูกลบมีดังนี้
- license:
- license_name: microsoft-research-license
รายการใหม่คือ license: mit
license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSE ยังคงอยู่
รายการ inference: false และ language: - en ยังคงอยู่ใน diff ที่แสดง

NOTICE.md และการแจ้งคอมโพเนนต์จากบุคคลที่สาม

ไฟล์ NOTICE.md ใหม่เริ่มต้นด้วยข้อความ “NOTICES AND INFORMATION” และ “Do Not Translate or Localize”
Microsoft ระบุว่าซอฟต์แวร์นี้มีเนื้อหาจากบุคคลที่สามรวมอยู่ด้วย
โค้ดโอเพนซอร์สบางส่วนของ Microsoft มีให้ที่ https://3rdpartysource.microsoft.com หรือสามารถร้องขอได้โดยส่งเช็คหรือธนาณัติ US $5.00 พร้อมชื่อผลิตภัณฑ์ ชื่อคอมโพเนนต์โอเพนซอร์ส แพลตฟอร์ม และหมายเลขเวอร์ชัน
ไม่ว่าข้อกำหนดอื่นจะว่าอย่างไร สามารถทำ วิศวกรรมย้อนกลับ กับซอฟต์แวร์นี้ได้ในขอบเขตที่จำเป็นต่อการดีบักการแก้ไขไลบรารีที่ใช้ไลเซนส์ GNU Lesser General Public License
มี flash-attention รวมอยู่เป็นคอมโพเนนต์
ประกาศของ flash-attention รวม BSD 3-Clause License
- เมื่อนำซอร์สโค้ดไปแจกจ่ายต่อ ต้องคงประกาศลิขสิทธิ์ รายการเงื่อนไข และข้อปฏิเสธความรับผิดไว้
- เมื่อนำไบนารีไปแจกจ่ายต่อ ต้องรวมประกาศและเงื่อนไขเดียวกันรวมถึงข้อปฏิเสธความรับผิดไว้ในเอกสารหรือสื่ออื่น
- ห้ามใช้ชื่อผู้ถือลิขสิทธิ์หรือผู้มีส่วนร่วมเพื่อโปรโมตผลิตภัณฑ์ต่อยอดโดยไม่ได้รับอนุญาตเป็นลายลักษณ์อักษรล่วงหน้า
ประกาศ BSD 3-Clause ยังระบุว่าซอฟต์แวร์ดังกล่าวให้มาแบบ “AS IS” และจะไม่รับผิดชอบต่อความเสียหายทั้งทางตรง ทางอ้อม โดยบังเอิญ เป็นกรณีพิเศษ เชิงลงโทษ หรือเป็นผลสืบเนื่อง

1 ความคิดเห็น

GN⁺ 2024-01-08

ความคิดเห็นบน Hacker News

การได้เห็น โมเดลแบบเปิด เหล่านี้ออกมานั้นน่าตื่นเต้นมากจริง ๆ
สิ่งที่น่าสนใจคือ “นักจริยธรรม” ด้าน AI อยากทำตัวเหมือนกลุ่มนักบวชชั้นสูงที่ควบคุมการเข้าถึงโมเดลแมชชีนเลิร์นนิงโดยอ้างเรื่องความปลอดภัย แต่ผมมองว่าความเสี่ยงใหญ่ที่สุดของ AI อยู่ที่คนที่ควบคุมโมเดลจะใช้โมเดลนั้นควบคุมและเซ็นเซอร์ว่าผู้คนสามารถเขียนอะไรได้บ้าง
ผมคิดว่าโมเดลโอเพ่นซอร์สที่อยู่ในมือสาธารณชนคือแนวป้องกันที่ดีที่สุดต่อความเสี่ยงที่แท้จริงของ AI และขอชื่นชม Facebook, Microsoft, Mistral ที่ผลักดันเรื่องนี้
- การมอง “นักจริยธรรม” ด้าน AI แบบนั้นเป็นการ ตีความอย่างมุ่งร้าย เกินไปมาก
  แนะนำให้อ่านเหตุผลจริง ๆ ไม่ใช่แค่สรุปจากโซเชียลมีเดีย มีการถกเถียงที่ลึกกว่าที่คิดมาก ครอบคลุมความเสี่ยงที่กังวลกันอย่างกว้างขวาง และมีแนวทางแก้ไขที่ถูกเสนอไว้ด้วย แนวทางเหล่านั้นมีโอกาสใช้ได้จริงมากกว่าคำกล่าวอ้างว่าเป็น “แนวป้องกันที่ดีที่สุด”
- การวาดภาพว่านักจริยธรรม AI “ทุกคน” เป็น กลุ่มนักบวช ที่ต้องการปิดกั้นการเข้าถึงโมเดลนั้นเป็นเรื่องอันตราย
  มีคนจำนวนมากที่ให้ความสำคัญทั้งกับการทำให้เครื่องมือเหล่านี้เป็นประชาธิปไตย และการใช้งานอย่างปลอดภัยและมีจริยธรรม
- ตอนนี้ผมมองว่า แมวหลุดออกจากถุงไปแล้ว
  การคาดหวังว่าคนไม่ดีจะเคารพถ้อยคำในไลเซนส์นั้นตั้งแต่แรกก็ไม่ใช่มาตรการควบคุมที่ดีอยู่แล้ว มันแค่ขัดขวางความก้าวหน้าและนวัตกรรมของคนที่มีเจตนาดีพอจะปฏิบัติตามกฎหมายเท่านั้น ส่วนคนที่มีเจตนาอื่นในที่อย่างรัสเซีย เกาหลีเหนือ จีน รวมถึงองค์กรอาชญากรรมและมิจฉาชีพ ไม่ได้ถูกผูกมัดด้วยแนวคิดแบบนั้น
  ชุมชนที่ทำงานภายใต้ไลเซนส์โอเพ่นซอร์สที่เหมาะสมกำลังเติบโต และสิ่งที่น่าสนใจก็เกิดขึ้นเร็วขึ้นเรื่อย ๆ ไลเซนส์ทางเลือกมีประสิทธิผลต่ำ ตัดขาดการเชื่อมโยงกับชุมชนนั้น ทำให้การร่วมมือซับซ้อนขึ้น และกลายเป็นส่วนน้อยลงเรื่อย ๆ ในงานวิจัยโดยรวม ดังนั้นไลเซนส์แบบนั้นจึงค่อย ๆ ไร้ความหมาย
  การแก้ให้ถูกต้องทำให้สถานะจากมุมมองทางกฎหมายเรียบง่ายและเป็นมาตรฐาน ช่วยให้การนำไปใช้เชิงพาณิชย์ การร่วมมือ และงานวิจัยง่ายขึ้น ดูเหมือนว่า Microsoft ยอมรับอย่างมีเหตุผลว่าตรงนั้นมีคุณค่า และกำลังปรับให้เข้ากับความเป็นจริง
- ใครจะรับประกันได้ว่าเป้าหมายซ่อนเร้นที่แท้จริงของการลงทุน AI อย่างบ้าคลั่งนี้ไม่ใช่การสร้าง โครงสร้างพื้นฐานการเซ็นเซอร์ขนาดใหญ่
- ทุกที่ที่มีมูลค่ามารวมกัน จะเกิด อุตสาหกรรมเพรียง ที่วางเท้าไว้บนแป้นเบรก หากคุณไม่ยอมจ่ายภาษีให้กองทัพของคนที่ไม่ได้มีส่วนร่วมสร้างคุณค่า
ก่อนหน้านี้เป็น ไลเซนส์แบบไม่ใช่เชิงพาณิชย์ เลยทำให้ความคาดหวังลดลงไปเล็กน้อย
เมื่อพิจารณาจากประสิทธิภาพและขนาด การเปลี่ยนเป็นไลเซนส์ที่เป็นมิตรต่อการใช้งานเชิงพาณิชย์ถือเป็นเรื่องค่อนข้างใหญ่
จุดสำคัญคือโมเดลนี้มี ความสามารถในการให้เหตุผล ที่ยอดเยี่ยม
อย่างไรก็ตาม มันจงใจไม่ได้ฝึกด้วยชุดข้อมูลเว็บครอว์ลขนาดใหญ่ เพื่อไม่ให้เรียนรู้วิธีทำระเบิดหรือทำ “เรื่องไม่ดี”
ดังนั้นเมื่อเทียบกับโมเดลระดับเดียวกัน หรือแม้แต่โมเดลที่มีพารามิเตอร์มากกว่า มันเป็นโมเดลที่ “คิดได้ฉลาดที่สุด” แต่มีความรู้เกี่ยวกับโลกหรือความรู้จิปาถะค่อนข้างน้อย
อนาคตอาจเปลี่ยนไปได้ แต่ผมมองว่าสถานะปัจจุบันเป็นแบบนี้
- ถึงอย่างนั้นก็ยอดเยี่ยมสำหรับ แอปพลิเคชัน RAG
  เพราะผมต้องการให้คำตอบอิงจากข้อมูลที่ผมให้ ไม่ใช่สิ่งที่เรียนรู้มาจากเว็บ
- ถ้ามองโมเดลภาษาขนาดใหญ่เป็นคุณสมบัติสองอย่าง คือความสามารถในการใช้ภาษาธรรมชาติและความรู้สำหรับตอบคำถาม โมเดลภาษาขนาดเล็ก ก็ควรถูกมองว่าเป็นโมเดลที่เก่งมากด้านการประมวลผลภาษาธรรมชาติ
  งานจำนวนมากไม่ต้องการความรู้ทั่วไป และโดยเฉพาะใน RAG ข้อดีนี้สำคัญมาก
- ผมหวังว่าโฟกัสของโมเดลจะไม่ใช่การฝังข้อมูลไว้ในตัว
  การให้ข้อมูลผ่าน การค้นคืน น่าจะดีกว่า และผลลัพธ์คือคำตอบแบบ “ดูเหมือนฉลาดอย่างน่าเชื่อ แต่ผิดทั้งหมด” จะลดลง
  หากมีข้อมูลที่ฝังอยู่ในตัวน้อยลง ก็จะใช้งานทั่วไปนอกเหนือจากขอบเขตผู้ช่วยแชตได้มากขึ้น เพราะหลายกรณีเราต้องการให้โมเดลรู้เฉพาะข้อมูลที่ผู้ใช้ให้มาเท่านั้น
  เช่น ในเกมแฟนตาซียุคกลาง ถ้าตัวละครจู่ ๆ เริ่มพูดเรื่องการเมืองสหรัฐฯ ก็คงแปลกมาก Phi-2 เองก็อาจยังแก้ได้ไม่หมดหากไม่มีการ fine-tune แต่ประเด็นคือทิศทางแบบนั้น
- ผมคิดว่าการไม่ฝึกด้วยข้อมูลเว็บครอว์ลเป็นเพราะ Microsoft ต้องการทำให้การที่ตน ขโมยทรัพย์สินและข้อมูลส่วนบุคคล ไปสร้างรายได้นั้นดูไม่โจ่งแจ้งน้อยลง
ผมอยากรู้เรื่อง ชุดข้อมูล มากกว่าเรื่องโมเดล
- น่าจะเป็นรูปแบบที่พัฒนาต่อจากวิธีฝึก “Textbooks are all you Need” ของ phi-1/1.5: https://arxiv.org/abs/2309.05463
เป็นการเปลี่ยนแปลงที่ยอดเยี่ยม และยังแสดงให้เห็นว่าทำไม โครงการโอเพ่นซอร์ส อิสระจึงสำคัญ
คงยากที่จะบอกว่าการที่ TinyLlama เผยแพร่ภายใต้ไลเซนส์ Apache 2.0 ไม่มีผลต่อการเปลี่ยนแปลงครั้งนี้
- มีหลักฐานอะไรที่ทำให้คิดว่าการเปิดตัว TinyLlama มีผล?
ดูเหมือนเป็นสัญญาณว่า Phi-3 และโมเดลรุ่นถัดไปจะทำให้ Phi-2 ล้าสมัย
โมเดลนี้อยู่ในอันดับต้น ๆ มาค่อนข้างนานแล้ว มันดีตรงไหนกัน?
- ประสิทธิภาพเมื่อเทียบกับขนาดโมเดลและ ต้นทุนการอนุมาน นั้นยอดเยี่ยม
  เป็นโมเดลที่ดีที่สุดที่รันได้แม้บนอุปกรณ์ขนาดเล็กอย่างโทรศัพท์มือถือ ขณะเดียวกันก็ให้ประสิทธิภาพใกล้เคียง GPT-3.5
  สถาปัตยกรรมและข้อมูลฝึกก็น่าสนใจด้วย เป็นโมเดลแบบ sparse ที่ใช้ข้อมูลสังเคราะห์ที่คัดสรรมา จึงทำความแม่นยำได้สูงกว่าโมเดลที่ฝึกจากข้อความอินเทอร์เน็ตแบบสุ่มมาก

โมเดล Phi-2 ของ Microsoft เปลี่ยนเป็นไลเซนส์ MIT

ไฟล์ที่เปลี่ยนในคอมมิต

LICENSE: เปลี่ยนจาก Microsoft Research License เป็น MIT License

ข้อจำกัดเดิมที่ถูกลบ

การเปลี่ยนเมตาดาต้าใน README

NOTICE.md และการแจ้งคอมโพเนนต์จากบุคคลที่สาม

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นบน Hacker News