2 คะแนน โดย GN⁺ 2024-01-08 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ในคอมมิต 7e10f3e ของที่เก็บ Hugging Face สำหรับ Phi-2 มีการเปลี่ยนไฟล์ 3 ไฟล์คือ LICENSE, NOTICE.md, README.md และการระบุไลเซนส์ถูกเปลี่ยนเป็น MIT
  • LICENSE ใหม่ถูกแทนที่ด้วยข้อความเต็มของ MIT License ทำให้อนุญาตการใช้งาน คัดลอก แก้ไข เผยแพร่ รีไลเซนส์ และจำหน่ายได้อย่างกว้างขวาง
  • ข้อกำหนดหลายอย่างใน Microsoft Research License เดิม เช่น ห้ามวิศวกรรมย้อนกลับ, ข้อจำกัดการโฮสต์แบบอิสระ, การจัดการข้อมูลส่วนบุคคล, อนุญาโตตุลาการ, และข้อจำกัดความรับผิดค่าเสียหาย ถูกลบออก
  • เมตาดาต้าใน README ใช้ license: mit แทน license_name: microsoft-research-license และยังคงลิงก์ LICENSE เดิมไว้
  • NOTICE.md ใหม่ระบุ flash-attention เป็นคอมโพเนนต์จากบุคคลที่สาม และมีข้อความอนุญาตให้ทำวิศวกรรมย้อนกลับได้อย่างจำกัดเพื่อการดีบักการแก้ไขไลบรารี LGPL พร้อมทั้งรวม BSD 3-Clause License

ไฟล์ที่เปลี่ยนในคอมมิต

  • คอมมิตของที่เก็บ microsoft/phi-2 บน Hugging Face แสดงเป็น “Upload 3 files” โดยไฟล์ที่ถูกเปลี่ยนมี 3 ไฟล์คือ LICENSE, NOTICE.md, README.md
  • สามารถดูรายการไฟล์ในสถานะของคอมมิตนั้นได้ที่ Browse files

LICENSE: เปลี่ยนจาก Microsoft Research License เป็น MIT License

  • ไฟล์ LICENSE ถูกลบข้อความไลเซนส์เดิมออกและแทนที่ด้วยข้อความเต็มของ MIT License
  • LICENSE ใหม่มี MIT License ต่อจากข้อความ PhyAGI. และ Copyright (c) Microsoft Corporation.
  • MIT License อนุญาตสิทธิ์ต่อไปนี้โดยไม่คิดค่าใช้จ่ายแก่ทุกคนที่ได้รับซอฟต์แวร์และไฟล์เอกสารที่เกี่ยวข้อง
    • ใช้งาน คัดลอก แก้ไข รวมเข้าด้วยกัน
    • เผยแพร่ แจกจ่าย รีไลเซนส์
    • จำหน่ายสำเนาซอฟต์แวร์
    • มอบสิทธิ์เดียวกันนี้ให้แก่ผู้ที่ได้รับซอฟต์แวร์
  • เงื่อนไขคือ ต้องรวมประกาศลิขสิทธิ์และประกาศอนุญาตไว้ในสำเนาทั้งหมดหรือส่วนสำคัญของซอฟต์แวร์
  • มีข้อปฏิเสธการรับประกันในรูปแบบ AS IS และไม่ให้การรับประกันทั้งโดยชัดแจ้งหรือโดยนัย รวมถึงความสามารถเชิงพาณิชย์ ความเหมาะสมต่อวัตถุประสงค์เฉพาะ และการไม่ละเมิดสิทธิ์
  • ผู้ถือลิขสิทธิ์และผู้มีสิทธิ์จะไม่รับผิดชอบต่อคำเรียกร้อง ความเสียหาย หรือความรับผิดที่เกิดจากการใช้ซอฟต์แวร์หรือธุรกรรมอื่นที่เกี่ยวข้อง

ข้อจำกัดเดิมที่ถูกลบ

  • ข้อจำกัดและข้อกฎหมายหลายรายการใน LICENSE เดิมถูกลบออก
  • ข้อกำหนดที่ถูกลบมีดังนี้
    • ห้ามทำ วิศวกรรมย้อนกลับ ดีคอมไพล์ หรือดิแอสเซมเบิลวัสดุ
    • ห้ามลบ ลดทอน ปิดกั้น หรือแก้ไขประกาศของ Microsoft หรือซัพพลายเออร์
    • ห้ามใช้งานในลักษณะที่ขัดต่อกฎหมาย หรือเพื่อสร้างหรือเผยแพร่มัลแวร์
    • ห้ามแชร์ เผยแพร่ แจกจ่าย ให้เช่า จัดหาโซลูชันโฮสต์แบบอิสระ หรือโอนไปยังบุคคลที่สาม
  • ข้อจำกัดเกี่ยวกับข้อมูลส่วนบุคคลก็ถูกตัดออกเช่นกัน
    • ข้อมูลที่สามารถระบุตัวบุคคลได้ต้องไม่ถูกใช้เกินกว่าวัตถุประสงค์ที่ได้รับอนุมัติหรือได้รับความยินยอม
    • ต้องไม่ใช้เพื่อติดต่อบุคคลนั้น
    • เมื่อการวิจัยเสร็จสิ้น ต้องทำลายข้อมูลส่วนบุคคลรวมถึงแบ็กอัปและสำเนาทันที
  • ข้อกำหนดที่ว่าหากส่งงานแก้ไขให้ Microsoft จะต้องมอบไลเซนส์อย่างกว้างขวางแก่ Microsoft ก็ถูกลบออก
  • นอกจากนี้ยังมีการลบข้อกำหนดเกี่ยวกับการเผยแพร่ ฟีดแบ็ก ข้อจำกัดการส่งออก บริการสนับสนุน อนุญาโตตุลาการในสหรัฐฯ และการสละสิทธิ์ฟ้องแบบกลุ่ม กฎหมายที่ใช้บังคับ สิทธิผู้บริโภค ข้อปฏิเสธการรับประกัน และข้อจำกัดความรับผิดค่าเสียหาย

การเปลี่ยนเมตาดาต้าใน README

  • การระบุไลเซนส์ในฟรอนต์แมตเตอร์ของ README.md ถูกเปลี่ยน
  • รายการที่ถูกลบมีดังนี้
    • license:
    • license_name: microsoft-research-license
  • รายการใหม่คือ license: mit
  • license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSE ยังคงอยู่
  • รายการ inference: false และ language: - en ยังคงอยู่ใน diff ที่แสดง

NOTICE.md และการแจ้งคอมโพเนนต์จากบุคคลที่สาม

  • ไฟล์ NOTICE.md ใหม่เริ่มต้นด้วยข้อความ “NOTICES AND INFORMATION” และ “Do Not Translate or Localize”
  • Microsoft ระบุว่าซอฟต์แวร์นี้มีเนื้อหาจากบุคคลที่สามรวมอยู่ด้วย
  • โค้ดโอเพนซอร์สบางส่วนของ Microsoft มีให้ที่ https://3rdpartysource.microsoft.com หรือสามารถร้องขอได้โดยส่งเช็คหรือธนาณัติ US $5.00 พร้อมชื่อผลิตภัณฑ์ ชื่อคอมโพเนนต์โอเพนซอร์ส แพลตฟอร์ม และหมายเลขเวอร์ชัน
  • ไม่ว่าข้อกำหนดอื่นจะว่าอย่างไร สามารถทำ วิศวกรรมย้อนกลับ กับซอฟต์แวร์นี้ได้ในขอบเขตที่จำเป็นต่อการดีบักการแก้ไขไลบรารีที่ใช้ไลเซนส์ GNU Lesser General Public License
  • มี flash-attention รวมอยู่เป็นคอมโพเนนต์
  • ประกาศของ flash-attention รวม BSD 3-Clause License
    • เมื่อนำซอร์สโค้ดไปแจกจ่ายต่อ ต้องคงประกาศลิขสิทธิ์ รายการเงื่อนไข และข้อปฏิเสธความรับผิดไว้
    • เมื่อนำไบนารีไปแจกจ่ายต่อ ต้องรวมประกาศและเงื่อนไขเดียวกันรวมถึงข้อปฏิเสธความรับผิดไว้ในเอกสารหรือสื่ออื่น
    • ห้ามใช้ชื่อผู้ถือลิขสิทธิ์หรือผู้มีส่วนร่วมเพื่อโปรโมตผลิตภัณฑ์ต่อยอดโดยไม่ได้รับอนุญาตเป็นลายลักษณ์อักษรล่วงหน้า
  • ประกาศ BSD 3-Clause ยังระบุว่าซอฟต์แวร์ดังกล่าวให้มาแบบ “AS IS” และจะไม่รับผิดชอบต่อความเสียหายทั้งทางตรง ทางอ้อม โดยบังเอิญ เป็นกรณีพิเศษ เชิงลงโทษ หรือเป็นผลสืบเนื่อง

1 ความคิดเห็น

 
GN⁺ 2024-01-08
ความคิดเห็นบน Hacker News
  • การได้เห็น โมเดลแบบเปิด เหล่านี้ออกมานั้นน่าตื่นเต้นมากจริง ๆ
    สิ่งที่น่าสนใจคือ “นักจริยธรรม” ด้าน AI อยากทำตัวเหมือนกลุ่มนักบวชชั้นสูงที่ควบคุมการเข้าถึงโมเดลแมชชีนเลิร์นนิงโดยอ้างเรื่องความปลอดภัย แต่ผมมองว่าความเสี่ยงใหญ่ที่สุดของ AI อยู่ที่คนที่ควบคุมโมเดลจะใช้โมเดลนั้นควบคุมและเซ็นเซอร์ว่าผู้คนสามารถเขียนอะไรได้บ้าง
    ผมคิดว่าโมเดลโอเพ่นซอร์สที่อยู่ในมือสาธารณชนคือแนวป้องกันที่ดีที่สุดต่อความเสี่ยงที่แท้จริงของ AI และขอชื่นชม Facebook, Microsoft, Mistral ที่ผลักดันเรื่องนี้

    • การมอง “นักจริยธรรม” ด้าน AI แบบนั้นเป็นการ ตีความอย่างมุ่งร้าย เกินไปมาก
      แนะนำให้อ่านเหตุผลจริง ๆ ไม่ใช่แค่สรุปจากโซเชียลมีเดีย มีการถกเถียงที่ลึกกว่าที่คิดมาก ครอบคลุมความเสี่ยงที่กังวลกันอย่างกว้างขวาง และมีแนวทางแก้ไขที่ถูกเสนอไว้ด้วย แนวทางเหล่านั้นมีโอกาสใช้ได้จริงมากกว่าคำกล่าวอ้างว่าเป็น “แนวป้องกันที่ดีที่สุด”
    • การวาดภาพว่านักจริยธรรม AI “ทุกคน” เป็น กลุ่มนักบวช ที่ต้องการปิดกั้นการเข้าถึงโมเดลนั้นเป็นเรื่องอันตราย
      มีคนจำนวนมากที่ให้ความสำคัญทั้งกับการทำให้เครื่องมือเหล่านี้เป็นประชาธิปไตย และการใช้งานอย่างปลอดภัยและมีจริยธรรม
    • ตอนนี้ผมมองว่า แมวหลุดออกจากถุงไปแล้ว
      การคาดหวังว่าคนไม่ดีจะเคารพถ้อยคำในไลเซนส์นั้นตั้งแต่แรกก็ไม่ใช่มาตรการควบคุมที่ดีอยู่แล้ว มันแค่ขัดขวางความก้าวหน้าและนวัตกรรมของคนที่มีเจตนาดีพอจะปฏิบัติตามกฎหมายเท่านั้น ส่วนคนที่มีเจตนาอื่นในที่อย่างรัสเซีย เกาหลีเหนือ จีน รวมถึงองค์กรอาชญากรรมและมิจฉาชีพ ไม่ได้ถูกผูกมัดด้วยแนวคิดแบบนั้น
      ชุมชนที่ทำงานภายใต้ไลเซนส์โอเพ่นซอร์สที่เหมาะสมกำลังเติบโต และสิ่งที่น่าสนใจก็เกิดขึ้นเร็วขึ้นเรื่อย ๆ ไลเซนส์ทางเลือกมีประสิทธิผลต่ำ ตัดขาดการเชื่อมโยงกับชุมชนนั้น ทำให้การร่วมมือซับซ้อนขึ้น และกลายเป็นส่วนน้อยลงเรื่อย ๆ ในงานวิจัยโดยรวม ดังนั้นไลเซนส์แบบนั้นจึงค่อย ๆ ไร้ความหมาย
      การแก้ให้ถูกต้องทำให้สถานะจากมุมมองทางกฎหมายเรียบง่ายและเป็นมาตรฐาน ช่วยให้การนำไปใช้เชิงพาณิชย์ การร่วมมือ และงานวิจัยง่ายขึ้น ดูเหมือนว่า Microsoft ยอมรับอย่างมีเหตุผลว่าตรงนั้นมีคุณค่า และกำลังปรับให้เข้ากับความเป็นจริง
    • ใครจะรับประกันได้ว่าเป้าหมายซ่อนเร้นที่แท้จริงของการลงทุน AI อย่างบ้าคลั่งนี้ไม่ใช่การสร้าง โครงสร้างพื้นฐานการเซ็นเซอร์ขนาดใหญ่
    • ทุกที่ที่มีมูลค่ามารวมกัน จะเกิด อุตสาหกรรมเพรียง ที่วางเท้าไว้บนแป้นเบรก หากคุณไม่ยอมจ่ายภาษีให้กองทัพของคนที่ไม่ได้มีส่วนร่วมสร้างคุณค่า
  • ก่อนหน้านี้เป็น ไลเซนส์แบบไม่ใช่เชิงพาณิชย์ เลยทำให้ความคาดหวังลดลงไปเล็กน้อย
    เมื่อพิจารณาจากประสิทธิภาพและขนาด การเปลี่ยนเป็นไลเซนส์ที่เป็นมิตรต่อการใช้งานเชิงพาณิชย์ถือเป็นเรื่องค่อนข้างใหญ่

  • จุดสำคัญคือโมเดลนี้มี ความสามารถในการให้เหตุผล ที่ยอดเยี่ยม
    อย่างไรก็ตาม มันจงใจไม่ได้ฝึกด้วยชุดข้อมูลเว็บครอว์ลขนาดใหญ่ เพื่อไม่ให้เรียนรู้วิธีทำระเบิดหรือทำ “เรื่องไม่ดี”
    ดังนั้นเมื่อเทียบกับโมเดลระดับเดียวกัน หรือแม้แต่โมเดลที่มีพารามิเตอร์มากกว่า มันเป็นโมเดลที่ “คิดได้ฉลาดที่สุด” แต่มีความรู้เกี่ยวกับโลกหรือความรู้จิปาถะค่อนข้างน้อย
    อนาคตอาจเปลี่ยนไปได้ แต่ผมมองว่าสถานะปัจจุบันเป็นแบบนี้

    • ถึงอย่างนั้นก็ยอดเยี่ยมสำหรับ แอปพลิเคชัน RAG
      เพราะผมต้องการให้คำตอบอิงจากข้อมูลที่ผมให้ ไม่ใช่สิ่งที่เรียนรู้มาจากเว็บ
    • ถ้ามองโมเดลภาษาขนาดใหญ่เป็นคุณสมบัติสองอย่าง คือความสามารถในการใช้ภาษาธรรมชาติและความรู้สำหรับตอบคำถาม โมเดลภาษาขนาดเล็ก ก็ควรถูกมองว่าเป็นโมเดลที่เก่งมากด้านการประมวลผลภาษาธรรมชาติ
      งานจำนวนมากไม่ต้องการความรู้ทั่วไป และโดยเฉพาะใน RAG ข้อดีนี้สำคัญมาก
    • ผมหวังว่าโฟกัสของโมเดลจะไม่ใช่การฝังข้อมูลไว้ในตัว
      การให้ข้อมูลผ่าน การค้นคืน น่าจะดีกว่า และผลลัพธ์คือคำตอบแบบ “ดูเหมือนฉลาดอย่างน่าเชื่อ แต่ผิดทั้งหมด” จะลดลง
      หากมีข้อมูลที่ฝังอยู่ในตัวน้อยลง ก็จะใช้งานทั่วไปนอกเหนือจากขอบเขตผู้ช่วยแชตได้มากขึ้น เพราะหลายกรณีเราต้องการให้โมเดลรู้เฉพาะข้อมูลที่ผู้ใช้ให้มาเท่านั้น
      เช่น ในเกมแฟนตาซียุคกลาง ถ้าตัวละครจู่ ๆ เริ่มพูดเรื่องการเมืองสหรัฐฯ ก็คงแปลกมาก Phi-2 เองก็อาจยังแก้ได้ไม่หมดหากไม่มีการ fine-tune แต่ประเด็นคือทิศทางแบบนั้น
    • ผมคิดว่าการไม่ฝึกด้วยข้อมูลเว็บครอว์ลเป็นเพราะ Microsoft ต้องการทำให้การที่ตน ขโมยทรัพย์สินและข้อมูลส่วนบุคคล ไปสร้างรายได้นั้นดูไม่โจ่งแจ้งน้อยลง
  • ผมอยากรู้เรื่อง ชุดข้อมูล มากกว่าเรื่องโมเดล

    • น่าจะเป็นรูปแบบที่พัฒนาต่อจากวิธีฝึก “Textbooks are all you Need” ของ phi-1/1.5: https://arxiv.org/abs/2309.05463
  • เป็นการเปลี่ยนแปลงที่ยอดเยี่ยม และยังแสดงให้เห็นว่าทำไม โครงการโอเพ่นซอร์ส อิสระจึงสำคัญ
    คงยากที่จะบอกว่าการที่ TinyLlama เผยแพร่ภายใต้ไลเซนส์ Apache 2.0 ไม่มีผลต่อการเปลี่ยนแปลงครั้งนี้

    • มีหลักฐานอะไรที่ทำให้คิดว่าการเปิดตัว TinyLlama มีผล?
  • ดูเหมือนเป็นสัญญาณว่า Phi-3 และโมเดลรุ่นถัดไปจะทำให้ Phi-2 ล้าสมัย

  • โมเดลนี้อยู่ในอันดับต้น ๆ มาค่อนข้างนานแล้ว มันดีตรงไหนกัน?

    • ประสิทธิภาพเมื่อเทียบกับขนาดโมเดลและ ต้นทุนการอนุมาน นั้นยอดเยี่ยม
      เป็นโมเดลที่ดีที่สุดที่รันได้แม้บนอุปกรณ์ขนาดเล็กอย่างโทรศัพท์มือถือ ขณะเดียวกันก็ให้ประสิทธิภาพใกล้เคียง GPT-3.5
      สถาปัตยกรรมและข้อมูลฝึกก็น่าสนใจด้วย เป็นโมเดลแบบ sparse ที่ใช้ข้อมูลสังเคราะห์ที่คัดสรรมา จึงทำความแม่นยำได้สูงกว่าโมเดลที่ฝึกจากข้อความอินเทอร์เน็ตแบบสุ่มมาก