10 คะแนน โดย GN⁺ 2024-10-28 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • Mark Zuckerberg ซีอีโอของ Facebook อ้างว่า Llama 3 โมเดลภาษาขนาดใหญ่ของ Meta เป็นโอเพนซอร์ส แต่ในความเป็นจริงไม่ใช่โอเพนซอร์ส
  • ตามนิยามโอเพนซอร์สของ Open Source Initiative (OSI) ไลเซนส์ของ Llama 3 ไม่เป็นไปตามเงื่อนไขของโอเพนซอร์สในหลายประเด็น
  • Meta ไม่ใช่บริษัทเดียวที่ใช้กลลวงลักษณะนี้ สิ่งนี้เรียกว่า "โอเพนวอชชิง"
    • โอเพนวอชชิงคือแนวปฏิบัติที่ชวนให้เข้าใจผิด โดยทำให้ผลิตภัณฑ์หรือบริการที่ไม่ได้เปิดจริง ดูเหมือนว่าเป็น "โอเพน"
    • ในปี 2009 Michelle Thorne นักวิจัยด้านนโยบายอินเทอร์เน็ต ได้บัญญัติคำนี้โดยได้แรงบันดาลใจจากคำว่า "กรีนวอชชิง"
  • ในวงการ AI โอเพนวอชชิงกำลังแพร่หลาย จากการสำรวจโมเดล 45 รายการโดยนักวิจัยจาก Radboud University พบว่าโมเดลของบริษัทยักษ์ใหญ่อย่าง Google, Meta และ Microsoft ไม่ได้เป็นโอเพนซอร์สจริง

ทำไมบริษัทต่างๆ ถึงทำโอเพนวอชชิง

  • ในอดีตบริษัทต่างๆ ไม่ค่อยอยากยุ่งกับโอเพนซอร์ส แต่ตอนนี้ทัศนคติต่อโอเพนซอร์สเปลี่ยนไปในทางบวก
    • ในปี 2001 Steve Ballmer เคยประกาศว่า "Linux คือมะเร็ง" และอ้างว่าหากใช้ซอฟต์แวร์โอเพนซอร์ส ก็จะต้องทำให้ซอฟต์แวร์ส่วนที่เหลือทั้งหมดเป็นโอเพนซอร์สด้วย
  • บริษัทต่างๆ ใช้ประโยชน์จากภาพลักษณ์เชิงบวกของโอเพนซอร์ส แต่ในทางปฏิบัติไม่ได้ทุ่มเทให้กับโอเพนซอร์สจริง
    • สิ่งนี้ช่วยปรับปรุงภาพลักษณ์ต่อสาธารณะ และดึงดูดผู้บริโภคที่ให้ความสำคัญกับความโปร่งใสและความเปิดกว้าง
    • บางบริษัทใช้โอเพนวอชชิงเพื่อปกป้องโมเดลและแนวปฏิบัติของตนจากการตรวจสอบทางวิทยาศาสตร์และกฎระเบียบ ขณะเดียวกันก็ยังได้รับประโยชน์จากป้ายกำกับว่า "โอเพน"
    • กฎหมาย AI ของสหภาพยุโรปให้ข้อยกเว้นพิเศษกับโมเดล "โอเพนซอร์ส" จึงเป็นแรงจูงใจอย่างมากให้เกิดโอเพนวอชชิง

การขาดนิยามที่ชัดเจนของโอเพนซอร์ส AI

  • สหภาพยุโรปยังไม่สามารถให้นิยามที่ชัดเจนกับโอเพนซอร์ส AI ได้ และจริงๆ แล้วก็ยังไม่มีใครทำได้เช่นกัน
    • OSI มีกำหนดจะประกาศนิยามโอเพนซอร์ส AI ภายในไม่กี่วันข้างหน้า
    • ไลเซนส์แบบโอเพนวอชชิงในปัจจุบันล้วนไม่สอดคล้องกับนิยามของทุกฝ่าย ยกเว้นผู้สร้างเอง
  • อย่างไรก็ตาม ไม่ใช่ว่าบริษัท AI รายใหญ่ทุกแห่งจะโกหกเรื่องโอเพนซอร์ส
    • ตัวอย่างเช่น Granite 3.0 LLM ของ IBM เปิดเป็นโอเพนซอร์สจริงภายใต้ไลเซนส์ Apache 2
  • แม้ว่า OSI จะไม่ใช่รัฐบาลหรือหน่วยงานกำกับดูแล แต่ทำไมการใช้คำว่าโอเพนซอร์สให้ถูกต้องจึงสำคัญ?
    • OSI เป็นเพียงองค์กรไม่แสวงหากำไรที่สร้างแนวทางซึ่งมีประโยชน์เท่านั้น
  • Dan Lorenc ซีอีโอของ Chainguard กล่าวไว้ในการบรรยายปาฐกถาที่งานประชุม SOSS ซึ่งจัดขึ้นที่แอตแลนตาเมื่อไม่นานมานี้ว่า
    • ไม่มีใครบังคับให้ใช้คำนิยามของ OSI ได้ แต่หลายคน โดยเฉพาะทนายความ เชื่อถือคำนิยามนี้
    • พวกเขาเชื่อถือการทำงานของ OSI และเข้าใจถึงความคุ้มครองที่บริษัทจะได้รับเมื่อใช้ไลเซนส์ที่ผ่านเกณฑ์โอเพนซอร์ส
    • นั่นจึงเป็นเหตุผลที่คำนิยามนี้ปรากฏอยู่ในสัญญาจัดซื้อจัดจ้างของบริษัทขนาดใหญ่ทั่วโลก

โอเพนซอร์สไม่ใช่แค่ปัญหาทางกฎหมายหรือธุรกิจ

  • โอเพนซอร์สมอบเสรีภาพในการทำงานให้แก่นักพัฒนา
    • หากไม่มีโอเพนซอร์ส เราจะสูญเสียประโยชน์จากการใช้โค้ดได้อย่างอิสระ โดยไม่ต้องรู้หรือใส่ใจเงื่อนไขไลเซนส์มากมาย
    • หากต้องตรวจสอบไลเซนส์ของโค้ดทุกชิ้น นักพัฒนาก็จะต้องผ่านการตรวจสอบทางกฎหมายทุกครั้งที่ต้องการใช้ไลบรารีใหม่
    • บริษัทต่างๆ จะกลัวการเผยแพร่อะไรสักอย่างบนอินเทอร์เน็ต หากความรับผิดที่ต้องเผชิญเมื่อเปิดเผยซอร์สโค้ดยังไม่ชัดเจน
  • Lorenc เน้นย้ำว่านี่ไม่ใช่ปัญหาของบริษัทยักษ์ใหญ่เท่านั้น แต่เป็นปัญหาร่วมกัน
    • ทุกคนที่ใช้โอเพนซอร์สจะได้รับผลกระทบ
    • ทั้งโปรเจกต์อาจหยุดทำงาน บั๊กด้านความปลอดภัยจะไม่ได้รับการแก้ไข และการบำรุงรักษาจะยากขึ้นมาก
    • เราต้องร่วมมือกันเพื่อรักษาและปกป้องนิยามของโอเพนซอร์ส มิฉะนั้นทนายความก็จะกลับเข้ามาแทรกแซงอีกครั้ง
  • ทนายความด้านทรัพย์สินทางปัญญาจำนวนมากเองก็ไม่ต้องการความยุ่งยากแบบนี้
    • ไลเซนส์โอเพนซอร์สที่แท้จริงทำให้ชีวิตของบริษัท โปรแกรมเมอร์ และทนายความง่ายขึ้นทั้งหมด
    • การเพิ่มข้อกำหนดอย่าง "เปิด ยกเว้นคนที่สามารถแข่งขันกับเราได้" หรือ "เปิด ยกเว้นคนที่สามารถนำโค้ดไปใช้งานบนคลาวด์ได้" มีแต่จะสร้างปัญหาให้ตัวเอง

โอเพนวอชชิงสร้างความเสียหายกับทุกคน

  • ท้ายที่สุดแล้ว โอเพนวอชชิงจะทำให้งานด้านกฎหมาย ธุรกิจ และการพัฒนาของทุกฝ่ายยุ่งเหยิงไปหมด
  • น่าแดกดันว่าบริษัทที่มองสั้นและสนับสนุนแนวทางนี้อยู่ในตอนนี้ก็จะได้รับผลเสียเช่นกัน
  • เพราะท้ายที่สุด งานแทบทั้งหมดของพวกเขา โดยเฉพาะในสาย AI ก็ล้วนตั้งอยู่บนโอเพนซอร์ส

ความเห็นของ GN⁺

  • แนวปฏิบัติแบบโอเพนวอชชิงที่บ่อนทำลายนิยามของโอเพนซอร์ส อาจส่งผลลบไม่ใช่แค่กับวงการ AI แต่กับอุตสาหกรรมซอฟต์แวร์โดยรวม ทั้งการจำกัดการทำงานของนักพัฒนาและเพิ่มความเสี่ยงทางกฎหมายให้บริษัท
  • การที่บริษัทต้องการเพียงใช้ประโยชน์จากภาพลักษณ์เชิงบวกของโอเพนซอร์ส เป็นท่าทีที่มองสั้น และในระยะยาวอาจย้อนกลับมาทำร้ายตัวบริษัทเอง
  • หากต้องการให้เทคโนโลยี AI พัฒนาได้ต่อไป ความร่วมมือและการแบ่งปันตามจิตวิญญาณของโอเพนซอร์สเป็นสิ่งจำเป็น บริษัทต่างๆ ควรเป็นผู้นำในการสร้างวัฒนธรรมโอเพนซอร์สที่แท้จริง
  • มีความจำเป็นเร่งด่วนในการกำหนดนิยามและมาตรฐานที่ชัดเจนสำหรับโอเพนซอร์ส AI โดย OSI มีกำหนดประกาศนิยามโอเพนซอร์ส AI ในเร็วๆ นี้ ซึ่งควรเป็นฐานให้บริษัท รัฐบาล และชุมชนนักพัฒนาร่วมมือกันต่อไป
  • ควรมีกิจกรรมสร้างความตระหนักรู้ให้ผู้บริโภคและนักพัฒนาเพื่อป้องกันโอเพนวอชชิงด้วย สิ่งสำคัญคือไม่ควรเชื่อคำกล่าวอ้างว่า "โอเพน" ของบริษัทโดยตรง แต่ควรตรวจสอบไลเซนส์และแนวปฏิบัติจริงอย่างรอบคอบ

2 ความคิดเห็น

 
ndrgrd 2024-10-28

ดูเหมือนจะเห็นปรากฏการณ์ที่บริษัทเปิดโครงการเป็นโอเพนซอร์สเพื่อฝากให้คอมมูนิตี้ช่วยแก้บั๊กช่วงแรกและปรับปรุงฟีเจอร์ แล้วพอระบบนิ่งก็แอบดึงกลับไปเป็นไลเซนส์แบบปิดขาดกันอยู่บ่อย ๆ

แม้จะมีคนบอกว่าก็แค่ fork ก็ได้ไม่ใช่เหรอ แต่ภาพลักษณ์และมูลค่าของชื่อที่สร้างติดตลาดไปแล้วนั้น บริษัทก็เอาไปกินเรียบอยู่ดี

 
GN⁺ 2024-10-28
ความคิดเห็นจาก Hacker News
  • เมื่อต้องเลือกระหว่างโปรแกรมหรือโมเดล AI สองอย่าง มักเกิดการถกเถียงระหว่างคนที่ชอบโอเพนซอร์สกับคนที่ไม่ชอบ เป้าหมายคือทำให้โปรแกรมที่ไม่ใช่โอเพนซอร์สดูเหมือนเป็นโอเพนซอร์ส

  • โอเพนซอร์สเป็นการประนีประนอมที่เป็นมิตรต่อองค์กร แต่ผู้มีส่วนร่วมบางคนยึดถือศีลธรรมในระดับสูง คนที่มีหลักศีลธรรมเช่นนี้ควรหยุดยั้งการนำโอเพนซอร์สไปใช้ในทางที่ผิด

  • หากแก้ปัญหาผ่านเครื่องหมายการค้า การรับรอง หรือไลเซนส์ไม่ได้ ก็ควรสื่อสารสารนี้ผ่านสื่อกระแสหลัก <i>The Register</i> มีความรู้วงใน แต่เรื่องนี้ต้องเป็นที่รับรู้อย่างกว้างขวางในหมู่สาธารณะ

  • หลายบริษัทโจมตีโอเพนซอร์ส แต่ก็พึ่งพาซอฟต์แวร์โอเพนซอร์สอย่าง Linux, Java, Debian ในการดำเนินธุรกิจ บริษัทส่วนใหญ่ไม่รู้สึกว่าตนมีหน้าที่ต้องมีส่วนร่วมหรือสนับสนุน

  • OSI กำลังเตรียมนิยาม Open Source AI ที่มีข้อถกเถียง

  • thirdweb เป็นโอเพนซอร์สในทางเทคนิค แต่ใช้งานไม่ได้หากไม่มี API key และยังตรวจสอบโควตาการเรียก API กับ SAAS ด้วย สิ่งนี้ทำให้ทีมที่พยายามสร้างทางเลือกโอเพนซอร์สอย่างแท้จริงหมดกำลังใจ

  • ผลจากการไม่สามารถทำให้แนวคิดอย่าง fair source เป็นที่แพร่หลาย คือบริษัทขนาดเล็กที่ไม่ใช่ SAAS ไม่อาจอยู่รอดได้ด้วยโอเพนซอร์ส

  • โอเพนซอร์สไม่มีจริยธรรมหรือปรัชญาแบบที่ซอฟต์แวร์เสรีมี ซอฟต์แวร์เสรีเหนือกว่าโอเพนซอร์ส

  • สำหรับโมเดลขนาดใหญ่ ต้นทุนการฝึกสูง ไบนารีอาร์ติแฟกต์มีมูลค่าและสามารถดัดแปลงได้ หาก OSI สร้างนิยามขึ้นมาได้ ก็ควรชื่นชมความพยายามของพวกเขา ไม่ว่า Meta จะปฏิบัติตามหรือไม่ก็ตาม

  • OSI ควรตระหนักว่าในยุคของผู้ให้บริการคลาวด์รายใหญ่ จำเป็นต้องมีการคุ้มครองจากผู้เล่นในตลาด ต้องมีตัวเลือกไลเซนส์ที่ชัดเจนเพื่อหลีกเลี่ยงดราม่าแบบ Mongo, Elastic, Redis

  • ควรปกป้องคำว่า "Open <something>" เพื่อไม่ให้ทำให้สาธารณชนเข้าใจผิด ต้องป้องกันความสับสนแบบ "OpenAI"

  • การรับเอาการมีส่วนร่วมจากชุมชนแล้วภายหลังถอนไลเซนส์นั้นเลวร้ายยิ่งกว่าการใช้คำว่า "Open Source" อย่างผิด ๆ ควรถูกมองว่าเป็นการฉ้อโกงและต้องมีความรับผิดทางแพ่ง

  • หากไม่แบ่งปันสคริปต์การฝึกและข้อมูลที่ทำให้ทำซ้ำได้ สำหรับโมเดล AI ชื่อว่า "Open Weights" จะเหมาะสมกว่า