โอเพนวอชชิง – ทำไมบริษัทต่างๆ ถึงแสร้งทำเป็นว่าเป็นโอเพนซอร์ส

(theregister.com)

10 คะแนน โดย GN⁺ 2024-10-28 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

Mark Zuckerberg ซีอีโอของ Facebook อ้างว่า Llama 3 โมเดลภาษาขนาดใหญ่ของ Meta เป็นโอเพนซอร์ส แต่ในความเป็นจริงไม่ใช่โอเพนซอร์ส
ตามนิยามโอเพนซอร์สของ Open Source Initiative (OSI) ไลเซนส์ของ Llama 3 ไม่เป็นไปตามเงื่อนไขของโอเพนซอร์สในหลายประเด็น
Meta ไม่ใช่บริษัทเดียวที่ใช้กลลวงลักษณะนี้ สิ่งนี้เรียกว่า "โอเพนวอชชิง"
- โอเพนวอชชิงคือแนวปฏิบัติที่ชวนให้เข้าใจผิด โดยทำให้ผลิตภัณฑ์หรือบริการที่ไม่ได้เปิดจริง ดูเหมือนว่าเป็น "โอเพน"
- ในปี 2009 Michelle Thorne นักวิจัยด้านนโยบายอินเทอร์เน็ต ได้บัญญัติคำนี้โดยได้แรงบันดาลใจจากคำว่า "กรีนวอชชิง"
ในวงการ AI โอเพนวอชชิงกำลังแพร่หลาย จากการสำรวจโมเดล 45 รายการโดยนักวิจัยจาก Radboud University พบว่าโมเดลของบริษัทยักษ์ใหญ่อย่าง Google, Meta และ Microsoft ไม่ได้เป็นโอเพนซอร์สจริง

ทำไมบริษัทต่างๆ ถึงทำโอเพนวอชชิง

ในอดีตบริษัทต่างๆ ไม่ค่อยอยากยุ่งกับโอเพนซอร์ส แต่ตอนนี้ทัศนคติต่อโอเพนซอร์สเปลี่ยนไปในทางบวก
- ในปี 2001 Steve Ballmer เคยประกาศว่า "Linux คือมะเร็ง" และอ้างว่าหากใช้ซอฟต์แวร์โอเพนซอร์ส ก็จะต้องทำให้ซอฟต์แวร์ส่วนที่เหลือทั้งหมดเป็นโอเพนซอร์สด้วย
บริษัทต่างๆ ใช้ประโยชน์จากภาพลักษณ์เชิงบวกของโอเพนซอร์ส แต่ในทางปฏิบัติไม่ได้ทุ่มเทให้กับโอเพนซอร์สจริง
- สิ่งนี้ช่วยปรับปรุงภาพลักษณ์ต่อสาธารณะ และดึงดูดผู้บริโภคที่ให้ความสำคัญกับความโปร่งใสและความเปิดกว้าง
- บางบริษัทใช้โอเพนวอชชิงเพื่อปกป้องโมเดลและแนวปฏิบัติของตนจากการตรวจสอบทางวิทยาศาสตร์และกฎระเบียบ ขณะเดียวกันก็ยังได้รับประโยชน์จากป้ายกำกับว่า "โอเพน"
- กฎหมาย AI ของสหภาพยุโรปให้ข้อยกเว้นพิเศษกับโมเดล "โอเพนซอร์ส" จึงเป็นแรงจูงใจอย่างมากให้เกิดโอเพนวอชชิง

การขาดนิยามที่ชัดเจนของโอเพนซอร์ส AI

สหภาพยุโรปยังไม่สามารถให้นิยามที่ชัดเจนกับโอเพนซอร์ส AI ได้ และจริงๆ แล้วก็ยังไม่มีใครทำได้เช่นกัน
- OSI มีกำหนดจะประกาศนิยามโอเพนซอร์ส AI ภายในไม่กี่วันข้างหน้า
- ไลเซนส์แบบโอเพนวอชชิงในปัจจุบันล้วนไม่สอดคล้องกับนิยามของทุกฝ่าย ยกเว้นผู้สร้างเอง
อย่างไรก็ตาม ไม่ใช่ว่าบริษัท AI รายใหญ่ทุกแห่งจะโกหกเรื่องโอเพนซอร์ส
- ตัวอย่างเช่น Granite 3.0 LLM ของ IBM เปิดเป็นโอเพนซอร์สจริงภายใต้ไลเซนส์ Apache 2
แม้ว่า OSI จะไม่ใช่รัฐบาลหรือหน่วยงานกำกับดูแล แต่ทำไมการใช้คำว่าโอเพนซอร์สให้ถูกต้องจึงสำคัญ?
- OSI เป็นเพียงองค์กรไม่แสวงหากำไรที่สร้างแนวทางซึ่งมีประโยชน์เท่านั้น
Dan Lorenc ซีอีโอของ Chainguard กล่าวไว้ในการบรรยายปาฐกถาที่งานประชุม SOSS ซึ่งจัดขึ้นที่แอตแลนตาเมื่อไม่นานมานี้ว่า
- ไม่มีใครบังคับให้ใช้คำนิยามของ OSI ได้ แต่หลายคน โดยเฉพาะทนายความ เชื่อถือคำนิยามนี้
- พวกเขาเชื่อถือการทำงานของ OSI และเข้าใจถึงความคุ้มครองที่บริษัทจะได้รับเมื่อใช้ไลเซนส์ที่ผ่านเกณฑ์โอเพนซอร์ส
- นั่นจึงเป็นเหตุผลที่คำนิยามนี้ปรากฏอยู่ในสัญญาจัดซื้อจัดจ้างของบริษัทขนาดใหญ่ทั่วโลก

โอเพนซอร์สไม่ใช่แค่ปัญหาทางกฎหมายหรือธุรกิจ

โอเพนซอร์สมอบเสรีภาพในการทำงานให้แก่นักพัฒนา
- หากไม่มีโอเพนซอร์ส เราจะสูญเสียประโยชน์จากการใช้โค้ดได้อย่างอิสระ โดยไม่ต้องรู้หรือใส่ใจเงื่อนไขไลเซนส์มากมาย
- หากต้องตรวจสอบไลเซนส์ของโค้ดทุกชิ้น นักพัฒนาก็จะต้องผ่านการตรวจสอบทางกฎหมายทุกครั้งที่ต้องการใช้ไลบรารีใหม่
- บริษัทต่างๆ จะกลัวการเผยแพร่อะไรสักอย่างบนอินเทอร์เน็ต หากความรับผิดที่ต้องเผชิญเมื่อเปิดเผยซอร์สโค้ดยังไม่ชัดเจน
Lorenc เน้นย้ำว่านี่ไม่ใช่ปัญหาของบริษัทยักษ์ใหญ่เท่านั้น แต่เป็นปัญหาร่วมกัน
- ทุกคนที่ใช้โอเพนซอร์สจะได้รับผลกระทบ
- ทั้งโปรเจกต์อาจหยุดทำงาน บั๊กด้านความปลอดภัยจะไม่ได้รับการแก้ไข และการบำรุงรักษาจะยากขึ้นมาก
- เราต้องร่วมมือกันเพื่อรักษาและปกป้องนิยามของโอเพนซอร์ส มิฉะนั้นทนายความก็จะกลับเข้ามาแทรกแซงอีกครั้ง
ทนายความด้านทรัพย์สินทางปัญญาจำนวนมากเองก็ไม่ต้องการความยุ่งยากแบบนี้
- ไลเซนส์โอเพนซอร์สที่แท้จริงทำให้ชีวิตของบริษัท โปรแกรมเมอร์ และทนายความง่ายขึ้นทั้งหมด
- การเพิ่มข้อกำหนดอย่าง "เปิด ยกเว้นคนที่สามารถแข่งขันกับเราได้" หรือ "เปิด ยกเว้นคนที่สามารถนำโค้ดไปใช้งานบนคลาวด์ได้" มีแต่จะสร้างปัญหาให้ตัวเอง

โอเพนวอชชิงสร้างความเสียหายกับทุกคน

ท้ายที่สุดแล้ว โอเพนวอชชิงจะทำให้งานด้านกฎหมาย ธุรกิจ และการพัฒนาของทุกฝ่ายยุ่งเหยิงไปหมด
น่าแดกดันว่าบริษัทที่มองสั้นและสนับสนุนแนวทางนี้อยู่ในตอนนี้ก็จะได้รับผลเสียเช่นกัน
เพราะท้ายที่สุด งานแทบทั้งหมดของพวกเขา โดยเฉพาะในสาย AI ก็ล้วนตั้งอยู่บนโอเพนซอร์ส

ความเห็นของ GN⁺

แนวปฏิบัติแบบโอเพนวอชชิงที่บ่อนทำลายนิยามของโอเพนซอร์ส อาจส่งผลลบไม่ใช่แค่กับวงการ AI แต่กับอุตสาหกรรมซอฟต์แวร์โดยรวม ทั้งการจำกัดการทำงานของนักพัฒนาและเพิ่มความเสี่ยงทางกฎหมายให้บริษัท
การที่บริษัทต้องการเพียงใช้ประโยชน์จากภาพลักษณ์เชิงบวกของโอเพนซอร์ส เป็นท่าทีที่มองสั้น และในระยะยาวอาจย้อนกลับมาทำร้ายตัวบริษัทเอง
หากต้องการให้เทคโนโลยี AI พัฒนาได้ต่อไป ความร่วมมือและการแบ่งปันตามจิตวิญญาณของโอเพนซอร์สเป็นสิ่งจำเป็น บริษัทต่างๆ ควรเป็นผู้นำในการสร้างวัฒนธรรมโอเพนซอร์สที่แท้จริง
มีความจำเป็นเร่งด่วนในการกำหนดนิยามและมาตรฐานที่ชัดเจนสำหรับโอเพนซอร์ส AI โดย OSI มีกำหนดประกาศนิยามโอเพนซอร์ส AI ในเร็วๆ นี้ ซึ่งควรเป็นฐานให้บริษัท รัฐบาล และชุมชนนักพัฒนาร่วมมือกันต่อไป
ควรมีกิจกรรมสร้างความตระหนักรู้ให้ผู้บริโภคและนักพัฒนาเพื่อป้องกันโอเพนวอชชิงด้วย สิ่งสำคัญคือไม่ควรเชื่อคำกล่าวอ้างว่า "โอเพน" ของบริษัทโดยตรง แต่ควรตรวจสอบไลเซนส์และแนวปฏิบัติจริงอย่างรอบคอบ

2 ความคิดเห็น

ndrgrd 2024-10-28

ดูเหมือนจะเห็นปรากฏการณ์ที่บริษัทเปิดโครงการเป็นโอเพนซอร์สเพื่อฝากให้คอมมูนิตี้ช่วยแก้บั๊กช่วงแรกและปรับปรุงฟีเจอร์ แล้วพอระบบนิ่งก็แอบดึงกลับไปเป็นไลเซนส์แบบปิดขาดกันอยู่บ่อย ๆ

แม้จะมีคนบอกว่าก็แค่ fork ก็ได้ไม่ใช่เหรอ แต่ภาพลักษณ์และมูลค่าของชื่อที่สร้างติดตลาดไปแล้วนั้น บริษัทก็เอาไปกินเรียบอยู่ดี

GN⁺ 2024-10-28

ความคิดเห็นจาก Hacker News

เมื่อต้องเลือกระหว่างโปรแกรมหรือโมเดล AI สองอย่าง มักเกิดการถกเถียงระหว่างคนที่ชอบโอเพนซอร์สกับคนที่ไม่ชอบ เป้าหมายคือทำให้โปรแกรมที่ไม่ใช่โอเพนซอร์สดูเหมือนเป็นโอเพนซอร์ส
โอเพนซอร์สเป็นการประนีประนอมที่เป็นมิตรต่อองค์กร แต่ผู้มีส่วนร่วมบางคนยึดถือศีลธรรมในระดับสูง คนที่มีหลักศีลธรรมเช่นนี้ควรหยุดยั้งการนำโอเพนซอร์สไปใช้ในทางที่ผิด
หากแก้ปัญหาผ่านเครื่องหมายการค้า การรับรอง หรือไลเซนส์ไม่ได้ ก็ควรสื่อสารสารนี้ผ่านสื่อกระแสหลัก <i>The Register</i> มีความรู้วงใน แต่เรื่องนี้ต้องเป็นที่รับรู้อย่างกว้างขวางในหมู่สาธารณะ
หลายบริษัทโจมตีโอเพนซอร์ส แต่ก็พึ่งพาซอฟต์แวร์โอเพนซอร์สอย่าง Linux, Java, Debian ในการดำเนินธุรกิจ บริษัทส่วนใหญ่ไม่รู้สึกว่าตนมีหน้าที่ต้องมีส่วนร่วมหรือสนับสนุน
OSI กำลังเตรียมนิยาม Open Source AI ที่มีข้อถกเถียง
thirdweb เป็นโอเพนซอร์สในทางเทคนิค แต่ใช้งานไม่ได้หากไม่มี API key และยังตรวจสอบโควตาการเรียก API กับ SAAS ด้วย สิ่งนี้ทำให้ทีมที่พยายามสร้างทางเลือกโอเพนซอร์สอย่างแท้จริงหมดกำลังใจ
ผลจากการไม่สามารถทำให้แนวคิดอย่าง fair source เป็นที่แพร่หลาย คือบริษัทขนาดเล็กที่ไม่ใช่ SAAS ไม่อาจอยู่รอดได้ด้วยโอเพนซอร์ส
โอเพนซอร์สไม่มีจริยธรรมหรือปรัชญาแบบที่ซอฟต์แวร์เสรีมี ซอฟต์แวร์เสรีเหนือกว่าโอเพนซอร์ส
สำหรับโมเดลขนาดใหญ่ ต้นทุนการฝึกสูง ไบนารีอาร์ติแฟกต์มีมูลค่าและสามารถดัดแปลงได้ หาก OSI สร้างนิยามขึ้นมาได้ ก็ควรชื่นชมความพยายามของพวกเขา ไม่ว่า Meta จะปฏิบัติตามหรือไม่ก็ตาม
OSI ควรตระหนักว่าในยุคของผู้ให้บริการคลาวด์รายใหญ่ จำเป็นต้องมีการคุ้มครองจากผู้เล่นในตลาด ต้องมีตัวเลือกไลเซนส์ที่ชัดเจนเพื่อหลีกเลี่ยงดราม่าแบบ Mongo, Elastic, Redis
ควรปกป้องคำว่า "Open <something>" เพื่อไม่ให้ทำให้สาธารณชนเข้าใจผิด ต้องป้องกันความสับสนแบบ "OpenAI"
การรับเอาการมีส่วนร่วมจากชุมชนแล้วภายหลังถอนไลเซนส์นั้นเลวร้ายยิ่งกว่าการใช้คำว่า "Open Source" อย่างผิด ๆ ควรถูกมองว่าเป็นการฉ้อโกงและต้องมีความรับผิดทางแพ่ง
หากไม่แบ่งปันสคริปต์การฝึกและข้อมูลที่ทำให้ทำซ้ำได้ สำหรับโมเดล AI ชื่อว่า "Open Weights" จะเหมาะสมกว่า