Atlassian เปลี่ยนค่าเริ่มต้นให้ใช้ข้อมูลลูกค้าสำหรับการฝึก AI
(letsdatascience.com)- ข้อมูลเมตาของลูกค้าและคอนเทนต์ภายในแอปของผลิตภัณฑ์ Atlassian Cloud เช่น Jira, Confluence จะถูกนำไปใช้กับการฝึก Rovo และ Rovo Dev ตามค่าเริ่มต้นตั้งแต่วันที่ 17 สิงหาคม 2026
- ค่าเริ่มต้นจะแตกต่างกันตามแพ็กเกจ โดยใน Free·Standard·Premium จะเปิดใช้ การมีส่วนร่วมของข้อมูลเมตา ตลอดเวลา และมีเพียง Enterprise ที่ปิดข้อมูลเมตาและข้อมูลภายในแอปเป็นค่าเริ่มต้นพร้อมคงสิทธิ์การควบคุมไว้
- ข้อมูลที่ถูกรวบรวมครอบคลุมทั้งข้อมูลเมตา เช่น คะแนนความสามารถในการอ่าน, story points, ค่า SLA และข้อมูลภายในแอป เช่น เนื้อหาหน้า คำอธิบาย issue ความคิดเห็น และชื่อเวิร์กโฟลว์
- แม้จะมีมาตรการป้องกัน เช่น การลบตัวระบุโดยตรงและการทำข้อมูลแบบรวม แต่ข้อมูลที่นำไปมีส่วนร่วมอาจถูกเก็บไว้นานสูงสุด 7 ปี และหลังการลบหรือ opt-out ข้อมูลภายในแอปจะถูกนำออกภายใน 30 วัน ส่วนโมเดลที่ฝึกด้วยข้อมูลดังกล่าวจะถูกฝึกใหม่ภายใน 90 วัน
- นี่เป็นการเปลี่ยนนโยบายจากจุดยืนเดิมที่ไม่ใช้ข้อมูล ไปสู่การเปลี่ยนแปลงเรื่อง แหล่งที่มาของข้อมูล ในเครื่องมือทำงานและระดับการควบคุมตามราคา ซึ่งส่งผลต่อการตัดสินใจด้านความเป็นส่วนตัว การกำกับดูแล และคอมพลายแอนซ์มากขึ้น
ภาพรวมการเปลี่ยนแปลง
- Atlassian จะเริ่มใช้ข้อมูลเมตาของลูกค้าและคอนเทนต์ภายในแอปของ Jira, Confluence และผลิตภัณฑ์ Atlassian Cloud อื่น ๆ สำหรับการฝึก AI ตามค่าเริ่มต้นตั้งแต่ 17 สิงหาคม 2026
- ระบุฟีเจอร์ AI ที่เกี่ยวข้องคือ Rovo และ Rovo Dev
- ขนาดลูกค้าที่ได้รับผลกระทบราว 300,000 ราย
- จากการเปลี่ยนนโยบายการนำข้อมูลไปมีส่วนร่วม ค่าเริ่มต้นจะต่างกันตามแพ็กเกจ
- แพ็กเกจระดับล่างไม่สามารถ opt-out จากการเก็บข้อมูลเมตาได้
- แพ็กเกจ Enterprise ยังคงมีสิทธิ์ควบคุมการเก็บทั้งข้อมูลเมตาและข้อมูลภายในแอป
- ระยะเวลาเก็บข้อมูลที่นำไปมีส่วนร่วมสูงสุด 7 ปี
- หลังการลบหรือ opt-out ข้อมูลภายในแอปจะถูกนำออกภายใน 30 วัน
- โมเดลที่ฝึกด้วยข้อมูลดังกล่าวจะถูกฝึกใหม่ภายใน 90 วัน เพื่อลบส่วนที่มีส่วนร่วมออก
รายละเอียดทางเทคนิค
- Atlassian แบ่งข้อมูลที่เก็บออกเป็น 2 หมวด คือ ข้อมูลเมตา และ ข้อมูลภายในแอป
- ข้อมูลเมตารวมสัญญาณที่ไม่ระบุตัวตน
- ข้อมูลภายในแอปรวมคอนเทนต์ที่ผู้ใช้สร้างขึ้น
- รายการที่อยู่ในหมวดข้อมูลเมตาอย่างชัดเจน
- คะแนน ความสามารถในการอ่าน และความซับซ้อน
- การจัดประเภทงาน
- ตัวชี้วัดความคล้ายคลึงเชิงความหมาย
- story points
- วันที่สิ้นสุดสปรินต์
- ค่า SLA ของ Jira Service Management
- รายการที่อยู่ในหมวดข้อมูลภายในแอปอย่างชัดเจน
- ชื่อหน้าและเนื้อหาของ Confluence
- ชื่อ issue คำอธิบาย และความคิดเห็นใน Jira
- ชื่ออีโมจิแบบกำหนดเอง
- ชื่อสถานะแบบกำหนดเอง
- ชื่อเวิร์กโฟลว์
- ระบุว่าก่อนการฝึกจะมีการ ลบตัวระบุโดยตรง, การทำข้อมูลแบบรวม และใช้มาตรการป้องกัน
ค่าเริ่มต้นตามแพ็กเกจและกลุ่มที่ถูกยกเว้น
- ค่าเริ่มต้นจะถูกกำหนดโดยอิงจาก แพ็กเกจที่ใช้งานอยู่ซึ่งสูงที่สุด ขององค์กร
- ลูกค้า Free และ Standard
-
การมีส่วนร่วมของข้อมูลเมตาเปิดใช้อยู่เสมอ
- ไม่สามารถ opt-out จากการเก็บข้อมูลเมตาได้
- การมีส่วนร่วมของข้อมูลภายในแอปเปิดเป็นค่าเริ่มต้น แต่เปลี่ยนการตั้งค่าได้
- ลูกค้า Premium
- การมีส่วนร่วมของข้อมูลเมตาเปิดใช้อยู่เสมอ
- การมีส่วนร่วมของข้อมูลภายในแอป ปิดเป็นค่าเริ่มต้น
- ลูกค้า Enterprise
- ทั้งข้อมูลเมตาและข้อมูลภายในแอป ปิดเป็นค่าเริ่มต้น
- สามารถ opt-out จากข้อมูลเมตาได้
- ระบุกลุ่มลูกค้าที่ถูกยกเว้นจากขอบเขตการเก็บทั้งหมด
- ลูกค้าที่ใช้ customer-managed encryption keys
- ลูกค้าที่ใช้ Atlassian Government Cloud
- ลูกค้าที่ใช้ Atlassian Isolated Cloud
- ลูกค้าที่มี ข้อผูกพัน HIPAA
-
บริบทและความสำคัญ
- นโยบายครั้งนี้เป็นการเปลี่ยนทิศจากจุดยืนเดิม
- ก่อนหน้านี้บริษัทระบุว่าจะไม่ใช้ข้อมูลลูกค้าเพื่อฝึกหรือปรับปรุงบริการ AI
- กระแสอุตสาหกรรมที่ถูกยกมาเป็นฉากหลังของการเปลี่ยนแปลง
- ผู้ให้บริการ SaaS กำลังเก็บสัญญาณการใช้งานภายในและคอนเทนต์เพื่อนำไป bootstrap โมเดล, fine-tune และประเมินผล
- ขณะเดียวกันก็ให้คำมั่นเรื่องการวิเคราะห์บนฐานข้อมูลที่ไม่ระบุตัวตนและแบบรวม
- ประโยชน์เชิงปฏิบัติที่ Atlassian ระบุ
- ปรับปรุง ความเกี่ยวข้องของการค้นหา
- สรุปได้ดีขึ้น
- การแนะนำเทมเพลต
- การเพิ่มประสิทธิภาพเวิร์กโฟลว์แบบเอเจนต์
- ผลกระทบในมุมผู้ปฏิบัติงานจริง
- การเปลี่ยนแปลง แหล่งที่มาของข้อมูล ของโมเดลที่ใช้ในเครื่องมือทำงาน
- การเปลี่ยนแปลงระดับการควบคุมข้อมูลตามราคา และเกณฑ์ตัดสินด้านคอมพลายแอนซ์กับการจัดซื้อ
ความเสี่ยงและ trade-off
- การเก็บ ข้อมูลเมตาแบบบังคับ สำหรับลูกค้าที่ไม่ใช่ Enterprise ก่อให้เกิดความกังวลด้านความเป็นส่วนตัวและการกำกับดูแล แม้จะมีการลบตัวระบุก็ตาม
- เทเลเมทรีอย่าง story points และตัวชี้วัด SLA อาจเปิดเผยโครงสร้างโครงการและรูปแบบผลการดำเนินงานได้
- การเก็บข้อมูลที่ไม่ระบุตัวตนไว้นาน 7 ปี ทำให้พื้นผิวการเปิดเผยเพิ่มขึ้นตามกาลเวลา
- เป็นภาระเพิ่มเติมสำหรับลูกค้าที่ต้องตรวจสอบการเก็บข้อมูลระยะยาว
- มีเส้นทางยกเว้นสำหรับลูกค้าที่ต้องการความปลอดภัยสูงและลูกค้าที่ใช้ customer-managed keys
- แต่ก็อาจต้องย้ายไปใช้แพ็กเกจที่แพงขึ้นหรือรูปแบบการติดตั้งแบบพิเศษ
จุดที่ควรจับตา
- แต่ละองค์กรควรตรวจสอบ Atlassian tenant ของตน
- ต้องยืนยันแพ็กเกจที่ใช้งานอยู่ซึ่งสูงที่สุดในแต่ละ tenant
- ต้องทำความเข้าใจการตั้งค่าการมีส่วนร่วมของข้อมูลตามค่าเริ่มต้น
- ระหว่างช่วง rollout จำเป็นต้องอัปเดตการตั้งค่าฝั่งผู้ดูแลระบบ
- หากต้องการ opt-out ทั้งหมด อาจต้องพิจารณาย้ายไป Enterprise หรือการติดตั้งแบบแยกสภาพแวดล้อม
- ประเด็นที่น่าจับตาฝั่งผลิตภัณฑ์
- ต้องดูว่า Atlassian จะดำเนินกระบวนการ ฝึกใหม่ภายใน 90 วัน อย่างไรในทางปฏิบัติ
- ต้องตรวจสอบว่าผู้ให้บริการ LLM downstream ที่ใช้กับ Rovo อ้างว่าไม่เก็บอินพุตหรือไม่
- หากรูปแบบนี้ขยายไปทั่ว SaaS สำหรับองค์กร อาจเกิดกระแสต่อต้านจากลูกค้าและการจับตาจากหน่วยงานกำกับดูแล
เหตุผลของการประเมิน
- การเปลี่ยนแปลงครั้งนี้ส่งผลจริงต่อผู้ใช้ระดับองค์กรหลายพันรายและผู้ปฏิบัติงานที่ดูแล data governance และการจัดการแหล่งที่มาของโมเดล
- ไม่ได้ถูกจัดว่าเป็นโมเดลล้ำสมัยหรือหมุดหมายด้านกฎระเบียบ
- ถูกประเมินว่าเป็น การเปลี่ยนนโยบายผลิตภัณฑ์ ที่เปลี่ยนทั้ง data pipeline ของทีมและตัวเลือกด้านคอมพลายแอนซ์อย่างมีนัยสำคัญ
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ฉันรู้สึกว่า Atlassian เหมือนกำลังเดินหน้าทำ ความผิดพลาดซ้ำแล้วซ้ำเล่า เท่านั้นเอง ฉันยังใช้ผลิตภัณฑ์ของมันอยู่บ่อย แต่เจอบั๊กระดับ P0 ถี่เกินไป self-hosted Bitbucket workers โดยเฉพาะฝั่ง Docker เก่ามากจนต้องยัดวิธีแก้ขัดเข้าไปเพียบ ใน JIRA ถ้าจะเปลี่ยนลำดับตั๋วใหม่ก็ต้องรีเฟรชมาหลายปีแล้ว ฟีเจอร์ใหม่ที่เพิ่มเข้าไปใน JIRA กับ Bitbucket ช่วงไม่กี่ปีมานี้ก็ทำงานไม่ค่อยได้ดี ฉันลองฟีเจอร์ AI แบบทดลองใช้ฟรีแล้วแต่มันไม่ทำงานเลย แถมจะยกเลิกก็ทำออนไลน์ไม่ได้ ต้องเปิด support ticket หลายใบ ระหว่างนั้นฟอร์มติดต่อฝ่ายสนับสนุนก็พังหลายรอบอีก ฉันสงสัยจริง ๆ ว่าทำไม ความขัดข้องของฟีเจอร์ ถึงหนักขนาดนี้ เป็นเพราะ technical debt, คนเก่งไหลออก, หรือทั้งสองอย่างกันแน่ ถ้าดูในชุมชนก็เห็นบั๊กเป็นร้อยเป็นพันรายการพร้อมวิธีเลี่ยงปัญหาแนบอยู่
ฉันอยากแนบแหล่งที่ดีกว่านี้ แต่ประเด็นสำคัญคือ ตอนนี้ทั้งลูกค้าฟรีและลูกค้าที่จ่ายเงินถูกตั้งค่าเป็น ยินยอมให้ใช้ข้อมูลฝึก AI โดยค่าเริ่มต้น ข้อมูลทั้งหมดอย่างหน้า Confluence และ ticket ใน Jira อยู่ในขอบเขตนี้ เอกสารซัพพอร์ตของ Atlassian บอกวิธีปิดไว้ แต่ในอินสแตนซ์ของพวกเราไม่เห็นการตั้งค่านั้นเลย
ฉันเห็นข่าวลือว่า Anthropic กำลังคุยเรื่องเข้าซื้อ Atlassian และอาจเป็นเพราะ ข้อมูลสำหรับฝึกโมเดล ด้วย มี โพสต์บน Reddit ที่พูดถึงกระแส data poisoning อยู่แล้วด้วย
ฉันรู้สึกว่าใน enterprise SaaS รูปแบบ เก็บข้อมูลเป็นค่าเริ่มต้น แทนที่จะเป็น opt-out กำลังค่อย ๆ ถูกทำให้เป็นเรื่องปกติ แต่กรณีนี้หนักเป็นพิเศษเพราะมันไม่ได้ครอบคลุมแค่ metadata แต่กินไปถึงเนื้อหาทั้งหมดในแอป และยิ่งแย่ตรงที่การตั้งค่า opt-out ยังไม่เรนเดอร์ขึ้นมาอีก การตัดสินใจเชิงนโยบายจะถกเถียงกันได้ แต่พอสองอย่างนี้มาคู่กันมันดูเหมือนจงใจสร้างแรงเสียดทาน อีกเรื่องที่ต้องแยกพูดคือ data residency เพราะผู้ซื้อมากมายเข้าใจว่าการตรึงข้อมูลไว้ตามภูมิภาคคือการรับประกันความเป็นส่วนตัวแบบครบวงจร แต่จริง ๆ แล้วมันหมายถึงแค่เก็บไว้ที่ไหน ไม่ได้การันตีว่าใครเข้าถึงได้เพื่อวัตถุประสงค์อะไร
ฉันมองว่าหลายบริษัทอื่นอย่าง GitHub, Figma, Adobe, Vercel ก็เปิดอะไรแบบนี้ไว้เป็นค่าเริ่มต้นเหมือนกัน เพราะงั้นถ้าคุณฝากข้อมูลไว้กับบริษัทไหน ก็ควรตั้งต้นไว้ก่อนว่ามันอาจถูกใช้สำหรับ ฝึกโมเดล ได้โดยปริยาย
ถ้าข่าวลือเรื่อง Anthropic เข้าซื้อเป็นจริง ฉันคิดว่า Atlassian จะถูกมองเป็นโอกาสในการซื้อชุดข้อมูล สัญญาณสูง รอบงานธุรกิจไปทั้งก้อน
ฉันสงสัยว่า Atlassian เอาโค้ดและเนื้อหาใน private Bitbucket repository ไปอยู่ใน ขอบเขตการเก็บข้อมูล ด้วยหรือไม่ ข้อความในนโยบายกับ FAQ มันกำกวมจนฉันอยากได้คำตอบชัด ๆ แบบใช่หรือไม่ใช่
แต่ก่อนมีคำพูดว่าถ้าไม่จ่ายเงิน คุณก็คือสินค้า แต่ตอนนี้กลับกลายเป็นว่าบริษัทถึงขั้นจ่ายเงินแล้วก็ยัง กลายเป็นสินค้าเสียเอง ยิ่งฟังยิ่งเหลือเชื่อ
ฉันอยากย้ำว่าออปชัน data residency ของ Atlassian ไม่ได้ช่วยกันปัญหานี้เลย ต่อให้ผูกข้อมูลไว้กับรีเจียนหนึ่ง มันก็ยังถูกใช้เพื่อการฝึกได้อยู่ดี
เพราะงั้นฉันเลยรู้สึกว่าเหตุผลที่ Atlassian อยากลดการรองรับ Data Center แบบ on-prem ก็ดูชัดขึ้นมาก