- ทีมวิจัย AI ของ Microsoft เปิดเผยข้อมูลส่วนบุคคลขนาด 38 เทราไบต์โดยไม่ได้ตั้งใจ ขณะเผยแพร่ข้อมูลฝึกโอเพนซอร์สบน GitHub
- ข้อมูลที่รั่วไหลมีทั้งแบ็กอัปดิสก์เวิร์กสเตชันของพนักงาน 2 คน ความลับ คีย์ส่วนตัว รหัสผ่าน และข้อความภายใน Microsoft Teams มากกว่า 30,000 รายการ
- ข้อมูลดังกล่าวถูกแชร์ผ่าน SAS token ซึ่งเป็นฟีเจอร์ของ Azure ที่ช่วยให้แชร์ข้อมูลจากบัญชี Azure Storage ได้ อย่างไรก็ตาม ลิงก์ถูกตั้งค่าให้แชร์ทั้งบัญชีสตอเรจ จึงทำให้ข้อมูลถูกเปิดเผย
- เหตุการณ์นี้ตอกย้ำความเสี่ยงรูปแบบใหม่ที่องค์กรต้องเผชิญเมื่อนำ AI มาใช้ และแสดงให้เห็นว่าจำเป็นต้องมีการตรวจสอบความปลอดภัยและมาตรการป้องกันเพิ่มเติม เมื่อมีวิศวกรมากขึ้นที่ต้องจัดการข้อมูลฝึกขนาดใหญ่
- ทีมวิจัยของ Wiz พบการรั่วไหลนี้ระหว่างค้นหาคอนเทนเนอร์สตอเรจที่ตั้งค่าผิดบนอินเทอร์เน็ต
- พวกเขาพบรีโพซิทอรี GitHub ชื่อ
robust-models-transfer ภายใต้องค์กร Microsoft ซึ่งถูกสร้างขึ้นเพื่อเผยแพร่โค้ดโอเพนซอร์สและโมเดล AI สำหรับการรู้จำภาพ แต่การตั้งค่าที่ผิดพลาดทำให้ URL สามารถเข้าถึงสิ่งที่มากกว่าโมเดลโอเพนซอร์สได้
- token ที่ใช้งานยังถูกตั้งค่าผิดให้อนุญาตสิทธิ์แบบ "ควบคุมทั้งหมด" ทำให้ผู้โจมตีสามารถดู ลบ และเขียนทับไฟล์ที่มีอยู่ได้
- เหตุการณ์นี้ชี้ให้เห็นความเสี่ยงด้านความปลอดภัยของ SAS token ซึ่งให้สิทธิ์เข้าถึงบัญชีสตอเรจในระดับสูง และอาจมีปัญหาเรื่องการหมดอายุ อีกทั้งยังจัดการและเพิกถอนได้ยาก
- ทีมวิจัยของ Wiz เสนอว่าเพื่อหลีกเลี่ยงปัญหาด้านความปลอดภัยและการกำกับดูแล ควรหลีกเลี่ยงการใช้ Account SAS สำหรับการแชร์ภายนอก และใช้ Stored Access Policy หรือ User Delegation SAS สำหรับการแชร์แบบจำกัดเวลา
- ทีมยังแนะนำให้สร้างบัญชีสตอเรจเฉพาะสำหรับการแชร์ภายนอก และใช้ CSPM เพื่อติดตามและบังคับใช้นโยบาย
- เหตุการณ์นี้เป็นเครื่องเตือนใจให้ทีมความปลอดภัยเข้าใจความเสี่ยงที่แฝงอยู่ในแต่ละขั้นตอนของกระบวนการพัฒนา AI รวมถึงความเสี่ยงจากการแชร์ข้อมูลมากเกินไปและการโจมตีซัพพลายเชน
- หลังจากนั้น Microsoft ได้ทำให้ SAS token ใช้งานไม่ได้และเปลี่ยนใหม่บน GitHub พร้อมเสร็จสิ้นการตรวจสอบภายในเกี่ยวกับผลกระทบที่อาจเกิดขึ้น
1 ความคิดเห็น
ความเห็นจาก Hacker News