- ระหว่างการตรวจสอบพื้นผิวการโจมตีจากภายนอกของ DeepSeek พบ ฐานข้อมูล ClickHouse ที่เปิดโดยไม่ต้องยืนยันตัวตน และ DeepSeek ได้ปิดกั้นการเปิดเผยดังกล่าวทันทีหลังได้รับแจ้ง
- จุดที่ถูกเปิดเผยคือ พอร์ต 8123 และ 9000 ของ oauth2callback.deepseek.com และ dev.deepseek.com ซึ่งทำให้ภายนอกสามารถควบคุมฐานข้อมูลทั้งหมดและเข้าถึงข้อมูลภายในได้
- ตาราง
log_streamมีล็อกมากกว่า 1 ล้านรายการ และมีประวัติแชตตั้งแต่วันที่ 6 มกราคม 2025, API Keys, รายละเอียดแบ็กเอนด์ และเมทาดาทาด้านปฏิบัติการในรูปแบบข้อความล้วน - สามารถรัน คำสั่ง SQL ใดก็ได้ จากเบราว์เซอร์ผ่านเส้นทาง
/playของอินเทอร์เฟซ HTTP ของ ClickHouse แต่ Wiz Research จำกัดขอบเขตการดูไว้เพียงระดับการไล่รายการตามแนวปฏิบัติด้านการวิจัยที่มีจริยธรรม - ในการนำบริการ AI มาใช้อย่างรวดเร็ว ความเสี่ยงเฉพาะหน้าไม่ได้เกิดจากตัวโมเดลเท่านั้น แต่ยังมาจากปัญหาความปลอดภัยโครงสร้างพื้นฐานพื้นฐาน เช่น การเปิดฐานข้อมูลออกสู่ภายนอกโดยไม่ตั้งใจ
ฐานข้อมูล DeepSeek ClickHouse ที่เปิดโดยไม่ต้องยืนยันตัวตน
- Wiz Research ระบุพบ ฐานข้อมูล ClickHouse ที่เข้าถึงได้แบบสาธารณะ ซึ่งเป็นของ DeepSeek
- ฐานข้อมูลดังกล่าวเข้าถึงได้โดยไม่ต้องยืนยันตัวตน และอยู่ในสภาพที่สามารถควบคุมการทำงานของฐานข้อมูลได้ทั้งหมด ไม่ใช่แค่ดูข้อมูลภายในเท่านั้น
- ข้อมูลที่ถูกเปิดเผยมีทั้งประวัติแชต, API Keys, รายละเอียดแบ็กเอนด์, log streams และรายละเอียดด้านปฏิบัติการ
- Wiz Research แจ้งปัญหาไปยัง DeepSeek ทันที และ DeepSeek ก็ปิดกั้นการเปิดเผยดังกล่าวอย่างรวดเร็ว
การสำรวจพื้นผิวการโจมตีภายนอกและจุดที่ถูกเปิดเผย
- DeepSeek เป็นสตาร์ทอัพ AI จากจีน ซึ่งเพิ่งได้รับความสนใจอย่างมากจากโมเดลให้เหตุผล DeepSeek-R1
- DeepSeek-R1 เป็นที่รู้กันว่าสามารถแข่งขันด้านประสิทธิภาพกับระบบ AI ชั้นนำอย่าง o1 ของ OpenAI ได้
- จุดเด่นหลักที่ถูกกล่าวถึงคือความคุ้มค่าด้านต้นทุนและประสิทธิภาพ
- Wiz Research สำรวจโดเมนสาธารณะเพื่อประเมิน พื้นผิวการโจมตีภายนอก ของ DeepSeek
- จากการค้นหาซับโดเมนทั้งแบบพาสซีฟและแอ็กทีฟ พบซับโดเมนที่เปิดสู่อินเทอร์เน็ตราว 30 รายการ
- ส่วนใหญ่เป็นรายการที่ในตอนแรกดูไม่ใช่การเปิดเผยความเสี่ยงสูง เช่น อินเทอร์เฟซแชตบอต หน้าสถานะ และเอกสาร API
- เมื่อตรวจสอบนอกเหนือจากพอร์ต HTTP มาตรฐาน 80/443 พบว่า พอร์ต 8123 และ 9000 เปิดอยู่
- โฮสต์เป้าหมายคือ oauth2callback.deepseek.com และ dev.deepseek.com
การรัน SQL ผ่านเส้นทาง /play
- พอร์ตที่พบเชื่อมไปยัง ฐานข้อมูล ClickHouse ที่เข้าถึงได้โดยไม่ต้องยืนยันตัวตน
- ClickHouse เป็นระบบจัดการฐานข้อมูลแบบคอลัมน์โอเพนซอร์สที่ออกแบบมาเพื่อการคิวรีเชิงวิเคราะห์ที่รวดเร็วบนชุดข้อมูลขนาดใหญ่
- พัฒนาโดย Yandex
- ใช้กันอย่างแพร่หลายในการประมวลผลข้อมูลแบบเรียลไทม์ การจัดเก็บล็อก และการวิเคราะห์บิ๊กดาต้า
- ในอินเทอร์เฟซ HTTP ของ ClickHouse สามารถใช้เส้นทาง
/playเพื่อรัน คำสั่ง SQL ใดก็ได้ โดยตรงจากเบราว์เซอร์ - คิวรี
SHOW TABLES;ส่งคืนรายชื่อชุดข้อมูลที่เข้าถึงได้ และในนั้นตารางlog_streamมีล็อกที่อ่อนไหวเป็นพิเศษ
ล็อกอ่อนไหวที่อยู่ใน log_stream
- ตาราง
log_streamมีรายการล็อกมากกว่า 1 ล้านรายการ - คอลัมน์หลักและข้อมูลที่ถูกเปิดเผยมีดังนี้
timestamp: ล็อกตั้งแต่ วันที่ 6 มกราคม 2025span_name: อ้างอิงถึงเอนด์พอยต์ API ภายในต่าง ๆ ของ DeepSeekstring.values: ล็อกข้อความล้วนที่มีประวัติแชต, API Keys, รายละเอียดแบ็กเอนด์ และเมทาดาทาด้านปฏิบัติการ_service: ระบุบริการของ DeepSeek ที่สร้างล็อก_source: เปิดเผยแหล่งที่มาของคำขอล็อก และมีประวัติแชต, API Keys, โครงสร้างไดเรกทอรี และล็อกเมทาดาทาของแชตบอต
- ระดับการเข้าถึงเช่นนี้อาจก่อให้เกิดความเสี่ยงร้ายแรงต่อความปลอดภัยของ DeepSeek เองและผู้ใช้ปลายทาง
- ผู้โจมตีสามารถดึงล็อกอ่อนไหวและข้อความแชตจริงแบบข้อความล้วนออกไปได้ และขึ้นอยู่กับการตั้งค่า ClickHouse ยังอาจใช้คิวรีอย่าง
SELECT * FROM file('filename')เพื่อรั่วไหลรหัสผ่านข้อความล้วน ไฟล์ในเครื่อง และข้อมูลกรรมสิทธิ์จากเซิร์ฟเวอร์โดยตรงได้ - Wiz Research ไม่ได้รัน คิวรีเชิงรุกที่เกินกว่าการไล่รายการ เพื่อรักษาแนวปฏิบัติด้านการวิจัยที่มีจริยธรรม
ความเร็วในการนำ AI มาใช้และความเสี่ยงด้านความปลอดภัยโครงสร้างพื้นฐาน
- ความเสี่ยงด้านความปลอดภัยเฉพาะหน้าของแอปพลิเคชัน AI อาจเกิดจาก โครงสร้างพื้นฐานและเครื่องมือ ที่รองรับมัน มากกว่าจากตัวโมเดลเอง
- แม้การถกเถียงเรื่องความปลอดภัย AI จะมุ่งไปที่ภัยคุกคามในอนาคต แต่ความเสี่ยงด้านความปลอดภัยพื้นฐาน เช่น การเปิดฐานข้อมูลออกสู่ภายนอกโดยไม่ตั้งใจ ยังคงต้องเป็นภารกิจลำดับต้นของทีมความปลอดภัย
- เมื่อองค์กรนำเครื่องมือและบริการ AI จากสตาร์ทอัพและผู้ให้บริการหลากหลายรายมาใช้อย่างรวดเร็ว กรณีที่ฝากข้อมูลอ่อนไหวไว้กับบริษัทเหล่านี้ก็เพิ่มขึ้น
- ความเร็วในการนำมาใช้อาจทำให้มองข้ามความปลอดภัยได้ ดังนั้นการปกป้องข้อมูลลูกค้าต้องเป็นสิ่งสำคัญลำดับแรก
- ทีมความปลอดภัยต้องทำงานใกล้ชิดกับวิศวกร AI เพื่อให้มี การมองเห็น สถาปัตยกรรม เครื่องมือ และโมเดลที่ใช้งานอยู่ จึงจะป้องกันการรั่วไหลของข้อมูลได้
- บริษัท AI กำลังเติบโตอย่างรวดเร็วเป็นผู้ให้บริการโครงสร้างพื้นฐานสำคัญโดยไม่มีเฟรมเวิร์กความปลอดภัยที่โดยปกติมักมาพร้อมกับการนำไปใช้อย่างกว้างขวาง จึงจำเป็นต้องมีแนวปฏิบัติด้านความปลอดภัยที่เหมาะกับความเสี่ยงในการจัดการข้อมูลอ่อนไหว
ยังไม่มีความคิดเห็น