ข้อมูลละเอียดอ่อนรั่วไหล ฐานข้อมูล DeepSeek ที่มีประวัติแชตถูกเปิดเผย

(wiz.io)

1 คะแนน โดย GN⁺ 2025-01-30 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

ระหว่างการตรวจสอบพื้นผิวการโจมตีจากภายนอกของ DeepSeek พบ ฐานข้อมูล ClickHouse ที่เปิดโดยไม่ต้องยืนยันตัวตน และ DeepSeek ได้ปิดกั้นการเปิดเผยดังกล่าวทันทีหลังได้รับแจ้ง
จุดที่ถูกเปิดเผยคือ พอร์ต 8123 และ 9000 ของ oauth2callback.deepseek.com และ dev.deepseek.com ซึ่งทำให้ภายนอกสามารถควบคุมฐานข้อมูลทั้งหมดและเข้าถึงข้อมูลภายในได้
ตาราง log_stream มีล็อกมากกว่า 1 ล้านรายการ และมีประวัติแชตตั้งแต่วันที่ 6 มกราคม 2025, API Keys, รายละเอียดแบ็กเอนด์ และเมทาดาทาด้านปฏิบัติการในรูปแบบข้อความล้วน
สามารถรัน คำสั่ง SQL ใดก็ได้ จากเบราว์เซอร์ผ่านเส้นทาง /play ของอินเทอร์เฟซ HTTP ของ ClickHouse แต่ Wiz Research จำกัดขอบเขตการดูไว้เพียงระดับการไล่รายการตามแนวปฏิบัติด้านการวิจัยที่มีจริยธรรม
ในการนำบริการ AI มาใช้อย่างรวดเร็ว ความเสี่ยงเฉพาะหน้าไม่ได้เกิดจากตัวโมเดลเท่านั้น แต่ยังมาจากปัญหาความปลอดภัยโครงสร้างพื้นฐานพื้นฐาน เช่น การเปิดฐานข้อมูลออกสู่ภายนอกโดยไม่ตั้งใจ

ฐานข้อมูล DeepSeek ClickHouse ที่เปิดโดยไม่ต้องยืนยันตัวตน

Wiz Research ระบุพบ ฐานข้อมูล ClickHouse ที่เข้าถึงได้แบบสาธารณะ ซึ่งเป็นของ DeepSeek
ฐานข้อมูลดังกล่าวเข้าถึงได้โดยไม่ต้องยืนยันตัวตน และอยู่ในสภาพที่สามารถควบคุมการทำงานของฐานข้อมูลได้ทั้งหมด ไม่ใช่แค่ดูข้อมูลภายในเท่านั้น
ข้อมูลที่ถูกเปิดเผยมีทั้งประวัติแชต, API Keys, รายละเอียดแบ็กเอนด์, log streams และรายละเอียดด้านปฏิบัติการ
Wiz Research แจ้งปัญหาไปยัง DeepSeek ทันที และ DeepSeek ก็ปิดกั้นการเปิดเผยดังกล่าวอย่างรวดเร็ว

การสำรวจพื้นผิวการโจมตีภายนอกและจุดที่ถูกเปิดเผย

DeepSeek เป็นสตาร์ทอัพ AI จากจีน ซึ่งเพิ่งได้รับความสนใจอย่างมากจากโมเดลให้เหตุผล DeepSeek-R1
- DeepSeek-R1 เป็นที่รู้กันว่าสามารถแข่งขันด้านประสิทธิภาพกับระบบ AI ชั้นนำอย่าง o1 ของ OpenAI ได้
- จุดเด่นหลักที่ถูกกล่าวถึงคือความคุ้มค่าด้านต้นทุนและประสิทธิภาพ
Wiz Research สำรวจโดเมนสาธารณะเพื่อประเมิน พื้นผิวการโจมตีภายนอก ของ DeepSeek
จากการค้นหาซับโดเมนทั้งแบบพาสซีฟและแอ็กทีฟ พบซับโดเมนที่เปิดสู่อินเทอร์เน็ตราว 30 รายการ
- ส่วนใหญ่เป็นรายการที่ในตอนแรกดูไม่ใช่การเปิดเผยความเสี่ยงสูง เช่น อินเทอร์เฟซแชตบอต หน้าสถานะ และเอกสาร API
เมื่อตรวจสอบนอกเหนือจากพอร์ต HTTP มาตรฐาน 80/443 พบว่า พอร์ต 8123 และ 9000 เปิดอยู่
- โฮสต์เป้าหมายคือ oauth2callback.deepseek.com และ dev.deepseek.com

การรัน SQL ผ่านเส้นทาง `/play`

พอร์ตที่พบเชื่อมไปยัง ฐานข้อมูล ClickHouse ที่เข้าถึงได้โดยไม่ต้องยืนยันตัวตน
ClickHouse เป็นระบบจัดการฐานข้อมูลแบบคอลัมน์โอเพนซอร์สที่ออกแบบมาเพื่อการคิวรีเชิงวิเคราะห์ที่รวดเร็วบนชุดข้อมูลขนาดใหญ่
- พัฒนาโดย Yandex
- ใช้กันอย่างแพร่หลายในการประมวลผลข้อมูลแบบเรียลไทม์ การจัดเก็บล็อก และการวิเคราะห์บิ๊กดาต้า
ในอินเทอร์เฟซ HTTP ของ ClickHouse สามารถใช้เส้นทาง /play เพื่อรัน คำสั่ง SQL ใดก็ได้ โดยตรงจากเบราว์เซอร์
คิวรี SHOW TABLES; ส่งคืนรายชื่อชุดข้อมูลที่เข้าถึงได้ และในนั้นตาราง log_stream มีล็อกที่อ่อนไหวเป็นพิเศษ

ล็อกอ่อนไหวที่อยู่ใน `log_stream`

ตาราง log_stream มีรายการล็อกมากกว่า 1 ล้านรายการ
คอลัมน์หลักและข้อมูลที่ถูกเปิดเผยมีดังนี้
- timestamp: ล็อกตั้งแต่ วันที่ 6 มกราคม 2025
- span_name: อ้างอิงถึงเอนด์พอยต์ API ภายในต่าง ๆ ของ DeepSeek
- string.values: ล็อกข้อความล้วนที่มีประวัติแชต, API Keys, รายละเอียดแบ็กเอนด์ และเมทาดาทาด้านปฏิบัติการ
- _service: ระบุบริการของ DeepSeek ที่สร้างล็อก
- _source: เปิดเผยแหล่งที่มาของคำขอล็อก และมีประวัติแชต, API Keys, โครงสร้างไดเรกทอรี และล็อกเมทาดาทาของแชตบอต
ระดับการเข้าถึงเช่นนี้อาจก่อให้เกิดความเสี่ยงร้ายแรงต่อความปลอดภัยของ DeepSeek เองและผู้ใช้ปลายทาง
ผู้โจมตีสามารถดึงล็อกอ่อนไหวและข้อความแชตจริงแบบข้อความล้วนออกไปได้ และขึ้นอยู่กับการตั้งค่า ClickHouse ยังอาจใช้คิวรีอย่าง SELECT * FROM file('filename') เพื่อรั่วไหลรหัสผ่านข้อความล้วน ไฟล์ในเครื่อง และข้อมูลกรรมสิทธิ์จากเซิร์ฟเวอร์โดยตรงได้
Wiz Research ไม่ได้รัน คิวรีเชิงรุกที่เกินกว่าการไล่รายการ เพื่อรักษาแนวปฏิบัติด้านการวิจัยที่มีจริยธรรม

ความเร็วในการนำ AI มาใช้และความเสี่ยงด้านความปลอดภัยโครงสร้างพื้นฐาน

ความเสี่ยงด้านความปลอดภัยเฉพาะหน้าของแอปพลิเคชัน AI อาจเกิดจาก โครงสร้างพื้นฐานและเครื่องมือ ที่รองรับมัน มากกว่าจากตัวโมเดลเอง
แม้การถกเถียงเรื่องความปลอดภัย AI จะมุ่งไปที่ภัยคุกคามในอนาคต แต่ความเสี่ยงด้านความปลอดภัยพื้นฐาน เช่น การเปิดฐานข้อมูลออกสู่ภายนอกโดยไม่ตั้งใจ ยังคงต้องเป็นภารกิจลำดับต้นของทีมความปลอดภัย
เมื่อองค์กรนำเครื่องมือและบริการ AI จากสตาร์ทอัพและผู้ให้บริการหลากหลายรายมาใช้อย่างรวดเร็ว กรณีที่ฝากข้อมูลอ่อนไหวไว้กับบริษัทเหล่านี้ก็เพิ่มขึ้น
ความเร็วในการนำมาใช้อาจทำให้มองข้ามความปลอดภัยได้ ดังนั้นการปกป้องข้อมูลลูกค้าต้องเป็นสิ่งสำคัญลำดับแรก
ทีมความปลอดภัยต้องทำงานใกล้ชิดกับวิศวกร AI เพื่อให้มี การมองเห็น สถาปัตยกรรม เครื่องมือ และโมเดลที่ใช้งานอยู่ จึงจะป้องกันการรั่วไหลของข้อมูลได้
บริษัท AI กำลังเติบโตอย่างรวดเร็วเป็นผู้ให้บริการโครงสร้างพื้นฐานสำคัญโดยไม่มีเฟรมเวิร์กความปลอดภัยที่โดยปกติมักมาพร้อมกับการนำไปใช้อย่างกว้างขวาง จึงจำเป็นต้องมีแนวปฏิบัติด้านความปลอดภัยที่เหมาะกับความเสี่ยงในการจัดการข้อมูลอ่อนไหว

ข้อมูลละเอียดอ่อนรั่วไหล ฐานข้อมูล DeepSeek ที่มีประวัติแชตถูกเปิดเผย

ฐานข้อมูล DeepSeek ClickHouse ที่เปิดโดยไม่ต้องยืนยันตัวตน

การสำรวจพื้นผิวการโจมตีภายนอกและจุดที่ถูกเปิดเผย

การรัน SQL ผ่านเส้นทาง /play

ล็อกอ่อนไหวที่อยู่ใน log_stream

ความเร็วในการนำ AI มาใช้และความเสี่ยงด้านความปลอดภัยโครงสร้างพื้นฐาน

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น

การรัน SQL ผ่านเส้นทาง `/play`

ล็อกอ่อนไหวที่อยู่ใน `log_stream`