• ระหว่างการตรวจสอบพื้นผิวการโจมตีจากภายนอกของ DeepSeek พบ ฐานข้อมูล ClickHouse ที่เปิดโดยไม่ต้องยืนยันตัวตน และ DeepSeek ได้ปิดกั้นการเปิดเผยดังกล่าวทันทีหลังได้รับแจ้ง
  • จุดที่ถูกเปิดเผยคือ พอร์ต 8123 และ 9000 ของ oauth2callback.deepseek.com และ dev.deepseek.com ซึ่งทำให้ภายนอกสามารถควบคุมฐานข้อมูลทั้งหมดและเข้าถึงข้อมูลภายในได้
  • ตาราง log_stream มีล็อกมากกว่า 1 ล้านรายการ และมีประวัติแชตตั้งแต่วันที่ 6 มกราคม 2025, API Keys, รายละเอียดแบ็กเอนด์ และเมทาดาทาด้านปฏิบัติการในรูปแบบข้อความล้วน
  • สามารถรัน คำสั่ง SQL ใดก็ได้ จากเบราว์เซอร์ผ่านเส้นทาง /play ของอินเทอร์เฟซ HTTP ของ ClickHouse แต่ Wiz Research จำกัดขอบเขตการดูไว้เพียงระดับการไล่รายการตามแนวปฏิบัติด้านการวิจัยที่มีจริยธรรม
  • ในการนำบริการ AI มาใช้อย่างรวดเร็ว ความเสี่ยงเฉพาะหน้าไม่ได้เกิดจากตัวโมเดลเท่านั้น แต่ยังมาจากปัญหาความปลอดภัยโครงสร้างพื้นฐานพื้นฐาน เช่น การเปิดฐานข้อมูลออกสู่ภายนอกโดยไม่ตั้งใจ

ฐานข้อมูล DeepSeek ClickHouse ที่เปิดโดยไม่ต้องยืนยันตัวตน

  • Wiz Research ระบุพบ ฐานข้อมูล ClickHouse ที่เข้าถึงได้แบบสาธารณะ ซึ่งเป็นของ DeepSeek
  • ฐานข้อมูลดังกล่าวเข้าถึงได้โดยไม่ต้องยืนยันตัวตน และอยู่ในสภาพที่สามารถควบคุมการทำงานของฐานข้อมูลได้ทั้งหมด ไม่ใช่แค่ดูข้อมูลภายในเท่านั้น
  • ข้อมูลที่ถูกเปิดเผยมีทั้งประวัติแชต, API Keys, รายละเอียดแบ็กเอนด์, log streams และรายละเอียดด้านปฏิบัติการ
  • Wiz Research แจ้งปัญหาไปยัง DeepSeek ทันที และ DeepSeek ก็ปิดกั้นการเปิดเผยดังกล่าวอย่างรวดเร็ว

การสำรวจพื้นผิวการโจมตีภายนอกและจุดที่ถูกเปิดเผย

  • DeepSeek เป็นสตาร์ทอัพ AI จากจีน ซึ่งเพิ่งได้รับความสนใจอย่างมากจากโมเดลให้เหตุผล DeepSeek-R1
    • DeepSeek-R1 เป็นที่รู้กันว่าสามารถแข่งขันด้านประสิทธิภาพกับระบบ AI ชั้นนำอย่าง o1 ของ OpenAI ได้
    • จุดเด่นหลักที่ถูกกล่าวถึงคือความคุ้มค่าด้านต้นทุนและประสิทธิภาพ
  • Wiz Research สำรวจโดเมนสาธารณะเพื่อประเมิน พื้นผิวการโจมตีภายนอก ของ DeepSeek
  • จากการค้นหาซับโดเมนทั้งแบบพาสซีฟและแอ็กทีฟ พบซับโดเมนที่เปิดสู่อินเทอร์เน็ตราว 30 รายการ
    • ส่วนใหญ่เป็นรายการที่ในตอนแรกดูไม่ใช่การเปิดเผยความเสี่ยงสูง เช่น อินเทอร์เฟซแชตบอต หน้าสถานะ และเอกสาร API
  • เมื่อตรวจสอบนอกเหนือจากพอร์ต HTTP มาตรฐาน 80/443 พบว่า พอร์ต 8123 และ 9000 เปิดอยู่
    • โฮสต์เป้าหมายคือ oauth2callback.deepseek.com และ dev.deepseek.com

การรัน SQL ผ่านเส้นทาง /play

  • พอร์ตที่พบเชื่อมไปยัง ฐานข้อมูล ClickHouse ที่เข้าถึงได้โดยไม่ต้องยืนยันตัวตน
  • ClickHouse เป็นระบบจัดการฐานข้อมูลแบบคอลัมน์โอเพนซอร์สที่ออกแบบมาเพื่อการคิวรีเชิงวิเคราะห์ที่รวดเร็วบนชุดข้อมูลขนาดใหญ่
    • พัฒนาโดย Yandex
    • ใช้กันอย่างแพร่หลายในการประมวลผลข้อมูลแบบเรียลไทม์ การจัดเก็บล็อก และการวิเคราะห์บิ๊กดาต้า
  • ในอินเทอร์เฟซ HTTP ของ ClickHouse สามารถใช้เส้นทาง /play เพื่อรัน คำสั่ง SQL ใดก็ได้ โดยตรงจากเบราว์เซอร์
  • คิวรี SHOW TABLES; ส่งคืนรายชื่อชุดข้อมูลที่เข้าถึงได้ และในนั้นตาราง log_stream มีล็อกที่อ่อนไหวเป็นพิเศษ

ล็อกอ่อนไหวที่อยู่ใน log_stream

  • ตาราง log_stream มีรายการล็อกมากกว่า 1 ล้านรายการ
  • คอลัมน์หลักและข้อมูลที่ถูกเปิดเผยมีดังนี้
    • timestamp: ล็อกตั้งแต่ วันที่ 6 มกราคม 2025
    • span_name: อ้างอิงถึงเอนด์พอยต์ API ภายในต่าง ๆ ของ DeepSeek
    • string.values: ล็อกข้อความล้วนที่มีประวัติแชต, API Keys, รายละเอียดแบ็กเอนด์ และเมทาดาทาด้านปฏิบัติการ
    • _service: ระบุบริการของ DeepSeek ที่สร้างล็อก
    • _source: เปิดเผยแหล่งที่มาของคำขอล็อก และมีประวัติแชต, API Keys, โครงสร้างไดเรกทอรี และล็อกเมทาดาทาของแชตบอต
  • ระดับการเข้าถึงเช่นนี้อาจก่อให้เกิดความเสี่ยงร้ายแรงต่อความปลอดภัยของ DeepSeek เองและผู้ใช้ปลายทาง
  • ผู้โจมตีสามารถดึงล็อกอ่อนไหวและข้อความแชตจริงแบบข้อความล้วนออกไปได้ และขึ้นอยู่กับการตั้งค่า ClickHouse ยังอาจใช้คิวรีอย่าง SELECT * FROM file('filename') เพื่อรั่วไหลรหัสผ่านข้อความล้วน ไฟล์ในเครื่อง และข้อมูลกรรมสิทธิ์จากเซิร์ฟเวอร์โดยตรงได้
  • Wiz Research ไม่ได้รัน คิวรีเชิงรุกที่เกินกว่าการไล่รายการ เพื่อรักษาแนวปฏิบัติด้านการวิจัยที่มีจริยธรรม

ความเร็วในการนำ AI มาใช้และความเสี่ยงด้านความปลอดภัยโครงสร้างพื้นฐาน

  • ความเสี่ยงด้านความปลอดภัยเฉพาะหน้าของแอปพลิเคชัน AI อาจเกิดจาก โครงสร้างพื้นฐานและเครื่องมือ ที่รองรับมัน มากกว่าจากตัวโมเดลเอง
  • แม้การถกเถียงเรื่องความปลอดภัย AI จะมุ่งไปที่ภัยคุกคามในอนาคต แต่ความเสี่ยงด้านความปลอดภัยพื้นฐาน เช่น การเปิดฐานข้อมูลออกสู่ภายนอกโดยไม่ตั้งใจ ยังคงต้องเป็นภารกิจลำดับต้นของทีมความปลอดภัย
  • เมื่อองค์กรนำเครื่องมือและบริการ AI จากสตาร์ทอัพและผู้ให้บริการหลากหลายรายมาใช้อย่างรวดเร็ว กรณีที่ฝากข้อมูลอ่อนไหวไว้กับบริษัทเหล่านี้ก็เพิ่มขึ้น
  • ความเร็วในการนำมาใช้อาจทำให้มองข้ามความปลอดภัยได้ ดังนั้นการปกป้องข้อมูลลูกค้าต้องเป็นสิ่งสำคัญลำดับแรก
  • ทีมความปลอดภัยต้องทำงานใกล้ชิดกับวิศวกร AI เพื่อให้มี การมองเห็น สถาปัตยกรรม เครื่องมือ และโมเดลที่ใช้งานอยู่ จึงจะป้องกันการรั่วไหลของข้อมูลได้
  • บริษัท AI กำลังเติบโตอย่างรวดเร็วเป็นผู้ให้บริการโครงสร้างพื้นฐานสำคัญโดยไม่มีเฟรมเวิร์กความปลอดภัยที่โดยปกติมักมาพร้อมกับการนำไปใช้อย่างกว้างขวาง จึงจำเป็นต้องมีแนวปฏิบัติด้านความปลอดภัยที่เหมาะกับความเสี่ยงในการจัดการข้อมูลอ่อนไหว

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น