• อ็อบเจ็กต์สตอเรจขนาดใหญ่ตัวแรกบนคลาวด์ที่ รองรับเวกเตอร์แบบเนทีฟ
  • สามารถลดค่าใช้จ่ายในการจัดเก็บ อัปโหลด และคิวรีข้อมูลเวกเตอร์ได้ สูงสุด 90% พร้อมให้ ประสิทธิภาพการคิวรีระดับ subsecond
  • นำแนวคิด vector bucket และ vector index มาใช้ เพื่อเพิ่มประสิทธิภาพการจัดเก็บและค้นคืนข้อมูลเวกเตอร์ขนาดใหญ่สำหรับเวิร์กโหลด generative AI เช่น AI embedding และ RAG
  • ผสานรวมกับบริการ AWS อย่าง Amazon Bedrock, SageMaker, OpenSearch เพื่อการจัดการเวกเตอร์และการค้นหาแบบเรียลไทม์ที่สมดุลทั้งด้านต้นทุนและประสิทธิภาพ
  • รองรับการใช้งานได้หลากหลาย ตั้งแต่การจัดเก็บ จัดการ คิวรี ส่งออก และผสานรวมข้อมูลเวกเตอร์ ผ่านคอนโซล, CLI, SDK และ API ได้อย่างง่ายดายโดยไม่ต้องตั้งค่าโครงสร้างพื้นฐานเอง

Amazon S3 Vectors คืออะไร?

  • Amazon S3 Vectors คือสตอเรจเฉพาะทางใหม่ของ S3 สำหรับจัดเก็บชุดข้อมูลเวกเตอร์ขนาดใหญ่ และให้การค้นหาเวกเตอร์อย่างรวดเร็ว (semantic/similarity search)
  • ออกแบบมาเพื่อให้จัดการข้อมูลเวกเตอร์ (embedding) ที่ใช้บ่อยในงาน generative AI ได้อย่างมีประสิทธิภาพ
  • มี S3 bucket ประเภทใหม่ชื่อ vector bucket โดยแต่ละ vector bucket สามารถสร้าง vector index ได้สูงสุด 10,000 รายการ และแต่ละดัชนีสามารถจัดเก็บเวกเตอร์ได้หลายสิบล้านรายการ
  • รองรับการกำหนด metadata (key-value) ให้แต่ละเวกเตอร์ เพื่อใช้คิวรีแบบกรองตามเงื่อนไขได้

ความสามารถด้านการเพิ่มประสิทธิภาพต้นทุนและสมรรถนะ พร้อมระบบอัตโนมัติ

  • สามารถลดค่าใช้จ่ายในการอัปโหลด จัดเก็บ และคิวรีข้อมูลเวกเตอร์ได้ สูงสุด 90%
  • แม้ข้อมูลจะมีขนาดใหญ่ขึ้น S3 Vectors จะปรับแต่งให้เหมาะสมโดยอัตโนมัติ เพื่อรักษาสมดุลด้านต้นทุนและประสิทธิภาพอย่างต่อเนื่อง
  • รองรับ distance metric แบบ Cosine/Euclidean เพื่อมอบสภาพแวดล้อมการค้นหาที่ยืดหยุ่นและเข้ากันได้กับโมเดล AI embedding

การผสานรวมกับบริการ AWS และโครงสร้างพื้นฐาน AI

  • ผสานรวมแบบเนทีฟกับ Amazon Bedrock Knowledge Bases และใช้งานได้โดยตรงใน SageMaker Unified Studio
  • เชื่อมต่อกับ OpenSearch Service ได้ โดยสามารถเก็บข้อมูลระยะยาวหรือเข้าถึงไม่บ่อยไว้ใน S3 และย้ายงานค้นหาแบบความถี่สูง/เรียลไทม์ไปยัง OpenSearch ได้ (serverless vector collection)
  • เหมาะกับงาน AI หลากหลายรูปแบบ เช่น ระบบแนะนำ, RAG, การวิเคราะห์เอกสาร และคำแนะนำแบบเฉพาะบุคคล

วิธีใช้งานหลัก

การสร้าง vector bucket และ index

  • สร้าง vector bucket จากเมนู Vector buckets ในคอนโซล
  • ระบุออปชันการเข้ารหัสได้ตอนสร้าง bucket (SSE-S3, SSE-KMS)
  • เพิ่ม vector index ให้แต่ละ bucket พร้อมกำหนดจำนวนมิติและ distance metric ของแต่ละดัชนี

การแทรกและคิวรีข้อมูลเวกเตอร์

  • ใช้ AWS CLI, SDK, REST API เพื่อแทรกและจัดการเวกเตอร์
  • สร้าง text embedding จาก Amazon Bedrock → แล้วแทรกเวกเตอร์เข้าไปใน S3 Vectors
  • ตัวอย่าง: สร้าง embedding ด้วย boto3 แล้วอัปโหลดข้อมูลเข้าดัชนีผ่าน API s3vectors.put_vectors
  • ใช้ metadata เพื่อคิวรีตามเงื่อนไข เช่น แนวหรือหมวดหมู่ได้

การเชื่อมต่อกับ OpenSearch และการส่งออก

  • ใช้ Export to OpenSearch ในคอนโซลเพื่อย้าย S3 Vector index ไปยัง OpenSearch
  • สร้าง serverless collection อัตโนมัติ และขยายต่อไปสู่งานค้นหาเวกเตอร์และวิเคราะห์แบบเรียลไทม์ได้

คุณสมบัติหลักและสภาพแวดล้อมที่รองรับ

  • S3 Vector bucket ใช้ การเข้ารหัสเป็นค่าเริ่มต้น (SSE-S3) และรองรับตัวเลือก KMS เพิ่มเติม
  • รองรับการทำงานอัตโนมัติ/เชิงโปรแกรมผ่าน CLI/SDK/REST API
  • รีเจียนที่รองรับในพรีวิวปัจจุบัน: สหรัฐฯ ฝั่งตะวันออก/ตะวันตก, ยุโรป (แฟรงก์เฟิร์ต), เอเชีย (ซิดนีย์)

การผสานรวมและกรณีการใช้งาน

  • รองรับกรณีใช้งานเวกเตอร์ในหลากหลายอุตสาหกรรม เช่น RAG, agent memory, similarity/semantic search, การวิเคราะห์เอกสารอัจฉริยะ, คำแนะนำแบบเฉพาะบุคคล, การวิเคราะห์คอนเทนต์อัตโนมัติ เป็นต้น
  • ผสานรวมกับระบบนิเวศ AWS อย่าง OpenSearch, SageMaker, Bedrock เพื่อสร้าง โซลูชัน AI แบบอิงเวกเตอร์ที่คุ้มค่าและขยายสเกลได้ในระดับใหญ่

เอกสารอ้างอิงและข้อมูลเพิ่มเติม

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น