- อ็อบเจ็กต์สตอเรจขนาดใหญ่ตัวแรกบนคลาวด์ที่ รองรับเวกเตอร์แบบเนทีฟ
- สามารถลดค่าใช้จ่ายในการจัดเก็บ อัปโหลด และคิวรีข้อมูลเวกเตอร์ได้ สูงสุด 90% พร้อมให้ ประสิทธิภาพการคิวรีระดับ subsecond
- นำแนวคิด vector bucket และ vector index มาใช้ เพื่อเพิ่มประสิทธิภาพการจัดเก็บและค้นคืนข้อมูลเวกเตอร์ขนาดใหญ่สำหรับเวิร์กโหลด generative AI เช่น AI embedding และ RAG
- ผสานรวมกับบริการ AWS อย่าง Amazon Bedrock, SageMaker, OpenSearch เพื่อการจัดการเวกเตอร์และการค้นหาแบบเรียลไทม์ที่สมดุลทั้งด้านต้นทุนและประสิทธิภาพ
- รองรับการใช้งานได้หลากหลาย ตั้งแต่การจัดเก็บ จัดการ คิวรี ส่งออก และผสานรวมข้อมูลเวกเตอร์ ผ่านคอนโซล, CLI, SDK และ API ได้อย่างง่ายดายโดยไม่ต้องตั้งค่าโครงสร้างพื้นฐานเอง
Amazon S3 Vectors คืออะไร?
- Amazon S3 Vectors คือสตอเรจเฉพาะทางใหม่ของ S3 สำหรับจัดเก็บชุดข้อมูลเวกเตอร์ขนาดใหญ่ และให้การค้นหาเวกเตอร์อย่างรวดเร็ว (semantic/similarity search)
- ออกแบบมาเพื่อให้จัดการข้อมูลเวกเตอร์ (embedding) ที่ใช้บ่อยในงาน generative AI ได้อย่างมีประสิทธิภาพ
- มี S3 bucket ประเภทใหม่ชื่อ vector bucket โดยแต่ละ vector bucket สามารถสร้าง vector index ได้สูงสุด 10,000 รายการ และแต่ละดัชนีสามารถจัดเก็บเวกเตอร์ได้หลายสิบล้านรายการ
- รองรับการกำหนด metadata (key-value) ให้แต่ละเวกเตอร์ เพื่อใช้คิวรีแบบกรองตามเงื่อนไขได้
ความสามารถด้านการเพิ่มประสิทธิภาพต้นทุนและสมรรถนะ พร้อมระบบอัตโนมัติ
- สามารถลดค่าใช้จ่ายในการอัปโหลด จัดเก็บ และคิวรีข้อมูลเวกเตอร์ได้ สูงสุด 90%
- แม้ข้อมูลจะมีขนาดใหญ่ขึ้น S3 Vectors จะปรับแต่งให้เหมาะสมโดยอัตโนมัติ เพื่อรักษาสมดุลด้านต้นทุนและประสิทธิภาพอย่างต่อเนื่อง
- รองรับ distance metric แบบ Cosine/Euclidean เพื่อมอบสภาพแวดล้อมการค้นหาที่ยืดหยุ่นและเข้ากันได้กับโมเดล AI embedding
การผสานรวมกับบริการ AWS และโครงสร้างพื้นฐาน AI
- ผสานรวมแบบเนทีฟกับ Amazon Bedrock Knowledge Bases และใช้งานได้โดยตรงใน SageMaker Unified Studio
- เชื่อมต่อกับ OpenSearch Service ได้ โดยสามารถเก็บข้อมูลระยะยาวหรือเข้าถึงไม่บ่อยไว้ใน S3 และย้ายงานค้นหาแบบความถี่สูง/เรียลไทม์ไปยัง OpenSearch ได้ (serverless vector collection)
- เหมาะกับงาน AI หลากหลายรูปแบบ เช่น ระบบแนะนำ, RAG, การวิเคราะห์เอกสาร และคำแนะนำแบบเฉพาะบุคคล
วิธีใช้งานหลัก
การสร้าง vector bucket และ index
- สร้าง vector bucket จากเมนู Vector buckets ในคอนโซล
- ระบุออปชันการเข้ารหัสได้ตอนสร้าง bucket (SSE-S3, SSE-KMS)
- เพิ่ม vector index ให้แต่ละ bucket พร้อมกำหนดจำนวนมิติและ distance metric ของแต่ละดัชนี
การแทรกและคิวรีข้อมูลเวกเตอร์
- ใช้ AWS CLI, SDK, REST API เพื่อแทรกและจัดการเวกเตอร์
- สร้าง text embedding จาก Amazon Bedrock → แล้วแทรกเวกเตอร์เข้าไปใน S3 Vectors
- ตัวอย่าง: สร้าง embedding ด้วย
boto3 แล้วอัปโหลดข้อมูลเข้าดัชนีผ่าน API s3vectors.put_vectors
- ใช้ metadata เพื่อคิวรีตามเงื่อนไข เช่น แนวหรือหมวดหมู่ได้
การเชื่อมต่อกับ OpenSearch และการส่งออก
- ใช้ Export to OpenSearch ในคอนโซลเพื่อย้าย S3 Vector index ไปยัง OpenSearch
- สร้าง serverless collection อัตโนมัติ และขยายต่อไปสู่งานค้นหาเวกเตอร์และวิเคราะห์แบบเรียลไทม์ได้
คุณสมบัติหลักและสภาพแวดล้อมที่รองรับ
- S3 Vector bucket ใช้ การเข้ารหัสเป็นค่าเริ่มต้น (SSE-S3) และรองรับตัวเลือก KMS เพิ่มเติม
- รองรับการทำงานอัตโนมัติ/เชิงโปรแกรมผ่าน CLI/SDK/REST API
- รีเจียนที่รองรับในพรีวิวปัจจุบัน: สหรัฐฯ ฝั่งตะวันออก/ตะวันตก, ยุโรป (แฟรงก์เฟิร์ต), เอเชีย (ซิดนีย์)
การผสานรวมและกรณีการใช้งาน
- รองรับกรณีใช้งานเวกเตอร์ในหลากหลายอุตสาหกรรม เช่น RAG, agent memory, similarity/semantic search, การวิเคราะห์เอกสารอัจฉริยะ, คำแนะนำแบบเฉพาะบุคคล, การวิเคราะห์คอนเทนต์อัตโนมัติ เป็นต้น
- ผสานรวมกับระบบนิเวศ AWS อย่าง OpenSearch, SageMaker, Bedrock เพื่อสร้าง โซลูชัน AI แบบอิงเวกเตอร์ที่คุ้มค่าและขยายสเกลได้ในระดับใหญ่
เอกสารอ้างอิงและข้อมูลเพิ่มเติม
ยังไม่มีความคิดเห็น