AWS เปิดตัวพรีวิว Amazon S3 Vectors

(aws.amazon.com)

11 คะแนน โดย GN⁺ 2025-07-21 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

อ็อบเจ็กต์สตอเรจขนาดใหญ่ตัวแรกบนคลาวด์ที่ รองรับเวกเตอร์แบบเนทีฟ
สามารถลดค่าใช้จ่ายในการจัดเก็บ อัปโหลด และคิวรีข้อมูลเวกเตอร์ได้ สูงสุด 90% พร้อมให้ ประสิทธิภาพการคิวรีระดับ subsecond
นำแนวคิด vector bucket และ vector index มาใช้ เพื่อเพิ่มประสิทธิภาพการจัดเก็บและค้นคืนข้อมูลเวกเตอร์ขนาดใหญ่สำหรับเวิร์กโหลด generative AI เช่น AI embedding และ RAG
ผสานรวมกับบริการ AWS อย่าง Amazon Bedrock, SageMaker, OpenSearch เพื่อการจัดการเวกเตอร์และการค้นหาแบบเรียลไทม์ที่สมดุลทั้งด้านต้นทุนและประสิทธิภาพ
รองรับการใช้งานได้หลากหลาย ตั้งแต่การจัดเก็บ จัดการ คิวรี ส่งออก และผสานรวมข้อมูลเวกเตอร์ ผ่านคอนโซล, CLI, SDK และ API ได้อย่างง่ายดายโดยไม่ต้องตั้งค่าโครงสร้างพื้นฐานเอง

Amazon S3 Vectors คืออะไร?

Amazon S3 Vectors คือสตอเรจเฉพาะทางใหม่ของ S3 สำหรับจัดเก็บชุดข้อมูลเวกเตอร์ขนาดใหญ่ และให้การค้นหาเวกเตอร์อย่างรวดเร็ว (semantic/similarity search)
ออกแบบมาเพื่อให้จัดการข้อมูลเวกเตอร์ (embedding) ที่ใช้บ่อยในงาน generative AI ได้อย่างมีประสิทธิภาพ
มี S3 bucket ประเภทใหม่ชื่อ vector bucket โดยแต่ละ vector bucket สามารถสร้าง vector index ได้สูงสุด 10,000 รายการ และแต่ละดัชนีสามารถจัดเก็บเวกเตอร์ได้หลายสิบล้านรายการ
รองรับการกำหนด metadata (key-value) ให้แต่ละเวกเตอร์ เพื่อใช้คิวรีแบบกรองตามเงื่อนไขได้

ความสามารถด้านการเพิ่มประสิทธิภาพต้นทุนและสมรรถนะ พร้อมระบบอัตโนมัติ

สามารถลดค่าใช้จ่ายในการอัปโหลด จัดเก็บ และคิวรีข้อมูลเวกเตอร์ได้ สูงสุด 90%
แม้ข้อมูลจะมีขนาดใหญ่ขึ้น S3 Vectors จะปรับแต่งให้เหมาะสมโดยอัตโนมัติ เพื่อรักษาสมดุลด้านต้นทุนและประสิทธิภาพอย่างต่อเนื่อง
รองรับ distance metric แบบ Cosine/Euclidean เพื่อมอบสภาพแวดล้อมการค้นหาที่ยืดหยุ่นและเข้ากันได้กับโมเดล AI embedding

การผสานรวมกับบริการ AWS และโครงสร้างพื้นฐาน AI

ผสานรวมแบบเนทีฟกับ Amazon Bedrock Knowledge Bases และใช้งานได้โดยตรงใน SageMaker Unified Studio
เชื่อมต่อกับ OpenSearch Service ได้ โดยสามารถเก็บข้อมูลระยะยาวหรือเข้าถึงไม่บ่อยไว้ใน S3 และย้ายงานค้นหาแบบความถี่สูง/เรียลไทม์ไปยัง OpenSearch ได้ (serverless vector collection)
เหมาะกับงาน AI หลากหลายรูปแบบ เช่น ระบบแนะนำ, RAG, การวิเคราะห์เอกสาร และคำแนะนำแบบเฉพาะบุคคล

วิธีใช้งานหลัก

การสร้าง vector bucket และ index

สร้าง vector bucket จากเมนู Vector buckets ในคอนโซล
ระบุออปชันการเข้ารหัสได้ตอนสร้าง bucket (SSE-S3, SSE-KMS)
เพิ่ม vector index ให้แต่ละ bucket พร้อมกำหนดจำนวนมิติและ distance metric ของแต่ละดัชนี

การแทรกและคิวรีข้อมูลเวกเตอร์

ใช้ AWS CLI, SDK, REST API เพื่อแทรกและจัดการเวกเตอร์
สร้าง text embedding จาก Amazon Bedrock → แล้วแทรกเวกเตอร์เข้าไปใน S3 Vectors
ตัวอย่าง: สร้าง embedding ด้วย boto3 แล้วอัปโหลดข้อมูลเข้าดัชนีผ่าน API s3vectors.put_vectors
ใช้ metadata เพื่อคิวรีตามเงื่อนไข เช่น แนวหรือหมวดหมู่ได้

การเชื่อมต่อกับ OpenSearch และการส่งออก

ใช้ Export to OpenSearch ในคอนโซลเพื่อย้าย S3 Vector index ไปยัง OpenSearch
สร้าง serverless collection อัตโนมัติ และขยายต่อไปสู่งานค้นหาเวกเตอร์และวิเคราะห์แบบเรียลไทม์ได้

คุณสมบัติหลักและสภาพแวดล้อมที่รองรับ

S3 Vector bucket ใช้ การเข้ารหัสเป็นค่าเริ่มต้น (SSE-S3) และรองรับตัวเลือก KMS เพิ่มเติม
รองรับการทำงานอัตโนมัติ/เชิงโปรแกรมผ่าน CLI/SDK/REST API
รีเจียนที่รองรับในพรีวิวปัจจุบัน: สหรัฐฯ ฝั่งตะวันออก/ตะวันตก, ยุโรป (แฟรงก์เฟิร์ต), เอเชีย (ซิดนีย์)

การผสานรวมและกรณีการใช้งาน

รองรับกรณีใช้งานเวกเตอร์ในหลากหลายอุตสาหกรรม เช่น RAG, agent memory, similarity/semantic search, การวิเคราะห์เอกสารอัจฉริยะ, คำแนะนำแบบเฉพาะบุคคล, การวิเคราะห์คอนเทนต์อัตโนมัติ เป็นต้น
ผสานรวมกับระบบนิเวศ AWS อย่าง OpenSearch, SageMaker, Bedrock เพื่อสร้าง โซลูชัน AI แบบอิงเวกเตอร์ที่คุ้มค่าและขยายสเกลได้ในระดับใหญ่

เอกสารอ้างอิงและข้อมูลเพิ่มเติม

คู่มือโดยละเอียด: S3 Vector Buckets User Guide
การใช้งาน CLI: S3 Vectors Embed CLI GitHub
การเชื่อมต่อ OpenSearch แบบเรียลไทม์: OpenSearch Serverless Collections Guide

AWS เปิดตัวพรีวิว Amazon S3 Vectors

Amazon S3 Vectors คืออะไร?

ความสามารถด้านการเพิ่มประสิทธิภาพต้นทุนและสมรรถนะ พร้อมระบบอัตโนมัติ

การผสานรวมกับบริการ AWS และโครงสร้างพื้นฐาน AI

วิธีใช้งานหลัก

การสร้าง vector bucket และ index

การแทรกและคิวรีข้อมูลเวกเตอร์

การเชื่อมต่อกับ OpenSearch และการส่งออก

คุณสมบัติหลักและสภาพแวดล้อมที่รองรับ

การผสานรวมและกรณีการใช้งาน

เอกสารอ้างอิงและข้อมูลเพิ่มเติม

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น