1 คะแนน โดย GN⁺ 2024-12-22 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • แนะนำ S2

    • S2 คือที่เก็บข้อมูลสตรีมมิงสำหรับยุคคลาวด์ และเป็นโซลูชันเพื่อเสริมให้แกนกลางของระบบข้อมูลแข็งแกร่งขึ้น
    • มีเป้าหมายเพื่อยกระดับประสบการณ์ serverless ของ object storage ให้เหมาะกับข้อมูลสตรีมมิง
    • S2 มองว่าสตรีมเป็นองค์ประกอบพื้นฐานของคลาวด์สตอเรจ
  • ถ้าสตรีมมีความสำคัญเหนือวัตถุ?

    • object storage เหมาะกับข้อมูลที่คงที่ ในขณะที่ stream storage ถูกออกแบบมาเพื่อรองรับความต้องการของข้อมูลที่มีการเคลื่อนไหว
    • S2 ประมวลผลข้อมูลตามหน่วยการเขียน และยังสามารถรับการเขียนพร้อมกันจากผู้เขียนหลายรายได้ โดยประมวลผลทุกการเขียนตามลำดับ
    • แตกต่างจาก S3, S2 สามารถติดตามสตรีมได้แบบเรียลไทม์
  • Serverless – ค่าใช้จ่ายแบบไหน?

    • S2 สร้างบนพื้นฐานของความสามารถในการขยายตัวและความทนทานแบบไม่จำกัดของ object storage
    • ผู้ใช้สามารถปรับสมดุลระหว่าง latency และค่าใช้จ่ายได้ตามแต่ละสตรีม
    • มี Standard และ Express storage class สองแบบ โดยอ้างอิงจาก AWS S3 Standard และ S3 Express One Zone
    • storage class Express ให้ latency ที่คล้ายกับระบบ cloud streaming ที่อิงดิสก์
  • ขั้นตอนต่อไปของ S2

    • S2 สร้างบนโครงสร้างพื้นฐานคลาวด์ที่ผ่านการพิสูจน์แล้ว และมีการทดสอบด้วย Rust codebase
    • ขณะนี้มีการให้บริการ gRPC API, Rust SDK และ CLI และอยู่ระหว่างพัฒนา REST API
    • แผนในอนาคตคือรองรับความเข้ากันได้กับ Kafka protocol, multi-region, และการมุ่งเป้า latency ต่ำกว่า 5 มิลลิวินาที
    • S2 เป็นโซลูชันที่เหมาะสำหรับผู้ใช้งานที่ต้องการ cloud streaming โดยไม่จำกัดจำนวนสตรีมหรือปริมาณการประมวลผล

1 ความคิดเห็น

 
GN⁺ 2024-12-22
ความคิดเห็นบน Hacker News
  • การตั้งชื่อผลิตภัณฑ์ว่า S2 และอธิบายว่าเป็นเทคโนโลยีที่ปรับปรุง AWS S3 อาจก่อให้เกิดปัญหาลิขสิทธิ์เครื่องหมายการค้าของ Amazon
  • API สวยมากและอยากใช้ในโปรเจกต์ แต่ในรูปแบบปัจจุบันดูไม่เหมือนจะยั่งยืนในระยะยาว หากประสบความสำเร็จ AWS มีโอกาสสร้างเวอร์ชันที่ดีกว่าได้มาก
    • ถ้าปล่อยเป็นสินค้าสำหรับผู้ใช้ปลายทางแบบ Papertrail ก็จะมีความหมายมากกว่า
    • หากเพิ่มแบ็กเอนด์ที่เข้ากันได้กับ S3 ได้ จะกลายเป็นผลิตภัณฑ์ที่ไม่ผูกติดกับผู้ให้บริการคลาวด์ได้อย่างยอดเยี่ยม
  • ดูคล้ายกับ WarpStream แต่คาดว่าให้ API ระดับต่ำแทนความเข้ากันได้กับ Kafka
    • หากได้รับการยอมรับในระยะยาว API สตรีมมิ่งระดับ S3 จะมีคุณค่ามหาศาลมาก
  • AWS มีค่าบริการการส่งผ่านอินเทอร์เน็ต $0.09/GB แต่ที่นี่เรียกเก็บ $0.05/GB ทำไมกันนะ? และสงสัยว่ามีการเข้าถึงราคา private transfer ของ AWS หรือไม่
  • เทคโนโลยีดูดีมาก แต่เสียดายที่ไม่เปิดซอร์ส หากมีการรองรับการโฮสต์เองได้ครบวงจรด้วยลิขสิทธิ์อย่าง FSL ก็คงพิจารณาเป็นบริการเชิงพาณิชย์ได้
  • ดูเหมือนพวกเขาเลือกที่จะใช้เวลาทั้งชีวิตอธิบายว่ามันไม่ใช่ S3
  • อยากให้มีคนสร้างสิ่งที่ทำให้เหตุการณ์สตรีม query ได้ตามจุดเวลา
    • รูปแบบหรือเฟรมเวิร์กที่ทำให้ข้อมูลบางชนิดที่ query ได้ในหน่วยความจำอาจจะดีกว่าฐานข้อมูลตัวใดตัวหนึ่ง
  • ข้อเสนอคุณค่าเรื่องโมเดลบริการที่จดรับรู้การเขียนได้เฉพาะเมื่อเขียนลง S3 แล้วดูสับสน
    • AWS มีแนวโน้มจะสร้างบริการเข้ากันได้กับโปรโตคอล เช่น การ reimplement Kafka
  • อยากให้มี Java SDK มากกว่านี้ โดยเฉพาะเมื่อบริษัทส่วนใหญ่ใช้ Spring หรือ Kafka client ทำให้การทำ PoC แทบทำได้ยาก
  • รู้สึกว่ามีความทับซ้อนกับ AWS Kinesis Data Streams มากเกินไป การเกิดการแข่งขันกับ AWS ก็เป็นเรื่องดี