- มุ่งเป็นเฟรมเวิร์กที่รวมการประมวลผลสตรีม / การประมวลผลแบบแบตช์ / เวิร์กโหลดการคำนวณประสิทธิภาพสูง (AI) ไว้ในที่เดียว
- ปัจจุบันมีโซลูชันที่ใช้แทน Spark SQL และ Spark DataFrame API ได้แบบ Drop-in (เข้ากันได้)
- ทำงานได้ทั้งบนเครื่องเดียวหรือในการตั้งค่าแบบกระจาย
- อ้างอิงจากเบนช์มาร์ก TPC-H เร็วกว่า Spark 4 เท่า ลดต้นทุนฮาร์ดแวร์ได้ 94% และไม่ต้องแก้โค้ด
- ใช้งานได้ในรูปแบบแพ็กเกจ Python
pip install "pysail==0.2.0.dev0"
- สแตกเทคโนโลยี
- เอนจินที่พัฒนาด้วย Rust สร้างบน Apache Arrow และ Apache DataFusion
- ใช้โปรโตคอล Spark Connect เพื่อให้ Spark session สื่อสารกับเซิร์ฟเวอร์ Sail
ยังไม่มีความคิดเห็น