- ไลบรารีเทนเซอร์ประสิทธิภาพสูงและเฟรมเวิร์กดีปเลิร์นนิง สำหรับการคำนวณเชิงตัวเลข การอนุมานโมเดล และการเทรนที่พัฒนาบน Rust
- คงประสิทธิภาพการปรับแต่งระดับเฟรมเวิร์กกราฟแบบสแตติก พร้อมกับมี ความยืดหยุ่นแบบไดนามิก
- รองรับหลายแบ็กเอนด์ทั้ง GPU/CPU
- GPU: CUDA, ROCm, Metal, Vulkan, WebGPU, LibTorch, Candle เป็นต้น
- CPU: อิงตาม CubeCL, NdArray, Candle, LibTorch
- สามารถทำงานได้ในสภาพแวดล้อม Wasm และ no_std
- ออกแบบโดยมี Backend trait เป็นศูนย์กลาง ทำให้เป็น โครงสร้างแบ็กเอนด์แบบสลับเปลี่ยนได้ สำหรับฮาร์ดแวร์และรันไทม์ที่หลากหลาย
- ตัวตกแต่งแบ็กเอนด์ Autodiff: เพิ่มความสามารถด้านการดิฟเฟอเรนชิเอชันอัตโนมัติให้กับทุกแบ็กเอนด์
- ตัวตกแต่งแบ็กเอนด์ Fusion: ความสามารถในการฟิวชันเคอร์เนล
- Router backend: รองรับ การกระจายงานคำนวณระหว่างฮาร์ดแวร์หลายชนิด เช่น CPU และ GPU
- Remote backend: สามารถทำ การคำนวณแบบกระจายและการรันระยะไกล ผ่านเครือข่าย
- รองรับแบบบูรณาการตลอดกระบวนการเทรนและอนุมาน
- มอนิเตอร์การเทรนแบบเรียลไทม์ด้วยแดชบอร์ดเทอร์มินัลที่อิง Ratatui
- ดีพลอยด้วยโค้ดชุดเดียวได้ตั้งแต่อุปกรณ์ฝังตัวไปจนถึงคลัสเตอร์ GPU ขนาดใหญ่
- รองรับการนำเข้าโมเดลจาก PyTorch, Safetensors, ONNX เพื่อใช้โมเดลเดิมต่อได้
- การอนุมานบนเบราว์เซอร์ด้วย WebAssembly และ WebGPU
- รองรับสภาพแวดล้อม no_std ทำให้ รันได้แม้บนอุปกรณ์ฝังตัวที่ไม่มีระบบปฏิบัติการ
- เผยแพร่ภายใต้สัญญาอนุญาตแบบคู่ MIT/Apache 2.0
2 ความคิดเห็น
สงสัยว่าประสิทธิภาพเมื่อเทียบกับ PyTorch เป็นอย่างไรบ้าง
Rust, Wasm, WebGPU เป็นชื่อที่น่ายินดีจริง ๆ ครับ