- ประมวลผลข้อมูลแบบ named-index เช่น CSV, TSV, Tabular JSON
→ มีความสามารถแบบเดียวกับ awk, sed, cut, join, sort สำหรับข้อมูลคีย์-แวลู
- มีประโยชน์สำหรับการทำความสะอาดและย่อข้อมูล, การจัดทำสถิติ, DevOps, การดูแลระบบ, การประมวลผลไฟล์ล็อก, การแปลงฟอร์แมตไฟล์, งานหลังการ query ฐานข้อมูล ฯลฯ
→ เป็นตัวช่วยสำหรับการจัดการผลลัพธ์จาก R, Pandas, SQL Output เป็นต้น
-
รองรับการสตรีมและทำงานร่วมกับ Unix Pipe ได้ดี
-
ประมวลผลข้อมูลภายในด้วย Insertion-Ordered Hash Map
-
โอเพนซอร์ส: ตอนแรกเขียนด้วย C และตั้งแต่เวอร์ชัน 6.0 เป็นต้นไปเปลี่ยนเป็น Go
2 ความคิดเห็น
ไม่ได้มีโอกาสใช้บ่อยนัก แต่ถึงจะเปิดคู่กับคู่มือแล้วค่อยๆ ใช้ทีละนิด ก็ยังรู้สึกว่ามันดีกว่าเครื่องมือไหนๆ ที่เคยใช้มาจนถึงตอนนี้เลย!
ดีเลยครับ เวลาต้องจัดการไฟล์ CSV ขนาดใหญ่แบบ ad hoc ก่อนหน้านี้แทบไม่มีเครื่องมือที่เหมาะนัก แต่ตัวนี้ก็ดูใช้งานง่ายดีครับ