Miller - เครื่องมือ CLI สำหรับประมวลผลข้อมูล CSV/JSON

xguru · 2021-08-26T10:56:46+09:00

ประมวลผลข้อมูลแบบ named-index เช่น CSV, TSV, Tabular JSON → มีความสามารถแบบเดียวกับ awk, sed, cut, join, sort สำหรับข้อมูลคีย์-แวลู มีประโยชน์สำหรับการทำความสะอาดและย่อข้อมูล, การจัดทำสถิติ, DevOps, การดูแลระบบ, การประมวลผลไฟล์ล็อก, การแปลงฟอร์แมตไฟล์, งานหลังการ query ฐานข้อมูล ฯลฯ → เป็นตัวช่วยสำหรับการจัดการผลลัพธ์จาก R, Pandas, SQL Output เป็นต้น รองรับการสตรีมและทำงานร่วมกับ Unix Pipe ได้ดี ประมวลผลข้อมูลภายในด้วย Insertion-Ordered Hash Map โอเพนซอร์ส: ตอนแรกเขียนด้วย C และตั้งแต่เวอร์ชัน 6.0 เป็นต้นไปเปลี่ยนเป็น Go

(github.com)

19 คะแนน โดย xguru 2021-08-26 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

ประมวลผลข้อมูลแบบ named-index เช่น CSV, TSV, Tabular JSON

→ มีความสามารถแบบเดียวกับ awk, sed, cut, join, sort สำหรับข้อมูลคีย์-แวลู

มีประโยชน์สำหรับการทำความสะอาดและย่อข้อมูล, การจัดทำสถิติ, DevOps, การดูแลระบบ, การประมวลผลไฟล์ล็อก, การแปลงฟอร์แมตไฟล์, งานหลังการ query ฐานข้อมูล ฯลฯ

→ เป็นตัวช่วยสำหรับการจัดการผลลัพธ์จาก R, Pandas, SQL Output เป็นต้น

รองรับการสตรีมและทำงานร่วมกับ Unix Pipe ได้ดี
ประมวลผลข้อมูลภายในด้วย Insertion-Ordered Hash Map
โอเพนซอร์ส: ตอนแรกเขียนด้วย C และตั้งแต่เวอร์ชัน 6.0 เป็นต้นไปเปลี่ยนเป็น Go

2 ความคิดเห็น

lordmiss 2021-08-27

ไม่ได้มีโอกาสใช้บ่อยนัก แต่ถึงจะเปิดคู่กับคู่มือแล้วค่อยๆ ใช้ทีละนิด ก็ยังรู้สึกว่ามันดีกว่าเครื่องมือไหนๆ ที่เคยใช้มาจนถึงตอนนี้เลย!

toughrogrammer 2021-08-26

ดีเลยครับ เวลาต้องจัดการไฟล์ CSV ขนาดใหญ่แบบ ad hoc ก่อนหน้านี้แทบไม่มีเครื่องมือที่เหมาะนัก แต่ตัวนี้ก็ดูใช้งานง่ายดีครับ

Miller - เครื่องมือ CLI สำหรับประมวลผลข้อมูล CSV/JSON

บทความที่เกี่ยวข้อง

2 ความคิดเห็น