warc-parquet - CLI สำหรับแปลง WARC เป็น Parquet (github.com/maxcountryman) 8 คะแนน โดย xguru 2022-06-30 | 1 ความคิดเห็น | แชร์ทาง WhatsApp แปลงไฟล์ Web ARChive (.warc) เป็นฟอร์แมต Apache Parquet แบบคอลัมน์ สามารถโหลด Parquet เข้า DuckDB เพื่อคิวรีได้อย่างสะดวก โอเพนซอร์สที่พัฒนาด้วย Rust บทความที่เกี่ยวข้อง WarcDB - ข้อมูลเว็บครอลในรูปแบบฐานข้อมูล SQLite 14 คะแนน · 0 ความคิดเห็น · 2022-06-22 Carquet - ไลบรารี C ล้วนประสิทธิภาพสูงสำหรับอ่านและเขียนไฟล์ Parquet 9 คะแนน · 0 ความคิดเห็น · 2026-01-17 dir2md v1.0.4 — CLI สำหรับแปลงโค้ดเบสโอเพนซอร์สเป็น Markdown ที่เป็นมิตรกับ LLM อัปเดตครั้งใหญ่ 8 คะแนน · 0 ความคิดเห็น · 2025-10-10 Broot - เครื่องมือ CLI ใหม่สำหรับนำทางต้นไม้ไดเรกทอรีที่ซับซ้อน 7 คะแนน · 3 ความคิดเห็น · 2020-01-10 DuckLake - ฟอร์แมตดาต้าเลกและแค็ตตาล็อกแบบรวมศูนย์ 13 คะแนน · 1 ความคิดเห็น · 2025-05-29 1 ความคิดเห็น xguru 2022-06-30 DuckDB - โอเพนซอร์ส Embedded OLAP DB ดูคล้ายกับ WarcDB - Web crawl data as SQLite DB ที่เพิ่งโพสต์ไปเมื่อไม่นานนี้นะครับ แต่ในที่ที่มีอินฟราสตรักเจอร์ที่ใช้ Parquet อยู่แล้ว ก็น่าจะใช้งานได้สะดวกกว่า
1 ความคิดเห็น
DuckDB - โอเพนซอร์ส Embedded OLAP DB
ดูคล้ายกับ WarcDB - Web crawl data as SQLite DB ที่เพิ่งโพสต์ไปเมื่อไม่นานนี้นะครับ
แต่ในที่ที่มีอินฟราสตรักเจอร์ที่ใช้ Parquet อยู่แล้ว ก็น่าจะใช้งานได้สะดวกกว่า