เทคโนโลยี Erasure Coding สำหรับระบบแบบกระจาย (transactional.blog) 1 คะแนน โดย GN⁺ 2024-08-28 | 1 ความคิดเห็น | แชร์ทาง WhatsApp บทความที่เกี่ยวข้อง พจนานุกรม CRDT: คู่มือเชิงปฏิบัติสำหรับโครงสร้างข้อมูลแบบกระจาย 25 คะแนน · 1 ความคิดเห็น · 2025-12-01 การออกแบบระบบที่ดี 96 คะแนน · 1 ความคิดเห็น · 2025-08-18 Rust สำหรับระบบไฟล์ 2 คะแนน · 1 ความคิดเห็น · 2024-07-16 ลดการใช้ Redis แบบทานอส 30 คะแนน · 4 ความคิดเห็น · 2023-10-10 Distributed systems vocabulary - ศัพท์เฉพาะของระบบกระจาย 4 คะแนน · 0 ความคิดเห็น · 2019-08-12 1 ความคิดเห็น GN⁺ 2024-08-28 ความคิดเห็นจาก Hacker News แปลกใจที่ไม่มีการกล่าวถึง rateless fountain codes Luby Transform Code น่าสนใจ LT codes ถูกใช้ในการเข้ารหัส RaptorQ ของ RFC6330 มีอัลกอริทึม network coding ที่เคยถูกเสนอไว้ในอดีต สามารถรับไฟล์ได้เร็วขึ้นผ่านหลายเส้นทาง Erasure coding เป็นเทคโนโลยีที่มีมานานแล้ว ควรนึกถึงไฟล์ PAR2 ของ Usenet ถ้าสนใจ Erasure coding ก็ควรพิจารณากรณีแบบหลายมิติ ควรคิดเรื่องการเข้ารหัสข้ามโดเมนความล้มเหลวหลายแบบ ไม่ใช่แค่ spindle แต่รวมถึง rack, ห้อง, data center, ภูมิภาค ฯลฯ สงสัยว่ามีใครเคยใช้ Wirehair ในโปรเจ็กต์บ้างหรือไม่ Wirehair มีประสิทธิภาพของอัลกอริทึมและ API ที่ใกล้อุดมคติ แต่ Wirehair เป็นการนำแนวคิดไปใช้งานจริง ไม่ใช่สเปก แม้จะเสถียร แต่ก็กังวลว่าจะสามารถแปลงให้เป็นสเปกที่เชื่อถือได้หรือไม่ เป็นเทคโนโลยีแกนหลักของ Erasure Code pool ใน Ceph พารามิเตอร์การเข้ารหัส (k, m) ไม่สามารถอัปเดตภายหลังได้ เพราะความไม่ยืดหยุ่นนี้ replica จึงยังคงเป็นตัวเลือกหลักสำหรับการจัดเก็บข้อมูลที่ทนทานต่อความขัดข้องและมีความพร้อมใช้งานสูง สงสัยว่าผลิตภัณฑ์ที่สร้างขึ้นระหว่างเหตุการณ์ M of N จะถูกเข้ารหัสต่างจากตอนที่ N พร้อมใช้งานครบหรือไม่ อาจต้องมีบิตแฟล็กที่ระบุว่า "ต้องเข้ารหัสใหม่เมื่อ N ถูกกู้คืน" ทำให้นึกถึง Information Dispersal Algorithm ของ Rabin มีการให้ลิงก์ไปยังบทความวิชาการที่เกี่ยวข้อง สงสัยว่ามันใช้งานได้จริงเฉพาะกับงานแบบอ่านอย่างเดียวหรือเน้นการอ่านหรือไม่ เป็นหนึ่งในกลยุทธ์การทำสำเนาที่ Ceph ใช้กับ distributed blob storage
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
แปลกใจที่ไม่มีการกล่าวถึง rateless fountain codes
มีอัลกอริทึม network coding ที่เคยถูกเสนอไว้ในอดีต
Erasure coding เป็นเทคโนโลยีที่มีมานานแล้ว
ถ้าสนใจ Erasure coding ก็ควรพิจารณากรณีแบบหลายมิติ
สงสัยว่ามีใครเคยใช้ Wirehair ในโปรเจ็กต์บ้างหรือไม่
เป็นเทคโนโลยีแกนหลักของ Erasure Code pool ใน Ceph
สงสัยว่าผลิตภัณฑ์ที่สร้างขึ้นระหว่างเหตุการณ์ M of N จะถูกเข้ารหัสต่างจากตอนที่ N พร้อมใช้งานครบหรือไม่
ทำให้นึกถึง Information Dispersal Algorithm ของ Rabin
สงสัยว่ามันใช้งานได้จริงเฉพาะกับงานแบบอ่านอย่างเดียวหรือเน้นการอ่านหรือไม่
เป็นหนึ่งในกลยุทธ์การทำสำเนาที่ Ceph ใช้กับ distributed blob storage