ระบบไฟล์ pi ที่มีอัตราการบีบอัดเกือบ 100%
(github.com)มีการคาดกันอย่างมากว่าตำแหน่งทศนิยมของค่าพาย ไม่ว่าจะเขียนในเลขฐานใดก็ตาม จะเป็น normal number ซึ่งหมายความว่าตัวเลขทุกตัวจะปรากฏด้วยสัดส่วนที่เท่ากัน
หากเป็น normal number ก็มีการพิสูจน์แล้วว่าจะเป็น disjunctive sequence ที่มีทุกชุดตัวเลขที่เป็นไปได้รวมอยู่ด้วย
กล่าวคือ โปรแกรมคอมพิวเตอร์ทั้งหมดที่แสดงในรูปแบบไบนารี ล้วนมีอยู่ที่ใดที่หนึ่งในตำแหน่งทศนิยมของค่าพาย หากหาเพียงตำแหน่งในทศนิยมของค่าพายได้ ก็จะสามารถเก็บและกู้คืนข้อมูลทุกอย่างได้
ว่ากันว่าการเก็บไฟล์ข้อความ 400 บรรทัดใช้เวลาประมาณ 5 นาที แต่ผู้สร้างก็บอกว่าแค่เชื่อในกฎของมัวร์ก็พอ... ว่าอย่างนั้น
12 ความคิดเห็น
ยกตัวอย่างเช่น ถ้ามีข้อมูลอย่าง 01010 ก็เข้าใจได้ว่าในเลขพายมีตำแหน่งที่ตรงกับ 01010 อยู่ ดังนั้นเหมือนว่าจะเก็บแค่ข้อมูลตำแหน่งก็พอ..
ช่วงนี้กำลังดูซีรีส์ Silicon Valley อยู่ แล้วในนั้นมีอินเทอร์เน็ตแบบใหม่ที่ใช้อัลกอริทึมการบีบอัดโผล่ออกมาด้วย ถ้าเทคโนโลยีพัฒนาไปถึงระดับที่ระบบไฟล์เลขพายที่มีอัตราการบีบอัดใกล้ 100% นำมาใช้งานได้จริง อินเทอร์เน็ตแบบใหม่นั้นจะเกิดขึ้นมาจริง ๆ ไหมนะ?
มองได้ว่าเลขพายทำหน้าที่เป็นพจนานุกรมร่วมที่เข้าถึงได้จากทุกที่
มีใครช่วยอธิบายให้เข้าใจง่ายขึ้นอีกนิดได้ไหมครับ/คะ? ผม/ฉันยังไม่ค่อยเข้าใจว่าการที่ค่าพายเป็น normal number มันเกี่ยวข้องอะไรกับการที่เวลาเก็บไฟล์แล้วมีอัตราการบีบอัด 100%
คำว่า normal number หมายถึงว่า ตัวอย่างเช่น ถ้าเขียนค่าพายในฐาน 5 แล้วขยายไปจนถึง 1,000 หลักหลังจุดทศนิยม ตัวเลข 0,1,2,3,4 จะปรากฏอย่างละใกล้เคียง 200 ครั้ง ใช่ไหมครับ/คะ?
ผม/ฉันไปต่อจากตรงนั้นไม่ถูกเลย เศร้าจัง.
เท่าที่ผมเข้าใจมีดังนี้ครับ
ถ้าเป็น normal number ก็มีการพิสูจน์แล้วว่าชุดตัวเลขที่เป็นไปได้ทั้งหมดจะปรากฏอย่างน้อยหนึ่งครั้ง ลำดับเลขฐานสองอย่าง 0110001... เองก็น่าจะอยู่ที่ไหนสักแห่งในตำแหน่งทศนิยมของค่า เช่นกัน ถ้าจำแค่ตำแหน่งของจุดทศนิยมดังกล่าวได้ ก็ไม่จำเป็นต้องเก็บไฟล์ลงในอุปกรณ์จัดเก็บโดยตรง และสามารถกู้คืนไฟล์กลับมาได้ ส่วนค่าของ นั้นเป็นค่าคงที่ทางคณิตศาสตร์ จึงไม่จำเป็นต้องเก็บไว้ในอุปกรณ์จัดเก็บ แต่คำนวณค่า ขึ้นมาใช้ได้ทุกครั้งตามต้องการ
เข้าใจแล้ว ขอบคุณมากจริง ๆ!
หากมีสตอเรจที่สามารถเก็บค่าพายได้อย่างแม่นยำโดยไม่มีความคลาดเคลื่อนตั้งแต่แรก ก็ไม่จำเป็นต้องบีบอัดเลย...
ดูเหมือนว่าจะไม่ได้เก็บค่าของพายไว้ในสตอเรจแล้วเรียกใช้ แต่คำนวณค่าพายในแต่ละครั้งที่ต้องใช้แทน เลยคงเรียกว่าบีบอัดได้ 100%
พอลองไปดูคำนิยามของอัตราการบีบอัดในวิกิพีเดีย[1] ก็พบว่ามันดูเหมือนจะไม่ใช่วิธีคำนวณแบบที่เราคิดกันทั่วไปนะครับ
ผมเคยเขียนบทความเกี่ยวกับเรื่องนี้ไว้เมื่อก่อน[2] นานมากแล้วครับ 555
[1] https://en.wikipedia.org/wiki/Data_compression_ratio
[2] https://wp.me/pPGG8-41E
นี่ก็เพิ่งรู้เป็นครั้งแรกเหมือนกันว่านิยามของอัตราการบีบอัดคือขนาดก่อนบีบอัด/ขนาดหลังบีบอัด เห็นเขียนไว้ใน GitHub ว่า 100% compression เลยทำให้ผมเข้าใจผิดไปเอง..
ทำให้นึกถึงแนวคิดของ Illegal prime เหมือนกันนะครับ 555
https://wp.me/pPGG8-3sT
เป็นเรื่องที่น่าสนใจมากเลย 5555555555 ตอนนี้เข้าสู่ยุคของพายผิดกฎหมายแล้วสินะ...
บีบอัดคอนเทนต์ผิดกฎหมายด้วยสิ่งนั้น
บอกตำแหน่งของค่าพายในที่ไหนสักแห่งที่จะออกมาจากสิ่งนั้น
ผิดกฎหมาย!
การคำนวณทศนิยมโดยไม่ได้เริ่มจากหลักแรก แต่เริ่มจากหลักที่กำหนด เรียกว่าอัลกอริทึมแบบ spigot และในกรณีของ pifs ระบุว่าใช้สูตร Bailey-Borwein-Plouffe ในการคำนวณหลักของค่า pi
https://ko.wikipedia.org/wiki/Spigot_algorithm