1 คะแนน โดย GN⁺ 2023-09-21 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • บทความเกี่ยวกับการบรรลุความแม่นยำ 78% บนชุดข้อมูล MNIST ด้วย GZIP โดยใช้โค้ดไม่ถึง 10 บรรทัด
  • ผู้เขียนเน้นว่าสิ่งใหม่ของโพสต์นี้ไม่ใช่การทำผลลัพธ์ล้ำสมัยที่สุด แต่เป็นการแสดงศักยภาพของการใช้การบีบอัดเป็นเครื่องมือจัดประเภทแบบไร้โมเดลที่มีเอกลักษณ์
  • โค้ดที่ให้มาใช้ GZIP และ NCD (Normalized Compression Distance) เป็นตัวชี้วัดความคล้ายคลึง และใช้ k-NN (k-Nearest Neighbors) สำหรับการจัดประเภท
  • GZIP ถูกใช้เป็นเครื่องมือวัดความซับซ้อนหรือปริมาณข้อมูลของจุดข้อมูลแต่ละจุด ส่วน NCD ให้ค่าการวัดแบบปรับมาตรฐานว่าจุดข้อมูลสองจุดมีความคล้ายกันมากเพียงใด
  • อัลกอริทึมจะคำนวณ NCD กับตัวอย่างฝึกทั้งหมด จากนั้นจัดเรียงและเลือกค่าระยะทางที่น้อยที่สุดจำนวน k ค่า โดยในกรณีนี้ k=5 และคลาสเสียงข้างมากในเพื่อนบ้านที่ใกล้ที่สุด 5 ตัวจะถูกทำนายเป็นเลเบลของตัวอย่างทดสอบ
  • ผู้เขียนยอมรับว่าแนวทางนี้มีค่าใช้จ่ายด้านการคำนวณสูง และใช้ภาพทดสอบเพียงบางส่วนในการวัดความแม่นยำ
  • ผู้เขียนยังให้เวอร์ชันของอัลกอริทึมที่ซ่อนรายละเอียดน้อยกว่าเพื่อช่วยให้เข้าใจได้ดีขึ้น
  • ผู้เขียนกล่าวถึงแนวทางคล้ายกันที่ Andreas Kirsch เคยทำไว้ในปี 2019 ซึ่งทำความแม่นยำได้ราว 35%
  • ผู้เขียนเริ่มใช้การบีบอัดเป็นกลไกสำหรับการจัดประเภทภาพ หลังจากอ่านบทความเกี่ยวกับการสร้างข้อความจากการบีบอัดข้อมูล และอ่านงานวิจัยเกี่ยวกับการจัดประเภทข้อความแบบไม่มีพารามิเตอร์
  • ผู้เขียนเคยทำงานด้านการบีบอัดภาพสำหรับ edge computer vision มาก่อน และสนใจนำเทคนิคนี้มาประยุกต์ใช้กับชุดข้อมูล MNIST

1 ความคิดเห็น

 
GN⁺ 2023-09-21
ความคิดเห็นบน Hacker News
  • บทความเกี่ยวกับการใช้ GZIP เพื่อให้ได้ความแม่นยำ 78% บนชุดข้อมูล MNIST ด้วยโค้ดไม่ถึง 10 บรรทัด
  • ผู้แสดงความคิดเห็นได้ลองแทนที่ฟังก์ชันระยะทางในโค้ดด้วยตัวชี้วัดที่ง่ายกว่า ซึ่งทำให้ความแม่นยำดีขึ้นและลดความต้องการด้านการคำนวณ
    • ระยะแบบยูคลิดให้ความแม่นยำ 93% ในเวลาประมาณ 0.5 วินาทีหลังจากไบนาไรซ์ภาพ
    • ระยะแบบจัคการ์ดให้ความแม่นยำ 94% ในเวลาประมาณ 0.7 วินาทีหลังจากไบนาไรซ์ภาพ
    • Dice dissimilarity ให้ความแม่นยำ 94% ในเวลาประมาณ 0.8 วินาทีหลังจากไบนาไรซ์ภาพ
  • เทคนิคอื่น ๆ สำหรับการเปรียบเทียบ ได้แก่ Linear SVC ที่มีความแม่นยำ 92%, SVC rbf ที่มีความแม่นยำ 96.4%, SVC poly ที่มีความแม่นยำ 94.5%, logistic regression ที่มีความแม่นยำ 89% และ naive Bayes ที่มีความแม่นยำ 81%
  • ผู้แสดงความคิดเห็นเสนอว่า แม้โค้ดจะสวยงามและกระชับ แต่ความแม่นยำ 78% สำหรับ MNIST ถือว่าต่ำ และโมเดลตัวอย่างง่าย ๆ ที่เขียนด้วย Tensorflow ก็สามารถทำความแม่นยำ 90% ได้สบาย
  • โมเดลที่ดีที่สุดสำหรับ MNIST ถูกจัดอันดับไว้ที่ความแม่นยำ 99.87%
  • ผู้แสดงความคิดเห็นบางส่วนเสนอว่า หากแทนที่ normalized compression distance (NCD) ด้วยระยะแบบยูคลิด จะเพิ่มความแม่นยำในการทดสอบได้ 15% และประหยัดการคำนวณได้มาก
  • ผู้แสดงความคิดเห็นบางส่วนเสนอว่าชุดข้อมูล MNIST ควรถูกปลดระวางแล้ว เพราะการทำความแม่นยำสูงบนมันกลายเป็นเรื่องค่อนข้างง่าย
  • มีการพูดคุยถึงศักยภาพในการหาลวดลายจากข้อมูลที่ถูกบีบอัดอย่างมาก เพื่อการบีบอัดที่ดียิ่งขึ้น
  • ผู้แสดงความคิดเห็นบางส่วนสนใจการวัดระยะสารสนเทศสำหรับตัวบีบอัดแบบใช้งานทั่วไปและ language model ทางเลือก
  • ผู้แสดงความคิดเห็นคนหนึ่งกล่าวถึงการใช้กลไก attention ที่ผสาน normalized compression distance (gzip) เข้ากับ discrete convolution ระหว่างลำดับผู้สมัคร