- บทความเกี่ยวกับการบรรลุความแม่นยำ 78% บนชุดข้อมูล MNIST ด้วย GZIP โดยใช้โค้ดไม่ถึง 10 บรรทัด
- ผู้เขียนเน้นว่าสิ่งใหม่ของโพสต์นี้ไม่ใช่การทำผลลัพธ์ล้ำสมัยที่สุด แต่เป็นการแสดงศักยภาพของการใช้การบีบอัดเป็นเครื่องมือจัดประเภทแบบไร้โมเดลที่มีเอกลักษณ์
- โค้ดที่ให้มาใช้ GZIP และ NCD (Normalized Compression Distance) เป็นตัวชี้วัดความคล้ายคลึง และใช้ k-NN (k-Nearest Neighbors) สำหรับการจัดประเภท
- GZIP ถูกใช้เป็นเครื่องมือวัดความซับซ้อนหรือปริมาณข้อมูลของจุดข้อมูลแต่ละจุด ส่วน NCD ให้ค่าการวัดแบบปรับมาตรฐานว่าจุดข้อมูลสองจุดมีความคล้ายกันมากเพียงใด
- อัลกอริทึมจะคำนวณ NCD กับตัวอย่างฝึกทั้งหมด จากนั้นจัดเรียงและเลือกค่าระยะทางที่น้อยที่สุดจำนวน k ค่า โดยในกรณีนี้ k=5 และคลาสเสียงข้างมากในเพื่อนบ้านที่ใกล้ที่สุด 5 ตัวจะถูกทำนายเป็นเลเบลของตัวอย่างทดสอบ
- ผู้เขียนยอมรับว่าแนวทางนี้มีค่าใช้จ่ายด้านการคำนวณสูง และใช้ภาพทดสอบเพียงบางส่วนในการวัดความแม่นยำ
- ผู้เขียนยังให้เวอร์ชันของอัลกอริทึมที่ซ่อนรายละเอียดน้อยกว่าเพื่อช่วยให้เข้าใจได้ดีขึ้น
- ผู้เขียนกล่าวถึงแนวทางคล้ายกันที่ Andreas Kirsch เคยทำไว้ในปี 2019 ซึ่งทำความแม่นยำได้ราว 35%
- ผู้เขียนเริ่มใช้การบีบอัดเป็นกลไกสำหรับการจัดประเภทภาพ หลังจากอ่านบทความเกี่ยวกับการสร้างข้อความจากการบีบอัดข้อมูล และอ่านงานวิจัยเกี่ยวกับการจัดประเภทข้อความแบบไม่มีพารามิเตอร์
- ผู้เขียนเคยทำงานด้านการบีบอัดภาพสำหรับ edge computer vision มาก่อน และสนใจนำเทคนิคนี้มาประยุกต์ใช้กับชุดข้อมูล MNIST
1 ความคิดเห็น
ความคิดเห็นบน Hacker News