เพื่อนช่วยกันไม่ให้เพื่อนทำกราฟห่วยๆ
(github.com/cxli233)ตัวอย่างที่ดีและไม่ดีของการทำข้อมูลให้เป็นภาพ
- บทความเชิงเรียงความที่ถ่ายทอดมุมมองเกี่ยวกับการทำข้อมูลให้เป็นภาพ พร้อมตัวอย่างและคำอธิบายของการทำภาพที่ดีและไม่ดี
ห้ามสร้าง bar chart เพื่อแยกค่าเฉลี่ย
- กราฟแยกค่าเฉลี่ยพบได้บ่อยในงานตีพิมพ์ทางวิทยาศาสตร์ แต่ bar chart ไม่เหมาะกับการสื่อว่ากลุ่มสองกลุ่มที่มีการกระจายและส่วนเบี่ยงเบนมาตรฐานใกล้เคียงกันนั้นจริงๆ แล้วเหมือนกันหรือไม่
- เน้นว่าควรตรวจสอบบางอย่างก่อนใช้ bar chart
ห้ามสร้าง violin plot สำหรับขนาดตัวอย่างเล็ก
- ในตัวอย่างขนาดเล็ก การกระจายและควอไทล์อาจแตกต่างกันมาก ทำให้ violin plot ไม่มีความหมาย
- จากการทดลองพบว่าการกระจายจะเริ่มมีเสถียรภาพเมื่อขนาดตัวอย่างตั้งแต่ 50 ขึ้นไป
ห้ามใช้สเกลสีแบบสองทิศทางกับข้อมูลทิศทางเดียว
- การใช้สเกลสีแบบสองทิศทางกับข้อมูลทิศทางเดียวเป็นความผิดพลาดใหญ่ในการทำข้อมูลให้เป็นภาพ
- สเกลสีควรใช้แทนค่าพิเศษที่มีความหมาย
ห้ามใช้ bar chart แสดงผลการทดลองหลายปัจจัย
- การสื่อผลการทดลองหลายปัจจัยอย่างมีประสิทธิภาพต้องอาศัยการออกแบบการจัดกลุ่ม/การแยกตามปัจจัยอย่างรอบคอบ
ห้ามสร้าง heatmap โดยไม่จัดเรียงแถวและคอลัมน์ใหม่
- heatmap ควรถูกสร้างอย่างมีประสิทธิภาพโดยคำนึงถึงลำดับของแถวและคอลัมน์
- สามารถจัดเรียงแถวและคอลัมน์ใหม่ด้วย clustering ได้ แต่ไม่ใช่วิธีเดียว
ห้ามสร้าง heatmap โดยไม่ตรวจสอบ outlier
- หากไม่ตรวจสอบ outlier ใน heatmap อาจส่งผลอย่างมากต่อการตีความข้อมูล
อย่าลืมตรวจสอบช่วงของข้อมูลในแต่ละระดับของปัจจัย
- ในการทดลองหลายปัจจัย ช่วงของตัวแปรตอบสนองอาจแตกต่างกันมากตามระดับของปัจจัย
ห้ามสร้าง network graph โดยไม่ลองหลายๆ layout
- รูปลักษณ์ของ network graph เป็นปัจจัยสำคัญที่กำหนดประสิทธิภาพของมัน
- การเปลี่ยน layout ช่วยให้ตีความ network graph ได้ง่ายขึ้น
ห้ามสับสนระหว่างการแสดงผลแบบอิงตำแหน่งกับแบบอิงความยาว
- การสับสนระหว่างการแสดงผลแบบอิงตำแหน่งกับแบบอิงความยาวอาจนำไปสู่ความเข้าใจผิด
- การไม่เริ่ม bar chart จาก 0 เป็นความผิดพลาดใหญ่ในการทำข้อมูลให้เป็นภาพ
ห้ามทำ pie chart
- pie chart ถูกวิจารณ์เพราะมนุษย์ไม่ถนัดในการอ่านมุมและพื้นที่
- หากต้องการแสดงข้อมูลด้วยความยาว การคลี่ donut chart ออกมาเป็น stacked bar chart จะดีกว่า
ห้ามทำ donut chart แบบวงซ้อนศูนย์กลางเดียวกัน
- donut chart แบบวงซ้อนศูนย์กลางเดียวกันอาจบิดเบือนข้อมูล เพราะความยาวส่วนโค้งของวงนอกยาวกว่าวงในมาก
- ทางเลือกที่เรียบง่ายและมีประสิทธิภาพคือคลี่ donut chart ออกมาเป็น stacked bar chart
ห้ามใช้สเกลสีแดง/เขียวและสีรุ้ง
- ควรใช้สเกลสีที่เป็นมิตรกับผู้มีภาวะตาบอดสี และยังคงถ่ายทอดข้อมูลได้ดีแม้อยู่ในโทนขาวดำ
อย่าลืมจัดเรียง stacked bar chart ใหม่
- เมื่อมีตัวอย่างและคลาสจำนวนมาก ควรปรับลำดับของ stacked bar chart ให้เหมาะสมเพื่อให้สื่อสารได้อย่างมีประสิทธิภาพ
ความเห็นของ GN⁺
ประเด็นสำคัญที่สุดของบทความนี้คือการเพิ่มการตระหนักรู้ถึงความผิดพลาดที่มักเกิดขึ้นในการทำข้อมูลให้เป็นภาพ และวิธีหลีกเลี่ยงมัน การทำข้อมูลให้เป็นภาพเป็นเครื่องมือทรงพลังในการถ่ายทอดข้อมูลที่ซับซ้อนให้เข้าใจง่าย แต่หากใช้อย่างผิดวิธีก็อาจทำให้เกิดความเข้าใจผิดได้ บทความนี้มอบแนวทางที่น่าสนใจและเป็นประโยชน์แก่ทุกคนที่ต้องการสื่อสารข้อมูลอย่างถูกต้องและชัดเจน
2 ความคิดเห็น
ชื่อบทความน่าสนุกดีนะครับ ถ้าดูบทความต้นฉบับจะมีกราฟตัวอย่างแนบมาด้วยเลย ทำให้ดูเข้าใจง่ายครับ
ความคิดเห็นบน Hacker News