3 คะแนน โดย GN⁺ 2023-11-21 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

ตัวอย่างที่ดีและไม่ดีของการทำข้อมูลให้เป็นภาพ

  • บทความเชิงเรียงความที่ถ่ายทอดมุมมองเกี่ยวกับการทำข้อมูลให้เป็นภาพ พร้อมตัวอย่างและคำอธิบายของการทำภาพที่ดีและไม่ดี

ห้ามสร้าง bar chart เพื่อแยกค่าเฉลี่ย

  • กราฟแยกค่าเฉลี่ยพบได้บ่อยในงานตีพิมพ์ทางวิทยาศาสตร์ แต่ bar chart ไม่เหมาะกับการสื่อว่ากลุ่มสองกลุ่มที่มีการกระจายและส่วนเบี่ยงเบนมาตรฐานใกล้เคียงกันนั้นจริงๆ แล้วเหมือนกันหรือไม่
  • เน้นว่าควรตรวจสอบบางอย่างก่อนใช้ bar chart

ห้ามสร้าง violin plot สำหรับขนาดตัวอย่างเล็ก

  • ในตัวอย่างขนาดเล็ก การกระจายและควอไทล์อาจแตกต่างกันมาก ทำให้ violin plot ไม่มีความหมาย
  • จากการทดลองพบว่าการกระจายจะเริ่มมีเสถียรภาพเมื่อขนาดตัวอย่างตั้งแต่ 50 ขึ้นไป

ห้ามใช้สเกลสีแบบสองทิศทางกับข้อมูลทิศทางเดียว

  • การใช้สเกลสีแบบสองทิศทางกับข้อมูลทิศทางเดียวเป็นความผิดพลาดใหญ่ในการทำข้อมูลให้เป็นภาพ
  • สเกลสีควรใช้แทนค่าพิเศษที่มีความหมาย

ห้ามใช้ bar chart แสดงผลการทดลองหลายปัจจัย

  • การสื่อผลการทดลองหลายปัจจัยอย่างมีประสิทธิภาพต้องอาศัยการออกแบบการจัดกลุ่ม/การแยกตามปัจจัยอย่างรอบคอบ

ห้ามสร้าง heatmap โดยไม่จัดเรียงแถวและคอลัมน์ใหม่

  • heatmap ควรถูกสร้างอย่างมีประสิทธิภาพโดยคำนึงถึงลำดับของแถวและคอลัมน์
  • สามารถจัดเรียงแถวและคอลัมน์ใหม่ด้วย clustering ได้ แต่ไม่ใช่วิธีเดียว

ห้ามสร้าง heatmap โดยไม่ตรวจสอบ outlier

  • หากไม่ตรวจสอบ outlier ใน heatmap อาจส่งผลอย่างมากต่อการตีความข้อมูล

อย่าลืมตรวจสอบช่วงของข้อมูลในแต่ละระดับของปัจจัย

  • ในการทดลองหลายปัจจัย ช่วงของตัวแปรตอบสนองอาจแตกต่างกันมากตามระดับของปัจจัย

ห้ามสร้าง network graph โดยไม่ลองหลายๆ layout

  • รูปลักษณ์ของ network graph เป็นปัจจัยสำคัญที่กำหนดประสิทธิภาพของมัน
  • การเปลี่ยน layout ช่วยให้ตีความ network graph ได้ง่ายขึ้น

ห้ามสับสนระหว่างการแสดงผลแบบอิงตำแหน่งกับแบบอิงความยาว

  • การสับสนระหว่างการแสดงผลแบบอิงตำแหน่งกับแบบอิงความยาวอาจนำไปสู่ความเข้าใจผิด
  • การไม่เริ่ม bar chart จาก 0 เป็นความผิดพลาดใหญ่ในการทำข้อมูลให้เป็นภาพ

ห้ามทำ pie chart

  • pie chart ถูกวิจารณ์เพราะมนุษย์ไม่ถนัดในการอ่านมุมและพื้นที่
  • หากต้องการแสดงข้อมูลด้วยความยาว การคลี่ donut chart ออกมาเป็น stacked bar chart จะดีกว่า

ห้ามทำ donut chart แบบวงซ้อนศูนย์กลางเดียวกัน

  • donut chart แบบวงซ้อนศูนย์กลางเดียวกันอาจบิดเบือนข้อมูล เพราะความยาวส่วนโค้งของวงนอกยาวกว่าวงในมาก
  • ทางเลือกที่เรียบง่ายและมีประสิทธิภาพคือคลี่ donut chart ออกมาเป็น stacked bar chart

ห้ามใช้สเกลสีแดง/เขียวและสีรุ้ง

  • ควรใช้สเกลสีที่เป็นมิตรกับผู้มีภาวะตาบอดสี และยังคงถ่ายทอดข้อมูลได้ดีแม้อยู่ในโทนขาวดำ

อย่าลืมจัดเรียง stacked bar chart ใหม่

  • เมื่อมีตัวอย่างและคลาสจำนวนมาก ควรปรับลำดับของ stacked bar chart ให้เหมาะสมเพื่อให้สื่อสารได้อย่างมีประสิทธิภาพ

ความเห็นของ GN⁺

ประเด็นสำคัญที่สุดของบทความนี้คือการเพิ่มการตระหนักรู้ถึงความผิดพลาดที่มักเกิดขึ้นในการทำข้อมูลให้เป็นภาพ และวิธีหลีกเลี่ยงมัน การทำข้อมูลให้เป็นภาพเป็นเครื่องมือทรงพลังในการถ่ายทอดข้อมูลที่ซับซ้อนให้เข้าใจง่าย แต่หากใช้อย่างผิดวิธีก็อาจทำให้เกิดความเข้าใจผิดได้ บทความนี้มอบแนวทางที่น่าสนใจและเป็นประโยชน์แก่ทุกคนที่ต้องการสื่อสารข้อมูลอย่างถูกต้องและชัดเจน

2 ความคิดเห็น

 
xguru 2023-11-21

ชื่อบทความน่าสนุกดีนะครับ ถ้าดูบทความต้นฉบับจะมีกราฟตัวอย่างแนบมาด้วยเลย ทำให้ดูเข้าใจง่ายครับ

 
GN⁺ 2023-11-21
ความคิดเห็นบน Hacker News
  • ความเห็นหนึ่งชี้ว่า กราฟบางแบบอาจถูกเลือกใช้อย่างจงใจเพื่อปกปิดการขาดแคลนจุดข้อมูลหรือการกระจายตัวที่น่าสงสัย
  • การไม่ตั้งค่าสูงสุดของ outlier ใน heatmap เป็นปัญหาที่พบบ่อยในการทำภาพข้อมูลสถิติวิดีโอเกม และมักแทบไม่มีประโยชน์ในการวินิจฉัยปัญหาอุณหภูมิจริง
  • ความเห็นหนึ่งแชร์ประสบการณ์ที่น่าผิดหวังกับคำกล่าวอ้างว่า กราฟที่แกนไม่ได้เริ่มต้นจาก 0 จะต้องทำให้เข้าใจผิดเสมอไป ซึ่งจริง ๆ แล้วไม่จำเป็นต้องเป็นเช่นนั้น
  • เป็นภาพรวมที่ดีของข้อผิดพลาดที่พบบ่อยในการทำ data visualization พร้อมความเห็นว่าอยากแชร์ให้เพื่อนร่วมงาน และมีคำแนะนำทรัพยากรที่อ้างอิงงานวิจัยเกี่ยวกับการรับรู้ของมนุษย์
  • มีการแนะนำหนังสือ "The Visual Display of Quantitative Information" ของ Edward Tufte ที่ตีพิมพ์ในปี 1983 เป็นแหล่งอ้างอิงเพิ่มเติมด้าน data visualization
  • ความเห็นหนึ่งเสนอว่า บทเรียนจำนวนมากของ data visualization ไม่ใช่เรื่องใหม่ และแนะนำให้อ้างอิง "Graphic presentation" ของ Willard C. Brinton ที่ตีพิมพ์ในปี 1939
  • มีคำแนะนำว่าอย่าใช้สเกลสีแบบสองทิศทางกับข้อมูลทางเดียว โดยสรุปเป็นคำพูดว่า “เพื่อนไม่ปล่อยให้เพื่อนใช้สเกลสีแบบสองทิศทาง”
  • มีการแชร์ลิงก์วิดีโอที่แสดงมุมมองเชิงลบต่อ violin plot พร้อมความเห็นว่า violin plot ไม่ควรมีอยู่เลย
  • มีการแนะนำบรรยาย "How Humans See Data" ซึ่งรวบรวมแนวคิดหลายอย่างจากงานวิจัยเกี่ยวกับวิธีที่มนุษย์มองข้อมูล
  • มีการกล่าวถึงคู่มือที่อธิบายวิธีจัดประเภทข้อมูลและเลือกสไตล์กราฟ/แผนภูมิที่เหมาะสมที่สุดสำหรับแต่ละประเภท พร้อมแสดงความเสียดายที่ไม่ได้บุ๊กมาร์กคู่มือนั้นไว้