แผนภาพกล่อง box plot ตอนที่ 1

แผนภาพกล่อง (box plot) เป็นการนำเสนอข้อมูลเชิงปริมาณที่แสดงค่าสำคัญ 3 ค่า (5 ตำแหน่ง) ประกอบด้วยค่าต่ำสุด ค่าสูงสุดและค่าของควอไทล์ (quartile) โดยควอร์ไทล์จะมี 3 ค่า ได้แก่

ควอร์ไทล์ที่ 1 ( Q_{1}) หรือ Lower quartile ในกรณีที่ Q_{1}=a จะได้ว่ามีจำนวนข้อมูลที่มีค่าน้อยกว่า a อยู่ประมาณ 1 ใน 4 ของข้อมูลทั้งหมดหรือคิดเป็นประมาณร้อยละ 25 ของข้อมูลทั้งหมด

ควอร์ไทล์ที่ 2 ( Q_{2}) หรือ Middle quartile คือ ข้อมูลที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลทั้งหมด

ควอร์ไทล์ที่ 3 ( Q_{3}) หรือ Upper quartile ในกรณีที่ Q_{1}=b จะได้ว่ามีจำนวนข้อมูลที่มีค่าน้อยกว่า b อยู่ประมาณ 3 ใน 4 ของข้อมูลทั้งหมดหรือคิดเป็นประมาณร้อยละ 75 ของข้อมูลทั้งหมด

นอกจากนี้ในกรณีที่มีข้อมูลบางตัวที่แตกต่างจากข้อมูลส่วนใหญ่มากๆ ซึ่งอาจเกิดขึ้นตามธรรมชาติหรือเกิดจากความคาดเคลื่อนในการเก็บข้อมูล เช่น จากการสำรวจผู้เข้าใช้บริการร้านอาหารแห่งหนึ่งพบว่า จากจำนวนลูกค้าทั้งหมด 30 คน มีอายุในช่วง 25-30 ปี จำนวน 29 คน อีก 1 คน มีอายุ 78 ปี จะเรียกข้อมูลที่แตกต่างจากข้อมูลส่วนใหญ่มากๆ ว่า ค่านอกเกณฑ์ (outlier) จากตัวอย่างดังกล่าวจะได้ค่านอกเกณฑ์คือ 78 ซึ่งค่านอกเกณฑ์ดังกล่าวนั้นต้องแสดงลงแผนภาพกล่องด้วย ทั้งนี้ในทางปฏิบัตินักเรียนไม่สามารถล่วงรู้ได้ว่าค่านอกเกณฑ์ที่นักเรียนเก็บมานั้นจะเกิดขึ้นโดยบังเอิญตามธรรมชาติหรือเกิดจากความผิดพลาดของผู้เก็บข้อมูล

ขั้นตอนการเขียนแผนภาพกล่องมีดังนี้

  1. เรียงข้อมูลจากน้อยไปมาก
  2. หาค่าต่ำสุดและค่าสูงสุด
  3. หาตำแหน่งของค่าควอร์ไทล์ที่ k จากสูตร \dfrac{k(n+1)}{4} เมื่อ n คือ จำนวนข้อมูลทั้งหมด และ k=1,2,3
  4. พิจารณาหาค่านอกเกณฑ์ (x) ถ้ามี โดยอาศัยหลักเกณฑ์ดังนี้
    ข้อมูล x จะเป็นค่านอกเกณฑ์ก็ต่อเมื่อ x<{{Q}_{1}}-1.5({{Q}_{3}}-{{Q}_{1}}) หรือ x<{{Q}_{3}}+1.5({{Q}_{3}}-{{Q}_{1}})

ตัวอย่างการเขียนแผนภาพกล่อง

จากการสำรวจอายุของผู้มาใช้บริการร้านตัดผมแห่งหนึ่ง จำนวน 27 คน โดยเรียงข้อมูลจากน้อยไปมากได้ดังนี้

191920212121222222
222323232425252727
303232323535363738

จงเขียนแผนภาพกล่องเพื่อนำเสนอข้อมูลชุดนี้

Scroll to Top