แผนภาพกล่อง (box plot) เป็นการนำเสนอข้อมูลเชิงปริมาณที่แสดงค่าสำคัญ 3 ค่า (5 ตำแหน่ง) ประกอบด้วยค่าต่ำสุด ค่าสูงสุดและค่าของควอไทล์ (quartile) โดยควอร์ไทล์จะมี 3 ค่า ได้แก่
ควอร์ไทล์ที่ 1 ( Q_{1}) หรือ Lower quartile ในกรณีที่ Q_{1}=a จะได้ว่ามีจำนวนข้อมูลที่มีค่าน้อยกว่า a อยู่ประมาณ 1 ใน 4 ของข้อมูลทั้งหมดหรือคิดเป็นประมาณร้อยละ 25 ของข้อมูลทั้งหมด
ควอร์ไทล์ที่ 2 ( Q_{2}) หรือ Middle quartile คือ ข้อมูลที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลทั้งหมด
ควอร์ไทล์ที่ 3 ( Q_{3}) หรือ Upper quartile ในกรณีที่ Q_{1}=b จะได้ว่ามีจำนวนข้อมูลที่มีค่าน้อยกว่า b อยู่ประมาณ 3 ใน 4 ของข้อมูลทั้งหมดหรือคิดเป็นประมาณร้อยละ 75 ของข้อมูลทั้งหมด
นอกจากนี้ในกรณีที่มีข้อมูลบางตัวที่แตกต่างจากข้อมูลส่วนใหญ่มากๆ ซึ่งอาจเกิดขึ้นตามธรรมชาติหรือเกิดจากความคาดเคลื่อนในการเก็บข้อมูล เช่น จากการสำรวจผู้เข้าใช้บริการร้านอาหารแห่งหนึ่งพบว่า จากจำนวนลูกค้าทั้งหมด 30 คน มีอายุในช่วง 25-30 ปี จำนวน 29 คน อีก 1 คน มีอายุ 78 ปี จะเรียกข้อมูลที่แตกต่างจากข้อมูลส่วนใหญ่มากๆ ว่า ค่านอกเกณฑ์ (outlier) จากตัวอย่างดังกล่าวจะได้ค่านอกเกณฑ์คือ 78 ซึ่งค่านอกเกณฑ์ดังกล่าวนั้นต้องแสดงลงแผนภาพกล่องด้วย ทั้งนี้ในทางปฏิบัตินักเรียนไม่สามารถล่วงรู้ได้ว่าค่านอกเกณฑ์ที่นักเรียนเก็บมานั้นจะเกิดขึ้นโดยบังเอิญตามธรรมชาติหรือเกิดจากความผิดพลาดของผู้เก็บข้อมูล
ขั้นตอนการเขียนแผนภาพกล่องมีดังนี้
- เรียงข้อมูลจากน้อยไปมาก
- หาค่าต่ำสุดและค่าสูงสุด
- หาตำแหน่งของค่าควอร์ไทล์ที่ k จากสูตร \dfrac{k(n+1)}{4} เมื่อ n คือ จำนวนข้อมูลทั้งหมด และ k=1,2,3
- พิจารณาหาค่านอกเกณฑ์ (x) ถ้ามี โดยอาศัยหลักเกณฑ์ดังนี้
ข้อมูล x จะเป็นค่านอกเกณฑ์ก็ต่อเมื่อ x<{{Q}_{1}}-1.5({{Q}_{3}}-{{Q}_{1}}) หรือ x<{{Q}_{3}}+1.5({{Q}_{3}}-{{Q}_{1}})
ตัวอย่างการเขียนแผนภาพกล่อง
จากการสำรวจอายุของผู้มาใช้บริการร้านตัดผมแห่งหนึ่ง จำนวน 27 คน โดยเรียงข้อมูลจากน้อยไปมากได้ดังนี้
19 | 19 | 20 | 21 | 21 | 21 | 22 | 22 | 22 |
22 | 23 | 23 | 23 | 24 | 25 | 25 | 27 | 27 |
30 | 32 | 32 | 32 | 35 | 35 | 36 | 37 | 38 |
จงเขียนแผนภาพกล่องเพื่อนำเสนอข้อมูลชุดนี้