เครื่องคำนวณส่วนเบี่ยงเบนมาตรฐาน
ให้วางรายการตัวเลขเข้าไป โปรแกรมคำนวณจะแสดงค่าเฉลี่ย ค่าส่วนเบี่ยงเบนมาตรฐาน ค่าส่วนเบี่ยงเบนมาตรฐานแบบปริมาณ (สำหรับกลุ่มตัวอย่าง s ใช้นิพจน์ต้นส่วนเป็น n−1 และสำหรับกลุ่มประชากร σ ใช้นิพจน์ต้นส่วนเป็น n) ค่าสัมประสิทธิ์การแปรปรวน และคะแนน z สำหรับแต่ละค่า ซึ่งมีประโยชน์อย่างยิ่งเมื่อต้องการประเมินระดับความกระจายของข้อมูลรอบค่าเฉลี่ย — เป็นข้อมูลสำคัญในการวิเคราะห์ก่อนดำเนินการทดสอบเชิงพารามิเตอร์ใดๆ
วิธีการคำนวณส่วนเบี่ยงเบนมาตรฐาน
-
1
วางค่าตัวเลขของคุณไว้
แยกด้วยเครื่องหมายจุลภาค ช่องว่าง หรือบรรทัดใหม่ รายการที่ไม่ใช่ตัวเลขจะถูกข้ามไป
-
2
ค่าเฉลี่ยของเส้น X-bar ถูกคำนวณขึ้น
ผลรวมหารด้วยจำนวน
-
3
ค่าเบี่ยงเบนกำลังสองจะถูกรวมกัน
ผลรวมของ (x – x-bar)²
-
4
หารแล้วหาค่าราก
สำหรับตัวอย่าง: หารด้วย (n − 1) แล้วหาค่ารากที่สอง จากนั้นหาค่า √ จากประชากร: หารด้วย n แล้วหาค่า √
ตัวอย่างเทียบกับกลุ่มประชากร — ควรใช้วิธีใดเมื่อใด
| ใช้ประชากร (n หารด้วย) | ใช้กลุ่มตัวอย่าง (n−1 หารด้วย) |
|---|---|
| คุณมีประชากรทั้งหมด | คุณมีกลุ่มตัวอย่างที่สุ่มมาจากประชากรขนาดใหญ่ |
| การสำรวจข้อมูลพนักงานอย่างครอบคลุม | เลือกตัวอย่างลูกค้าจำนวน 20 คน จากกลุ่มผู้ใช้บริการหลายพันคน |
| การขว้างลูกเต๋าทั้งหมด 10 ครั้งในแต่ละรอบการทดลอง | ค่าการวัดจากสายการผลิต |
ตัวหาร n−1 (การแก้ไขแบบเบสเซล) ให้ค่าประมาณที่ไม่เอนเอียงของความแปรปรวนของประชากรจากข้อมูลตัวอย่าง ในขณะที่เมื่อใช้ n เป็นตัวหาร จะทำให้ค่าประมาณดังกล่าวต่ำกว่าความแปรปรวนจริงของประชากรอย่างเป็นระบบ สำหรับขนาดตัวอย่างที่ใหญ่ ความแตกต่างนี้จะลดลง แต่ยังคงมีนัยสำคัญในกรณีของขนาดตัวอย่างเล็ก
ความเข้าใจเบื้องต้นเกี่ยวกับส่วนเบี่ยงเบนมาตรฐาน
หากเซตข้อมูลมีค่าเฉลี่ยเท่ากับ 100 และส่วนเบี่ยงเบนมาตรฐาน (SD) เท่ากับ 15 โดยสมมติว่าข้อมูลมีการแจกแจงแบบปกติโดยประมาณ จะได้ว่า:
- 68% ของค่าอยู่ในช่วง 85–115 (1 ส่วนเบี่ยงเบนมาตรฐาน)
- 95% อยู่ในช่วง 70–130 (2 ส่วนเบี่ยงเบนมาตรฐาน)
- 99.7% อยู่ในช่วง 55–145 (3 ส่วนเบี่ยงเบนมาตรฐาน)
นี่คือกฎ 68–95–99.7 หรือที่เรียกว่ากฎเชิงประจักษ์ โดยคะแนนไอคิว ความสูงของมนุษย์ และค่าการวัดทางธรรมชาติหลายประการล้วนเป็นไปตามกฎดังกล่าวอย่างใกล้ชิด
สัมประสิทธิ์การแปรปรวน
CV = SD / ค่าเฉลี่ย เป็นตัวชี้วัดความแปรปรวนที่ไม่มีหน่วย ซึ่งมีประโยชน์ในการเปรียบเทียบความแปรปรวนระหว่างชุดข้อมูลที่มีค่าเฉลี่ยแตกต่างกัน โดยเมื่อค่า CV เท่ากับ 0.1 (หรือ 10%) หมายความว่าค่าส่วนเบี่ยงเบนมาตรฐาน (SD) ประมาณ 10% ของค่าเฉลี่ย อย่างไรก็ตาม ค่าดังกล่าวอาจไม่มีความหมายสำหรับข้อมูลที่มีค่าตั้งแต่ศูนย์ลงไป
คะแนน Z (Z-scores)
สำหรับค่าแต่ละค่า x: z = (x − ค่าเฉลี่ย) / ส่วนเบี่ยงเบนมาตรฐาน (SD) โดยค่า z บ่งชี้ว่าค่านั้นอยู่เหนือหรือต่ำกว่าค่าเฉลี่ยไปเท่าใดในหน่วยของส่วนเบี่ยงเบนมาตรฐาน หาก |z| > 2 มักถือว่าเป็นค่าที่ผิดปกติ (outlier) ในขณะที่กรณีที่ |z| > 3 เกิดขึ้นได้น้อยมากในข้อมูลปกติ
ข้อผิดพลาดทั่วไป
- การใช้ข้อมูลประชากรแทนข้อมูลตัวอย่าง ซึ่งจะทำให้ประเมินความแปรปรวนในชุดข้อมูลตัวอย่างต่ำกว่าความเป็นจริง
- การผสมค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานจากหน่วยต่างๆ โปรดตรวจสอบมาตราส่วนเสมอ
- การประยุกต์ใช้หลักการแจกแจงปกติกับข้อมูลที่ไม่เป็นปกติ ข้อมูลที่มีรูปแบบเอียงหรือมีหลายรูปแบบจะทำให้หลักเกณฑ์การประมาณค่าตามช่วง 68–95–99.7 ไม่สามารถใช้ได้อย่างเหมาะสม ควรสร้างแผนภูมิฮิสโตแกรมก่อน
- การเพิกเฉยต่อค่าผิดปกติ: ค่าสุดโต่งเพียงค่าเดียวอาจทำให้ค่าส่วนเบี่ยงเบนมาตรฐาน (SD) เพิ่มขึ้นถึงสามเท่า มีวิธีการประเมินที่ทนทานกว่า เช่น ค่าเบี่ยงเบนสัมบูรณ์ของมัธยฐาน หรือช่วงระหว่างควอไทล์ สำหรับข้อมูลที่มีลักษณะหางหนัก
คำถามที่พบบ่อย
เอ็กซ์เซลมีฟังก์ชันสองตัว ได้แก่ STDEV (สำหรับกลุ่มตัวอย่าง โดยใช้นิสัยค่า n−1) และ STDEVP (สำหรับประชากรโดยรวม โดยใช้นิสัยค่า n) โปรดตรวจสอบให้แน่ใจว่าคุณใช้ฟังก์ชันที่ตรงกับสมมติฐานเกี่ยวกับกลุ่มตัวอย่างหรือประชากรโดยรวมที่คุณต้องการ
ใช่ — ค่าส่วนเบี่ยงเบนมาตรฐาน (SD) มีหน่วยวัดเหมือนกับค่าที่คุณใช้ (เซนติเมตร ดอลลาร์ วินาที) ส่วนความแปรปรวนมีหน่วยเป็นกำลังสอง จึงทำให้ค่า SD อ่านเข้าใจได้ง่ายกว่า
ค่าส่วนเบี่ยงเบนมาตรฐาน (SD) ของตัวอย่างนิยามไว้สำหรับกรณีที่ n ≥ 2 หากจำนวนตัวอย่างมีค่าน้อยกว่าประมาณ n = 30 ควรพิจารณาการรายงานช่วงความเชื่อมั่นรอบค่า SD หรือใช้วิธีการอื่นที่มีความทนทานมากกว่า
ค่าส่วนเบี่ยงเบนมาตรฐาน (SD) ยังคงถูกนิยามไว้ โดยสำหรับค่าสัดส่วน p จะมี SD = √(p × (1 − p)) ส่วนในกลุ่มตัวอย่างที่ประกอบด้วยข้อมูลที่มีค่าเท่ากับ 1 ร้อยละ 60 ค่า SD จะเท่ากับ √(0.6 × 0.4) ≈ 0.49 ไม่ว่าจำนวนข้อมูลจะเท่าใดก็ตาม