วิธีการคำนวณค่าผิดปกติ

ผู้เขียน: Mike Robinson
วันที่สร้าง: 13 กันยายน 2021
วันที่อัปเดต: 7 พฤษภาคม 2024
Anonim
ค่าผิดปกติ outlier | Excel
วิดีโอ: ค่าผิดปกติ outlier | Excel

เนื้อหา

ค่าผิดปกติคือข้อมูลเชิงสังเกตที่มีความแตกต่างกันอย่างมากในแง่ตัวเลขจากการสังเกตอื่น ๆ ในตัวอย่าง คำนี้ใช้ในการศึกษาทางสถิติและสามารถชี้ให้เห็นถึงความผิดปกติของชุดข้อมูลหรือข้อผิดพลาดในการวัดที่ดำเนินการ การรู้วิธีคำนวณค่าผิดปกติเป็นสิ่งสำคัญเพื่อให้แน่ใจว่ามีความเข้าใจข้อมูลอย่างเพียงพอและจะนำไปสู่ข้อสรุปที่ถูกต้องมากขึ้นจากการศึกษา มีกระบวนการที่ง่ายมากในการคำนวณตามชุดการสังเกตที่กำหนด

ขั้นตอน

  1. เรียนรู้ที่จะยอมรับสิ่งผิดปกติที่อาจเกิดขึ้น ก่อนที่จะคำนวณว่าข้อมูลเชิงสังเกตแสดงถึงค่าผิดปกติหรือไม่ควรตรวจสอบชุดข้อมูลและรับรู้ค่าผิดปกติที่อาจเกิดขึ้นได้เสมอ ตัวอย่างเช่นพิจารณาชุดข้อมูลที่แสดงอุณหภูมิของวัตถุ 12 ชิ้นที่แตกต่างกันในห้อง หากวัตถุ 11 ชิ้นมีอุณหภูมิประมาณ21º C แต่วัตถุที่สิบสอง (อาจเป็นเตาอบ) มีอุณหภูมิ150º C การตรวจสอบอย่างรวดเร็วอาจบอกได้ว่าเตาอบเป็นค่าผิดปกติ

  2. จัดระเบียบข้อมูลเชิงสังเกตจากน้อยที่สุดไปหามากที่สุด จากตัวอย่างด้านบนให้พิจารณาชุดข้อมูลต่อไปนี้ที่แสดงอุณหภูมิของวัตถุต่างๆ: {22, 21, 24, 21, 21, 20, 21, 23, 22, 150, 22, 20} ควรกระจายชุดนี้เป็น: {20, 20, 21, 21, 21, 21, 22, 22, 22, 23, 24, 150}

  3. คำนวณค่ามัธยฐานของชุดข้อมูล ค่ามัธยฐานคือข้อมูลเชิงสังเกตที่อยู่เหนือครึ่งล่างของข้อมูลและด้านล่างครึ่งบน หากชุดข้อมูลมีข้อสังเกตเป็นเลขคู่คำกลางสองคำจะต้องถูกนำมารวมกัน ในตัวอย่างข้างต้นคำกลางสองคำคือ 21 และ 22 ดังนั้นค่ามัธยฐานจึงเป็น ((21 + 22) / 2) หรือ 21.5

  4. คำนวณควอไทล์ล่าง จุดนี้เรียกว่า Q1 เป็นข้อมูลเชิงสังเกตที่อยู่ต่ำกว่า 25% ของการสังเกตการณ์ ในตัวอย่างข้างต้นจะต้องนำคำศัพท์ 2 คำมารวมกันอีกครั้งคราวนี้เป็น 21 และ 21 ค่าเฉลี่ยของทั้งสองจะเป็น ((21 + 21) / 2) หรือ 21
  5. คำนวณควอร์ไทล์บน จุดนี้เรียกว่า Q3 เป็นข้อมูลเชิงสังเกตที่อยู่สูงกว่า 25% ของการสังเกตการณ์ ต่อด้วยตัวอย่างของเราค่าเฉลี่ยของสองลูกเต๋า 22 และ 23 นำไปสู่ ​​Q3 ซึ่งก็คือ 22.5
  6. ค้นหา“ อุปสรรคภายใน” ในชุดข้อมูล ขั้นตอนแรกคือการคูณความแตกต่างระหว่าง Q1 และ Q3 (เรียกว่าช่วงระหว่างควอไทล์) ด้วย 1.5 ในตัวอย่างข้างต้นช่วงระหว่างควอไทล์คือ (22.5 - 21) นั่นคือ 1.5 การคูณค่านี้ด้วย 1.5 ให้ผล 2.25 เพิ่มตัวเลขนี้ลงใน Q3 และลบออกจาก Q1 เพื่อสร้างอุปสรรค ในตัวอย่างนี้อุปสรรคภายในด้านบนและด้านล่างจะเป็น 24.75 และ 18.75
    • ข้อมูลเชิงสังเกตทั้งหมดที่อยู่นอกช่วงนี้ถือเป็นค่าผิดปกติระดับปานกลาง ในข้อมูลที่กำหนดในตัวอย่างนี้เฉพาะอุณหภูมิเตาอบ (150º C) เท่านั้นที่ถือว่าเป็นค่าผิดปกติในระดับปานกลาง
  7. ค้นหา“ อุปสรรคภายนอก” ในชุดข้อมูล สิ่งนี้ทำในลักษณะเดียวกับอุปสรรคภายในยกเว้นว่าช่วงระหว่างควอไทล์จะคูณด้วย 3 แทนที่จะเป็น 1.5 เมื่อคูณช่วงอินเตอร์ควอไทล์ด้านบนด้วย 3 เรามี (1.5 * 3) หรือ 4.5 ดังนั้นอุปสรรคภายนอกทั้งบนและล่างคือ 27 และ 16.5
    • ค่าการสังเกตใด ๆ ที่อยู่นอกอุปสรรคภายนอกถือเป็นค่าผิดปกติอย่างยิ่ง ในตัวอย่างนี้อุณหภูมิเตาอบ150º C ก็เป็นค่าที่ผิดปกติมากเช่นกัน

เคล็ดลับ

  • เมื่อพบสิ่งผิดปกติให้พยายามอธิบายการมีอยู่ของพวกเขาก่อนที่จะทิ้งมันออกจากชุดข้อมูล พวกเขาสามารถชี้ไปที่ข้อผิดพลาดในการวัดหรือความผิดปกติในการกระจาย

วัสดุที่จำเป็น

  • เครื่องคิดเลข

คุณสงสัยว่ามีใครบางคนเข้ามาในตัวคุณ แต่ต้องการความแน่ใจหรือไม่? โปรดจำไว้ว่าอาจเป็นเรื่องยากที่จะรู้อย่างแน่นอนโดยไม่ต้องถามเจ้าตัวโดยตรง อย่างไรก็ตามมีหลายวิธีในการทำความเข้าใจว่ามีคนสนใจคุณมากแค่ไหน...

การใช้ Adobe Illutrator ทำให้สามารถวางข้อความรอบ ๆ วัตถุได้โดยไม่คำนึงถึงประเภทของวัตถุ อาจเป็นวงกลมดวงดาวหรือสายฟ้าก็ได้ นอกจากนี้ยังสามารถวางข้อความไว้รอบ ๆ ภาพถ่ายภาพวาดและภาพอื่น ๆ ที่นำเข้าได้ ทำ...

โพสต์ที่น่าสนใจ