BREAKING NEWS

Informatika

Minggu, 25 Juli 2021

Pengukuran Sebaran Data - PART 8

Measure of Position dapat didefinisikan sebagai suatu pengukuran nilai yang digunakan untuk menentukan posisi relatif dari suatu entri data (data point) pada dataset.

  • Quartile
  • Percentile
  • Standard Score

1. Quartile

Quartile adalah nilai yang membagi suatu dataset terurut menjadi empat bagian yang sama. 

Terdapat tiga nilai quartile, yaitu: Q1, Q2, dan Q3

Contoh :

Interpretasi:

  • Terdapat ¼ propinsi dengan jumlah pabrik 9 atau kurang
  • Terdapat ½ propinsi dengan jumlah pabrik 16 atau kurang
  • Terdapat ¾ propinsi dengan jumlah pabrik 33 atau kurang
Interquartile Range (IQR)
Interquartile Range (IQR) adalah measure of Variation (pengukuran keberagaman/sebaran data) dengan menselisihkan nilai quartile ketiga dan quartile pertama.


Deteksi Outlier dengan IQR

Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:

  • Lebih kecil dari Q1-1.5(IQR) 
  • Lebih besar dari Q3+1.5(IQR)

Box and Whisker Plot (Box Plot)


2. Percentile (Persentil)

Percentile adalah nilai yang membagi suatu dataset terurut menjadi 100 bagian yang sama. 

Terdapat 99 nilai percentaile, yaitu: P1, P2, , P99

  • P25 menunjuk posisi yang sama dengan Q1
  • P50 menunjuk posisi yang sama dengan Q2
  • P75 menunjuk posisi yang sama dengan Q3
Deteksi Outlier dengan Percentile
Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:
  • Lebih kecil dari P5 
  • Lebih besar dari P95
3. Standard Score (z-score)
Standard Score (z-score) merepresentasikan nilai simpangan suatu entri data terhadap mean dari dataset yang diukur berdasarkan standard deviation.

Nilai z-score bisa negatif, positif, atau nol.







Deteksi Outlier dengan Standard Score (Z-Score)




Standard Score (z-score)
contoh :




Share this:

Posting Komentar

 
Copyright © 2014 Armelia Luvita. Designed by OddThemes