BREAKING NEWS

Informatika

Minggu, 25 Juli 2021

Conditional Probability & Multiplication Rule - PART 11

Conditional Probability adalah probabilitas kemunculan suatu event, dengan mengetahui bahwa event lain sudah muncul atau terjadi.

Contoh :

Dua buah kartu diambil secara berurutan dari setumpuk playing cards (terdiri dari 52 kartu).


Berapa probability untuk kartu kedua yang diambil adalah Queen (B) bila diketahui bahwa kartu pertama yang diambil adalah King (A)? (asumsikan kartu pertama tidak dikembalikan ke dalam tumpukan kartu)

P(B|A)=\frac{4}{51}\approx0.078


Independent Events

Dua events adalah independent bila kemunculan dari event yang satu tidak mempengaruhi probability kemunculan event kedua.

P(B|A)=P(B)

P(A|B)=P(A)


Dependent Events

Events yang tidak independent dikenal sebagai dependent events.

P(B|A) \ne P(B)


The Multiplication Rule

Probability untuk dua buah events (A dan B) untuk muncul secara berurutan:

P(A\ and\ B)=P(A).P(B|A)

Bilamana kedua events (A dan B) tersebut independent, maka bisa disederhanakan menjadi:

P(A\ and\ B)=P(A).P(B)

Contoh :

Dua buah kartu diambil (without replacement) dari tumpukan playing cards (terdiri dari 52 kartu). 

Berapakah probability untuk mendapatkan kartu King lalu diikuti kartu Queen?


\begin{equation} 
\begin{split}
P(K\ and\ Q) &= P(K).P(Q|K)\\
&= \frac{4}{52} . \frac{4}{51}\\
&= \frac{16}{2652} \approx 0.006
\end{split}
\end{equation}

Konsep Dasar Probability & Counting - PART 10

Probability adalah pengukuran terhadap suatu kemungkinan atau peluang.

Pemahaman terkait probability merupakan dasar untuk melangkah ke Statistika Inferensi (Inferential Statistics).

1. Terminologi
  • Hasil dari suatu percobaan (trial) dikenal sebagai outcome.
  • Himpunan dari seluruh kemungkinan outcome pada suatu probability experiment dikenal sebagai sample space.
  • Bagian dari sample space dikenal sebagai event.
  • Event bisa terdiri dari satu atau lebih outcomes.
2. Probability Experiments

Probability Experiments adalah aksi atau percobaan (trial) yang menghasilkan suatu perhitungan, pengukuran, atau respon (counts, measurements, or responses).

3. Tree Diagram


Tree Diagram digunakan untuk memberikan gambaran secara visual terkait setiap outcome dari suatu probability experiment.

 contoh :

4.  Event
  • Event umumnya direpresentasikan dengan huruf kapital (uppercase letters), seperti A, B, dan C.
  • Suatu event yang terdiri dari sebuah outcome dikenal sebagai simple event.
5. Fundamental Counting Principle
  • Pemanfaatan Tree Diagram untuk menghitung banyaknya outcome dari sejumlah event tidaklah praktis.
  • Sebagai alternatif, kita bisa memanfaatkan Fundamental Counting Principle untuk mengetahui jumlah kemungkinan outcomes dari dua atau lebih event yang muncul secara berurutan.



Types of Probability
  • Probability dapat dituliskan dalam format pecahan, desimal, atau persentase.
  • Probability untuk kemunculan event E dapat dituliskan sebagai P(E)

Terdapat 3 tipe probability:

  • Classical (theoretical) Probability

  • Empirical (statistical) Probability

  • Subjective Probability


Classical (theoretical) Probability

Classical Probability digunakan ketika setiap outcome pada sample space memiliki peluang yang sama untuk muncul.


Empirical (statistical) Probability

Empirical Probability didasarkan pada observasi dari probability experiments.

Law of Large Number

Ketika suatu probability experiment dilakukan secara berulang-ulang, maka nilai empirical probability yang dihasilkan akan mendekati nilai theoretical probability dari event terkait.

Subjective Probability

Subjective Probability didasarkan pada intuisi, educated guesses, dan estimasi.

Contoh:

  • Seorang dokter memberikan estimasi keberhasilan dari proses operasi yang ditanganinya sebesar 90%.

  • Seorang mahasiswa merasa yakin bahwa peluangnya untuk lulus di matakuliah statistika adalah 70%.

Range of Probability

Probability dari suatu event E akan memiliki jangkauan antara 0 sampai dengan 1.



Complementary Events

Complement dari event E adalah semua oucomes pada sample space yang tidak disertakan pada event E Complement dari event E direpresentasikan sebagai

 E^{'}



contoh :

   

Pada pelemparan sebuah dadu enam sisi, E adalah event mendapatkan angka setidaknya 5



Pengukuran Sebaran Data - PART 8

Measure of Position dapat didefinisikan sebagai suatu pengukuran nilai yang digunakan untuk menentukan posisi relatif dari suatu entri data (data point) pada dataset.

  • Quartile
  • Percentile
  • Standard Score

1. Quartile

Quartile adalah nilai yang membagi suatu dataset terurut menjadi empat bagian yang sama. 

Terdapat tiga nilai quartile, yaitu: Q1, Q2, dan Q3

Contoh :

Interpretasi:

  • Terdapat ¼ propinsi dengan jumlah pabrik 9 atau kurang
  • Terdapat ½ propinsi dengan jumlah pabrik 16 atau kurang
  • Terdapat ¾ propinsi dengan jumlah pabrik 33 atau kurang
Interquartile Range (IQR)
Interquartile Range (IQR) adalah measure of Variation (pengukuran keberagaman/sebaran data) dengan menselisihkan nilai quartile ketiga dan quartile pertama.


Deteksi Outlier dengan IQR

Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:

  • Lebih kecil dari Q1-1.5(IQR) 
  • Lebih besar dari Q3+1.5(IQR)

Box and Whisker Plot (Box Plot)


2. Percentile (Persentil)

Percentile adalah nilai yang membagi suatu dataset terurut menjadi 100 bagian yang sama. 

Terdapat 99 nilai percentaile, yaitu: P1, P2, , P99

  • P25 menunjuk posisi yang sama dengan Q1
  • P50 menunjuk posisi yang sama dengan Q2
  • P75 menunjuk posisi yang sama dengan Q3
Deteksi Outlier dengan Percentile
Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:
  • Lebih kecil dari P5 
  • Lebih besar dari P95
3. Standard Score (z-score)
Standard Score (z-score) merepresentasikan nilai simpangan suatu entri data terhadap mean dari dataset yang diukur berdasarkan standard deviation.

Nilai z-score bisa negatif, positif, atau nol.







Deteksi Outlier dengan Standard Score (Z-Score)




Standard Score (z-score)
contoh :




Sabtu, 24 Juli 2021

Measure of Central Tendency dalam Statistika - PART 7

Measure of Central Tendency dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan nilai tipikal atau sentral dari suatu dataset.

  • Mean
  • Median
  • Mode
1. Mean
Mean dari suatu dataset merupakan penjumlahan dari keseluruhan entri pada dataset dibagi dengan banyaknya entri pada dataset tersebut.

Population Mean









Sampel Mean




2.  Median

Median dari suatu dataset merupakan nilai yang berada di tengah dengan mengacu pada nilai dataset yang sudah terurut. 

  • Untuk dataset dengan jumlah entri ganjil, nilai median dapat diperoleh dari nilai yang tepat berada di tengah.

  • Untuk dataset dengan jumlah entri genap, nilai median diperoleh dari rerata dua nilai yang berada di tengah.


Sorted Sample Data








3. Mode
Mode dari suatu dataset merupakan nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi.
  • Suatu dataset dapat memiliki lebih dari satu mode (multi-modal).

  • Suatu dataset juga bisa saja tidak memiliki mode, ketika frekuensi kemunculan dari tiap datanya sama.


Sorted Sample Data



Kelebihan dan Kekurangan Mean

  • Mean cukup bisa diandalkan karena mean memperhitungkan setiap entri dari dataset yang kita miliki.

  • Mean sangat rentan terhadap outlier.

  • Median bisa dijadikan alternatif bilamana terdapat outlier pada dataset.


Weighted Mean

Weighted Mean adalah nilai rerata dari suatu dataset di mana setiap entrinya memiliki bobot tertentu.











Weighted Mean: contoh
 

Komponen

Penilaian

Nilai (x)

Bobot (w)

x.w

UTS

73

0.25

18.25

UAS

87

0.20

17.40

Tugas 1

94

0.25

23.50

Tugas 2

72

0.30

21.60

TOTAL

1.00

80.75


Weighted mean = 80.75 / 1.00 

                           = 80.75





















Visualisasi Data dalam Statistika - PART 6

 Beberapa teknik visualisasi data yang akan dipelajari:

  • Stem and Leaf Plot

  • Dot Plot

  • Pie Chart

  • Bar Plot

  • Scatter Plot

  • Time Series Chart

  • Visualisasi Data dengan Python



Stem and Leaf Plot [1/2]


Stem and Leaf Plot [2/2]


Dot Plot


Pie Chart


Bar Plot


Scatter Plot



Time Series Chart


Visualisasi Data dengan Python







 
Copyright © 2014 Armelia Luvita. Designed by OddThemes