Macam-macam Missing Value
Missing Value adalah hilangnya beberapa data yang telah diperoleh. salah satu alasan terjadinya missing value adalah tidak terkumpulnya beberapa informasi. Misalnya : beberapa orang menolak untuk mengisi data berat badan, pendapatan bulanan, keterangan usia, dll. Cara-cara untuk mengatasi missing value antara lain menghilangkan beberapa data, membuat perkiraan data yang hilang menggunakan nilai mean (data yang normal) atau nilai median (data yang tidak normal), mengabaikan data yang missing, dll.
Ada tiga jenis missing value yaitu Missing Completely at Random (MCAR), Missing at Random (MAR), dan Not Missing at Rnadom (NMAR)
MCAR adalah jenis missing value dimana distribusi data yang hilang tidak tergantung pada data pengamatan atau data missing value. Metode yang digunakan untuk mengatasi missing value antara lain Listwise, Pairwise, dan Estimasi Regresi.
Contoh : Data yang diambil dari partisipan yang menggunakan koin uang untuk mengisi survey yang berisikan jawaban ya atau tidak.
MAR adalah jenis missing value dimana distribusi data yang hilang tergantung pada data pengamatan, tetapi tidak tergantung data missing value. Metode yang digunakan untuk mengatasi jenis missing value ini adalah estimasi EM.
Contoh : Partisipan perempuan kebanyakan tidak mengisi survey yang berisikan mengenai berat badannya.
NMAR adalah jenis missing value dimana distribusi data yang hilang tergantung pada data missing value. Tidak ada metode yang tepat untuk mengatasi jenis missing value ini.
Contoh : Peserta yang mengisi survei tiba-tiba menghilang.
Metode lain yang dapat digunakan untuk mengatasi missing value antara lain :
Hot Deck : nilai imputasi yang diambil dari himpunan nilai observasi yang memiliki kemiripan dengan observasi yang mempunyai missing value.
Cold Deck : nilai imputasi diambil dari hasil survey pada periode sebelumnya atau berdasarkan informasi lainnya.
Ada tiga jenis missing value yaitu Missing Completely at Random (MCAR), Missing at Random (MAR), dan Not Missing at Rnadom (NMAR)
MCAR adalah jenis missing value dimana distribusi data yang hilang tidak tergantung pada data pengamatan atau data missing value. Metode yang digunakan untuk mengatasi missing value antara lain Listwise, Pairwise, dan Estimasi Regresi.
Contoh : Data yang diambil dari partisipan yang menggunakan koin uang untuk mengisi survey yang berisikan jawaban ya atau tidak.
MAR adalah jenis missing value dimana distribusi data yang hilang tergantung pada data pengamatan, tetapi tidak tergantung data missing value. Metode yang digunakan untuk mengatasi jenis missing value ini adalah estimasi EM.
Contoh : Partisipan perempuan kebanyakan tidak mengisi survey yang berisikan mengenai berat badannya.
NMAR adalah jenis missing value dimana distribusi data yang hilang tergantung pada data missing value. Tidak ada metode yang tepat untuk mengatasi jenis missing value ini.
Contoh : Peserta yang mengisi survei tiba-tiba menghilang.
Metode lain yang dapat digunakan untuk mengatasi missing value antara lain :
Hot Deck : nilai imputasi yang diambil dari himpunan nilai observasi yang memiliki kemiripan dengan observasi yang mempunyai missing value.
Cold Deck : nilai imputasi diambil dari hasil survey pada periode sebelumnya atau berdasarkan informasi lainnya.
No.
BalasHapusSoal
Data berikut adalah data hasil kuis yang didapat oleh 5 mahasiswa untuk 4 mata kuliah, yaitu Matematika, Statistika, Bahasa Inggris, Bahasa Indonesia:
Nama Mahasiswa
Nilai Kuis
Matematika
Statistika
Bahasa Inggris
Bahasa Indonesia
Andi
75
70
78
77
74
72
79
79
72
73
76
80
Diah
79
85
82
80
77
87
80
83
78
88
81
81
Hendra
70
74
81
76
71
76
84
75
72
77
83
73
Sinta
55
54
53
54
54
53
50
50
53
56
52
53
Yanti
80
84
82
83
82
83
81
82
84
81
85
80
Gunakan untuk melakukan:
Uji hipotesis bahwa kelima mahasiswa mempunyai kemampuan yang berbeda.
Uji hipotesis bahwa keempat mata kuliah tersebut memiliki tingkat kesukaran yang berbeda.
Uji hipotesis bahwa tidak ada interaksi antara mahasiswa dan mata kuliah.
Dua panel, yang satu seluruhnya terdiri dari pria dan yang satu lagi seluruhnya terdiri dari perempuan diminta oleh customer-testing agency untuk menentukan peringkat delapan macam minuman cola berdasarkan rasanya. Peringkat 1 diberikan pada minuman cola paling enak dan peringkat 8 diberikan pada minuman cola paling tidak enak. Tujuan dari studi ini adalah untuk mengetahui apakah ada hubungan antara pria dan perempuan dalam hal rasa minuman cola yang disukai. Hasil peringkat kedua panel tersebut terhadap delapan macam minuman cola adalah sebagai berikut:
Merk Minuman Cola
Panel Pria
Panel Perempuan
Glatz Cola
8
7
Bluebell Cola
6
5
Sentul Cola
2
4
Coca Cola
1
2
Pearl Cola
3
1
Red Cola
4
3
Boca Cola
5
6
Krolla Cola
7
8
Apakah ada hubungan antara peringkat rasa minuman cola dari panel pria dan peringkat rasa minuman cola dari panel perempuan? Apakah hubungan tersebut signifikan? Gunakan .
Seorang profesor yang mengajar statistika ingin melakukan investigasi terhadap harga textbook yang dijual di toko buku kampus dan yang dijual di toko buku online. Profesor tersebut memilih secara acak 12 textbook yang diperlukan untuk kuliah tahun pertama dan membandingkan harga antara toko buku kampus dan toko buku online. Data sampel acak ke-12 harga textbook pada kedua toko buku adalah sebagai berikut:
Textbook
Harga (dalam US$)
Toko buku kampus
Toko buku online
1
85,00
80,95
2
77,50
75,75
3
80,50
80,95
4
68,95
68,50
5
88,70
86,25
6
79,90
75,95
7
69,95
70,25
8
71,50
69,95
9
72,25
73,00
10
74,95
72,25
11
75,95
74,00
12
86,95
85,60
Bila diasumsikan harga textbook di kedua toko buku tersebut terdistribusi normal, apakah data di atas menunjukkan bahwa harga textbook di toko buku online rata-rata lebih murah dibandingkan dengan harga di toko buku kampus?
Seorang pendidik percaya bahwa directed reading activities di dalam kelas akan membantu murid-murid SD memperbaiki beberapa aspek kemampuan membaca. Untuk menguji hipotesis ini, 21 murid SD berpartisipasi dalam directed reading activities selama 8 minggu. Kemudian murid-murid SD yang berpartisipasi dalam directed reading activities tersebut diuji dengan Degree of Reading Power (DRP) test, yang mengukur aspek-aspek kemampuan membaca. Data yang didapat adalah sebagai berikut:
Skor DRP murid SD yang berpartisipasi dalam directed reading activities
24
43
58
71
43
49
61
44
67
49
53
56
59
52
62
54
57
33
46
43
57
Apakah data kelompok murid SD yang berpartisipasi dalam directed reading activities tersebut berasal dari populasi yang terdistribusi normal? Gunakan .