Macam-macam Missing Value

Missing Value adalah hilangnya beberapa data yang telah diperoleh. salah satu alasan terjadinya missing value adalah tidak terkumpulnya beberapa informasi. Misalnya : beberapa orang menolak untuk mengisi data berat badan, pendapatan bulanan, keterangan usia, dll. Cara-cara untuk mengatasi missing value antara lain menghilangkan beberapa data, membuat perkiraan data yang hilang menggunakan nilai mean (data yang normal) atau nilai median (data yang tidak normal), mengabaikan data yang missing, dll.

Ada tiga jenis missing value yaitu Missing Completely at Random (MCAR), Missing at Random (MAR), dan Not Missing at Rnadom (NMAR) 

MCAR adalah jenis missing value dimana distribusi data yang hilang tidak tergantung pada data pengamatan atau data missing value. Metode yang digunakan untuk mengatasi missing value antara lain Listwise, Pairwise, dan Estimasi Regresi.
Contoh : Data yang diambil dari partisipan yang menggunakan koin uang untuk mengisi survey yang berisikan jawaban ya atau tidak.

MAR adalah jenis missing value dimana distribusi data yang hilang tergantung pada data pengamatan, tetapi tidak tergantung data missing value. Metode yang digunakan untuk mengatasi jenis missing value ini adalah estimasi EM.
Contoh : Partisipan perempuan kebanyakan tidak mengisi survey yang berisikan mengenai berat badannya.

NMAR adalah jenis missing value dimana distribusi data yang hilang tergantung pada data missing value. Tidak ada metode yang tepat untuk mengatasi jenis missing value ini.
Contoh : Peserta yang mengisi survei tiba-tiba menghilang.

Metode lain yang dapat digunakan untuk mengatasi missing value antara lain :
Hot Deck : nilai imputasi yang diambil dari himpunan nilai observasi yang memiliki kemiripan dengan observasi yang mempunyai missing value.
Cold Deck : nilai imputasi diambil dari hasil survey pada periode sebelumnya atau berdasarkan informasi lainnya. 

Komentar

  1. No.
    Soal


    Data berikut adalah data hasil kuis yang didapat oleh 5 mahasiswa untuk 4 mata kuliah, yaitu Matematika, Statistika, Bahasa Inggris, Bahasa Indonesia:
    Nama Mahasiswa
    Nilai Kuis


    Matematika
    Statistika
    Bahasa Inggris
    Bahasa Indonesia

    Andi
    75
    70
    78
    77


    74
    72
    79
    79


    72
    73
    76
    80

    Diah
    79
    85
    82
    80


    77
    87
    80
    83


    78
    88
    81
    81

    Hendra
    70
    74
    81
    76


    71
    76
    84
    75


    72
    77
    83
    73

    Sinta
    55
    54
    53
    54


    54
    53
    50
    50


    53
    56
    52
    53

    Yanti
    80
    84
    82
    83


    82
    83
    81
    82


    84
    81
    85
    80

    Gunakan untuk melakukan:
    Uji hipotesis bahwa kelima mahasiswa mempunyai kemampuan yang berbeda.
    Uji hipotesis bahwa keempat mata kuliah tersebut memiliki tingkat kesukaran yang berbeda.
    Uji hipotesis bahwa tidak ada interaksi antara mahasiswa dan mata kuliah.


    Dua panel, yang satu seluruhnya terdiri dari pria dan yang satu lagi seluruhnya terdiri dari perempuan diminta oleh customer-testing agency untuk menentukan peringkat delapan macam minuman cola berdasarkan rasanya. Peringkat 1 diberikan pada minuman cola paling enak dan peringkat 8 diberikan pada minuman cola paling tidak enak. Tujuan dari studi ini adalah untuk mengetahui apakah ada hubungan antara pria dan perempuan dalam hal rasa minuman cola yang disukai. Hasil peringkat kedua panel tersebut terhadap delapan macam minuman cola adalah sebagai berikut:
    Merk Minuman Cola
    Panel Pria
    Panel Perempuan

    Glatz Cola
    8
    7

    Bluebell Cola
    6
    5

    Sentul Cola
    2
    4

    Coca Cola
    1
    2

    Pearl Cola
    3
    1

    Red Cola
    4
    3

    Boca Cola
    5
    6

    Krolla Cola
    7
    8

    Apakah ada hubungan antara peringkat rasa minuman cola dari panel pria dan peringkat rasa minuman cola dari panel perempuan? Apakah hubungan tersebut signifikan? Gunakan .


    Seorang profesor yang mengajar statistika ingin melakukan investigasi terhadap harga textbook yang dijual di toko buku kampus dan yang dijual di toko buku online. Profesor tersebut memilih secara acak 12 textbook yang diperlukan untuk kuliah tahun pertama dan membandingkan harga antara toko buku kampus dan toko buku online. Data sampel acak ke-12 harga textbook pada kedua toko buku adalah sebagai berikut:
    Textbook
    Harga (dalam US$)


    Toko buku kampus
    Toko buku online

    1
    85,00
    80,95

    2
    77,50
    75,75

    3
    80,50
    80,95

    4
    68,95
    68,50

    5
    88,70
    86,25

    6
    79,90
    75,95

    7
    69,95
    70,25

    8
    71,50
    69,95

    9
    72,25
    73,00

    10
    74,95
    72,25

    11
    75,95
    74,00

    12
    86,95
    85,60

    Bila diasumsikan harga textbook di kedua toko buku tersebut terdistribusi normal, apakah data di atas menunjukkan bahwa harga textbook di toko buku online rata-rata lebih murah dibandingkan dengan harga di toko buku kampus?


    Seorang pendidik percaya bahwa directed reading activities di dalam kelas akan membantu murid-murid SD memperbaiki beberapa aspek kemampuan membaca. Untuk menguji hipotesis ini, 21 murid SD berpartisipasi dalam directed reading activities selama 8 minggu. Kemudian murid-murid SD yang berpartisipasi dalam directed reading activities tersebut diuji dengan Degree of Reading Power (DRP) test, yang mengukur aspek-aspek kemampuan membaca. Data yang didapat adalah sebagai berikut:
    Skor DRP murid SD yang berpartisipasi dalam directed reading activities

    24

    43

    58

    71

    43

    49

    61

    44

    67

    49

    53

    56

    59

    52

    62

    54

    57

    33

    46

    43

    57

    Apakah data kelompok murid SD yang berpartisipasi dalam directed reading activities tersebut berasal dari populasi yang terdistribusi normal? Gunakan .

    BalasHapus

Posting Komentar

Postingan populer dari blog ini

Uji Asumsi Residual