Postingan

Menampilkan postingan dari Mei, 2017

Macam-macam Missing Value

Gambar
Missing Value adalah hilangnya beberapa data yang telah diperoleh. salah satu alasan terjadinya missing value adalah tidak terkumpulnya beberapa informasi. Misalnya : beberapa orang menolak untuk mengisi data berat badan, pendapatan bulanan, keterangan usia, dll. Cara-cara untuk mengatasi missing value antara lain menghilangkan beberapa data, membuat perkiraan data yang hilang menggunakan nilai mean (data yang normal) atau nilai median (data yang tidak normal), mengabaikan data yang missing , dll. Ada tiga jenis missing value yaitu Missing Completely at Random (MCAR), Missing at Random (MAR), dan Not Missing at Rnadom (NMAR)  MCAR adalah jenis missing value dimana distribusi data yang hilang tidak tergantung pada data pengamatan atau data missing value . Metode yang digunakan untuk mengatasi missing value antara lain Listwise, Pairwise, dan Estimasi Regresi. Contoh : Data yang diambil dari partisipan yang menggunakan koin uang untuk mengisi survey yang berisikan jawaban ya atau

Apa itu Analisis Data Eksploratif ?

Gambar
EDA atau Analisis Ekspolasi Data adalah suatu pendekatan yang digunakan untuk menganalisis data menggunakan berbagai teknik khususnya secara grafis. Tujuannya adalah memaksimalkan wawasan dari sekumpulan data yang ada, mendeteksi outlier dan anomali data, untuk mengenali struktur dasar data, mengekstrak variabel yang dianggap penting, menguji asumsi dasar dari data, dan dapat mengembangkan parsimonious dari model. Terdapat perbedaan langkah dalam melakukan analisis data secara klasik, eksplorasi, maupun secara bayesian.  Klasik : masalah -> data -> model -> analisis -> kesimpulan Eksplorasi : masalah -> analisis -> model -> kesimpulan  Bayesian : masalah -> data -> model ->prior distribusi -> analisis -> kesimpulan  Dalam EDA ada beberapa hal yang harus diketahui pada data yang sudah terkumpul antara lain distribusi datanya apakah simetris, normal, atau skewness, masalah pada kualitas data, apakah ada outlier, dan masalah korelasi dan inter