Apa itu Analisis Data Eksploratif ?


EDA atau Analisis Ekspolasi Data adalah suatu pendekatan yang digunakan untuk menganalisis data menggunakan berbagai teknik khususnya secara grafis. Tujuannya adalah memaksimalkan wawasan dari sekumpulan data yang ada, mendeteksi outlier dan anomali data, untuk mengenali struktur dasar data, mengekstrak variabel yang dianggap penting, menguji asumsi dasar dari data, dan dapat mengembangkan parsimonious dari model.

Terdapat perbedaan langkah dalam melakukan analisis data secara klasik, eksplorasi, maupun secara bayesian. 
Klasik : masalah -> data -> model -> analisis -> kesimpulan
Eksplorasi : masalah -> analisis -> model -> kesimpulan 
Bayesian : masalah -> data -> model ->prior distribusi -> analisis -> kesimpulan 

Dalam EDA ada beberapa hal yang harus diketahui pada data yang sudah terkumpul antara lain distribusi datanya apakah simetris, normal, atau skewness, masalah pada kualitas data, apakah ada outlier, dan masalah korelasi dan interkorelasi. 

Salah satu EDA yang dapat digunakan untuk variabel yang tunggal adalah "Histogram". Histogram ini dapat menunjukkan nilai tengah atau rata-rata dan varians dari data, serta untuk melihat apakah ada data yang outlier dan bernilai nol.   

Komentar

Postingan populer dari blog ini

Uji Asumsi Residual