Data Berdistribusi Tidak Normal

Cara Mengatasi Data Berdistribusi Tidak Normal

Ketika kita hendak melakukan analisis statistik parametrik, seperti melakukan uji korelasi product moment, salah satu asumsi yang harus dipenuhi adalah distribusi data kita normal. Oleh karena itu sebelum melakukan analisis statistik parametrik, terlebih dahulu kita harus melihat apakah data kita terdistribusi normal atau tidak. Bagaimana cara untuk melihat data kita normal atau tidak? Berikut akan diberikan contoh penelitian fiktif tentang “Hubungan antara Pelayanan Istri dengan Kepuasan Suami”. Data fiktif dapat didownload disini

Uji Normalitas di SPSS

Data yang akan kita gunakan adalah data kepuasan.sav. Sebelum menguji hipotesis kita yakni “ada hubungan antara pelayanan istri dengan kepuasan suami”, maka kita uji terlebih dahulu normalitas data kepuasan dan pelayanan kita. Ada berbagai cara untuk menguji normalitas di SPSS, seperti dengan melihat histogram dan nilai skewness dan kurtosis serta dengan uji kolmogorov-smirnov.  Contoh kali ini kita akan menggunakan uji kolmogorov-smirnov. Uji normalitas dengan kolmogorov-smirnov dilakukan dengan membandingkan distribusi empirik data kita dengan distribusi normal yang diharapkan. Karena merupakan uj beda, maka nilai p yang diharapkan adalah yang tidak signifikan, yakni p>0,05. Hal ini menunjukkan bahwa tidak ada perbedaan antara kedua distribusi itu, yang berarti distribusi data empirik kita adalah normal. Untuk menguji normalitas di SPSS dapat dilakukan melalui menu analyze – nonparametric test – legacy dialogs – sample K-S.

normalitas1

 Jika sudah, pindahkan kedua variabel pelayanan dan kepuasan ke kotak sebelah kanan, kemudian tekan OK. Berikut adalah output dari analisis kita. 

normal2

Dari output tersebut dapat kita lihat, variabel pelayanan memiliki nilai kolmogorov-smirnov Z sebesar 1,277 dan p=0,077 (p>0,05), dengan demikian tidak ada perbedaan antara distribusi empirik data kita dengan distribusi normal ideal, oleh karena itu distribusi data variabel pelayanan normal. Sedangkan pada variabelkepuasan memiliki nilai kolmogorov-smirnov Z sebesar 1,447 dan p=0,030 (p<0,05), dengan demikian ada perbedaan antara distribusi empirik data kita dengan distribusi normal ideal, oleh karena itu distribusi data variabel kepuasan tidak normal. Lalu bagaimana kita memperlakukan data yang tidak normal kita? Ada beberapa cara yang bisa dilakukan untuk mengatasi data yang tidak normal tersebut.

Membuang outliers

Salah satu alasan mengapa data kita tidak normal adalah adanya outliers. Outliers adalah data yang memiliki skor ekstrem, baik ekstrem tinggi maupun ekstrem rendah. Adanya outliers dapat membuat distribusi skor condong ke kiri atau ke kanan. Beberapa ahli menilai data outliers ini lebih baik kita buang, karena ada kemungkinan subjek mengerjakan dengan asal-asalan, selain itu adanya data outliers juga mengacaukan pengujian statistik. Namun beberapa ahli tetap mendukung bahwa data outliers tetap harus dimasukkan dalam analisis karena memang fakta di lapangan adalah demikian. Dalam kasus ini, kita akan membuang outliers yang dapat mengacaukan data kita, sehingga diperoleh distribusi yang normal.

Untuk melihat data outliers, kita dapat melakukannya di menu analyze – descriptive statistics – explore.Kemudian kita masukan variabel yang dinyatakan tidak normal, yakni variabel kepuasan ke kotak dependent list, lalu klik menu statistics dan centang bagian outliers. Jika sudah klik continue dan OK.

normal3

Untuk melihat data mana saja yang terindikasi sebagai outliers, kita dapat langsung menuju bagian boxplot pada output. Hasil output boxplot data kita dapat dilihat pada gambar di bawah.

normal4

Gambar tersebut mengindikasikan data-data mana saja yang terindikasi merupakan data ekstrem atau outliers.  Jika data berada di atas kotak, menunjukkan data ekstrem tinggi, sedangkan jika berada di bawah kotak menunjukkan data ekstrem rendah. Semakin jauh dari kotak, semakin ekstrem data tersebut. Dari output di atas kita dapat melihat bahwa subjek nomer 1, 2, 3, 4, 5 terindikasi sebagai outliers. Subjek nomer 1 merupakan subjek yang paling ekstrem nilainya.

Untuk memilih data mana saja yang ingin kita buang, lebih baik kita melakukannya secara bertahap, mulai dari data yang paling ekstrem. Jika dilihat dari output tersebut, data nomer 1 dan 2 adalah data yang paling ekstrem, oleh karena itu kita buang data dari 2 subjek tersebut terlebih dahulu. Untuk menghapus, jangan lupa, kita menghapus dari subjek yang bawah terlebih dahulu, agar nomer subjek tidak bergeser nantinya. Untuk menghapus data subjek, klik kanan pada nomer subjek, lalu pilih clear.

normal5

Jika kedua outliers tersebut telah kita hapus, maka kita uji kembali normalitas data kita dengan kolmogorov-smirnov. Hasil uji kolmogorov-smirnov yang baru ditunjukkan gambar di bawah.

normal6

Hasil uji kolmogov-smirnov yang baru pada variabel kepuasan ternyata menghasilkan nilai kolmogorov-smirnov Z sebesar 1,265 dan p=0,81 (p>0,05). Dengan demikian distribusi data variabel kepuasan normal. Begitu juga pada variabel pelayanan yang memiliki p>0,05, sehingga variabel pelayanan juga terdistribusi normal. Dengan demikian masalah ketidaknormalan data kita sudah teratasi.

Transformasi Data

Jika beberapa ahli tidak setuju dengan cara menghapus data-data ekstrem, cara lain yang bisa ditempuh adalah dengan transformasi data. Transformasi data dilakukan dengan mengubah data kita dengan formula tertentu tergantung dari bentuk grafik kita. Sebelum melakukan transformasi data, kita harus tahu terlebih dahulu bagaimana bentuk grafik kita. Cara melihat grafik data kita adalah dengan cara analyze – descriptive statistics – frequencies. Lalu masukkan variabel kepuasan dan pilih menu chart, pilihhistogram dan centang show normal curve on histogram. Jika sudah tekan continue dan OK, maka akan diperoleh output seperti berikut.

normal7

Grafik tersebut menggambarkan kurve kita condong ke kanan. Beberapa kemungkinan grafik yang akan muncul adalah sebagai berikut.

normal8

Sumber gambar: http://i-codee.blogspot.co.id

Panduan transformasi data berdasarkan bentuk grafik dapat dilihat di tabel di bawah.

Bentuk Grafik Histogram

Bentuk Transformasi Data

Moderate positive skewness

SQRT(x)

Substansial positive skewness

LG10(x)

Severe positive skewness

1/x

Moderate negative skewness

SQRT(k-x)

Substansial negative skewness

LG10(k-x)

Severe negative skewness

1/(k-x)

k = nilai tertinggi dari data mentah x

Jika kita kembali ke data kita dan melihat grafik histogram kita, maka bentuk grafik kita adalah moderate negative skewness, sehingga transformasi data yang kita pakai adalah SQRT(k-x). K adalah nilai tertinggi dari data mentah variabel kepuasan, yakni 25. Untuk mentransformasi data, kita dapat klik transform – compute variable. Pada kotak target variable, kita ketik nama variabel baru kita, misal trans_kepuasan,kemudian pada pada numeric expression, masukkan formula kita yakni SQRT(25-kepuasan), lalu klik OK. Kembali lagi ke data kita, maka kita sudah memiliki variabel baru bernama trans_kepuasan yang tidak lain adalah transformasi data dari variabel kepuasan.  

normal9

Untuk melihat apakah transformasi data kita berhasil atau tidak, kita uji kembali normalitas data kita dengan kolmogorov smirnov.

normal10

Dari hasil uji kolmogorov-smirnov, diperoleh p>0,05, sehingga dapat dikatakan bahwa variabel transformasi kepuasan ini terdistribusi secara normal.

Catatan mengenai transformasi data:

  • Transformasi  data tidak hanya dapat digunakan untuk mengatasi ketidaknormalan data, tapi juga dapat digunakan untuk mengatasi pelanggaran asumsi lainnya, seperti lineraritas dan homogentitas varians pada uji beda. Meskipun umum digunakan, namun penggunaan transformasi data sendiri juga tidak lepas dari pro dan kontra. Beberapa diskusi terkait dapat dilihat di sini
  • Jika transformasi data dilakukan, maka data yang ditampilkan dalam laporan kita tetaplah data asli. Namun data yang digunakan untuk uji statistik parametrik menggunakan data transformasi.
  • Jika uji statistik dilakukan untuk mengkorelasikan dua atau lebih variabel, maka setiap variabel juga harus ditransformasikan dalam bentuk yang sama. Artinya, dalam contoh di atas, variabel pelayanan juga harus ditransformasi ke bentuk SQRT(k-pelayanan).

Mengubah Analisis ke Non-Parametrik

Cara terakhir jika dengan menghapus outliers dan mentransformasi data kita belum berhasil adalah dengan mengubah teknik analisis kita ke analisis non-parametrik. Analisis non-parametrik tidak memerlukan asumsi normalitas seperti yang diperlukan pada analisis parametrik. Meskipun demikian, daya generalisasi analisis non-parametrik ini tentu lebih lemah jika dibandingkan dengan analisis parametrik. Beberapa teknik analisis pengganti analisis parametrik disajikan dalam tabel di bawah ini.

Analisis Parametrik

Analisis Non Parametrik

Fungsi

Paired sample t-test

Uji tanda

Meneliti perbedaan dalam  suatu kelompok

Independent sample t-test

Uji Mann-Whitney U; Uji  Wilcoxon jumlah peringkat

Membandingkan dua sample bebas

Anava satu jalur

Anava dengan menggunakan peringkat Kruskal-Wallis

Membandingkan tiga kelompok atau lebih

Anava dua jalur

Anava dua jalur Friedman

Membandingkan tiga kelompok atau lebih dengan menggunakan dua faktor yang berbeda

Korelasi Pearson

Korelasi peringkat Spearman

Mengetahui hubungan korelasi linier antara dua perubah

Sumber : https://www.semestapsikometrika.com

Tentang Nori Sahrun

About Mr. Nori Sahrun,S.Kom., M.KomEdit I am a lecturer at The College of Economics science (STIE RIAU). Accreditation of College Institutions STIE RIAU gains grades "B". I am teaching Management Information Systems, Software Engineering and E-Commerce. The Bachelor's degree of Science ( Computer Science) From The College Institutions STMIK AMIK RIAU The degree Master of Science (Computer Science) from The University Putera Indonesia YPTK Padang (UPI-Padang). I hope to participate in the Doctoral Program for Continuing both Domestically and Abroad. I will endeavor to mengujudkan doctoral program anywhere, While we still want to learn to share knowledge and search for knowledge Contact Person: Facebook : Nori Sahrun M.Kom E-mail: norisahrun84@gmail.com
Pos ini dipublikasikan di Tak Berkategori. Tandai permalink.

2 Balasan ke Data Berdistribusi Tidak Normal

  1. Winda Damayanti berkata:

    terima kasih, pak. sangat membantu dan mudah dipahami 🙂

    Suka

Tinggalkan komentar