Cara Mengatasi Data Berdistribusi Tidak Normal

Ketika kita hendak melakukan analisis statistik parametrik, seperti melakukan uji korelasi product moment, salah satu asumsi yang harus dipenuhi adalah distribusi data kita normal. Oleh karena itu sebelum melakukan analisis statistik parametrik, terlebih dahulu kita harus melihat apakah data kita terdistribusi normal atau tidak. Bagaimana cara untuk melihat data kita normal atau tidak? Berikut akan diberikan contoh penelitian fiktif tentang “Hubungan antara Pelayanan Istri dengan Kepuasan Suami”. Data fiktif dapat didownload disini

Uji Normalitas di SPSS

Data yang akan kita gunakan adalah data kepuasan.sav. Sebelum menguji hipotesis kita yakni “ada hubungan antara pelayanan istri dengan kepuasan suami”, maka kita uji terlebih dahulu normalitas data kepuasan dan pelayanan kita. Ada berbagai cara untuk menguji normalitas di SPSS, seperti dengan melihat histogram dan nilai skewness dan kurtosis serta dengan uji kolmogorov-smirnov. Contoh kali ini kita akan menggunakan uji kolmogorov-smirnov. Uji normalitas dengan kolmogorov-smirnov dilakukan dengan membandingkan distribusi empirik data kita dengan distribusi normal yang diharapkan. Karena merupakan uj beda, maka nilai p yang diharapkan adalah yang tidak signifikan, yakni p>0,05. Hal ini menunjukkan bahwa tidak ada perbedaan antara kedua distribusi itu, yang berarti distribusi data empirik kita adalah normal. Untuk menguji normalitas di SPSS dapat dilakukan melalui menu analyze – nonparametric test – legacy dialogs – sample K-S.

normalitas1

Jika sudah, pindahkan kedua variabel pelayanan dan kepuasan ke kotak sebelah kanan, kemudian tekan OK. Berikut adalah output dari analisis kita.

normal2

Dari output tersebut dapat kita lihat, variabel pelayanan memiliki nilai kolmogorov-smirnov Z sebesar 1,277 dan p=0,077 (p>0,05), dengan demikian tidak ada perbedaan antara distribusi empirik data kita dengan distribusi normal ideal, oleh karena itu distribusi data variabel pelayanan normal. Sedangkan pada variabelkepuasan memiliki nilai kolmogorov-smirnov Z sebesar 1,447 dan p=0,030 (p<0,05), dengan demikian ada perbedaan antara distribusi empirik data kita dengan distribusi normal ideal, oleh karena itu distribusi data variabel kepuasan tidak normal. Lalu bagaimana kita memperlakukan data yang tidak normal kita? Ada beberapa cara yang bisa dilakukan untuk mengatasi data yang tidak normal tersebut.

Membuang outliers

Salah satu alasan mengapa data kita tidak normal adalah adanya outliers. Outliers adalah data yang memiliki skor ekstrem, baik ekstrem tinggi maupun ekstrem rendah. Adanya outliers dapat membuat distribusi skor condong ke kiri atau ke kanan. Beberapa ahli menilai data outliers ini lebih baik kita buang, karena ada kemungkinan subjek mengerjakan dengan asal-asalan, selain itu adanya data outliers juga mengacaukan pengujian statistik. Namun beberapa ahli tetap mendukung bahwa data outliers tetap harus dimasukkan dalam analisis karena memang fakta di lapangan adalah demikian. Dalam kasus ini, kita akan membuang outliers yang dapat mengacaukan data kita, sehingga diperoleh distribusi yang normal.

Untuk melihat data outliers, kita dapat melakukannya di menu analyze – descriptive statistics – explore.Kemudian kita masukan variabel yang dinyatakan tidak normal, yakni variabel kepuasan ke kotak dependent list, lalu klik menu statistics dan centang bagian outliers. Jika sudah klik continue dan OK.

normal3

Untuk melihat data mana saja yang terindikasi sebagai outliers, kita dapat langsung menuju bagian boxplot pada output. Hasil output boxplot data kita dapat dilihat pada gambar di bawah.

normal4

Gambar tersebut mengindikasikan data-data mana saja yang terindikasi merupakan data ekstrem atau outliers. Jika data berada di atas kotak, menunjukkan data ekstrem tinggi, sedangkan jika berada di bawah kotak menunjukkan data ekstrem rendah. Semakin jauh dari kotak, semakin ekstrem data tersebut. Dari output di atas kita dapat melihat bahwa subjek nomer 1, 2, 3, 4, 5 terindikasi sebagai outliers. Subjek nomer 1 merupakan subjek yang paling ekstrem nilainya.

Untuk memilih data mana saja yang ingin kita buang, lebih baik kita melakukannya secara bertahap, mulai dari data yang paling ekstrem. Jika dilihat dari output tersebut, data nomer 1 dan 2 adalah data yang paling ekstrem, oleh karena itu kita buang data dari 2 subjek tersebut terlebih dahulu. Untuk menghapus, jangan lupa, kita menghapus dari subjek yang bawah terlebih dahulu, agar nomer subjek tidak bergeser nantinya. Untuk menghapus data subjek, klik kanan pada nomer subjek, lalu pilih clear.

normal5

Jika kedua outliers tersebut telah kita hapus, maka kita uji kembali normalitas data kita dengan kolmogorov-smirnov. Hasil uji kolmogorov-smirnov yang baru ditunjukkan gambar di bawah.

normal6

Hasil uji kolmogov-smirnov yang baru pada variabel kepuasan ternyata menghasilkan nilai kolmogorov-smirnov Z sebesar 1,265 dan p=0,81 (p>0,05). Dengan demikian distribusi data variabel kepuasan normal. Begitu juga pada variabel pelayanan yang memiliki p>0,05, sehingga variabel pelayanan juga terdistribusi normal. Dengan demikian masalah ketidaknormalan data kita sudah teratasi.

Transformasi Data

Jika beberapa ahli tidak setuju dengan cara menghapus data-data ekstrem, cara lain yang bisa ditempuh adalah dengan transformasi data. Transformasi data dilakukan dengan mengubah data kita dengan formula tertentu tergantung dari bentuk grafik kita. Sebelum melakukan transformasi data, kita harus tahu terlebih dahulu bagaimana bentuk grafik kita. Cara melihat grafik data kita adalah dengan cara analyze – descriptive statistics – frequencies. Lalu masukkan variabel kepuasan dan pilih menu chart, pilihhistogram dan centang show normal curve on histogram. Jika sudah tekan continue dan OK, maka akan diperoleh output seperti berikut.

normal7

Grafik tersebut menggambarkan kurve kita condong ke kanan. Beberapa kemungkinan grafik yang akan muncul adalah sebagai berikut.

normal8

Sumber gambar: http://i-codee.blogspot.co.id

Panduan transformasi data berdasarkan bentuk grafik dapat dilihat di tabel di bawah.

Bentuk Grafik Histogram	Bentuk Transformasi Data
Moderate positive skewness	SQRT(x)
Substansial positive skewness	LG10(x)
Severe positive skewness	1/x
Moderate negative skewness	SQRT(k-x)
Substansial negative skewness	LG10(k-x)
Severe negative skewness	1/(k-x)

k = nilai tertinggi dari data mentah x

Jika kita kembali ke data kita dan melihat grafik histogram kita, maka bentuk grafik kita adalah moderate negative skewness, sehingga transformasi data yang kita pakai adalah SQRT(k-x). K adalah nilai tertinggi dari data mentah variabel kepuasan, yakni 25. Untuk mentransformasi data, kita dapat klik transform – compute variable. Pada kotak target variable, kita ketik nama variabel baru kita, misal trans_kepuasan,kemudian pada pada numeric expression, masukkan formula kita yakni SQRT(25-kepuasan), lalu klik OK. Kembali lagi ke data kita, maka kita sudah memiliki variabel baru bernama trans_kepuasan yang tidak lain adalah transformasi data dari variabel kepuasan.

normal9

Untuk melihat apakah transformasi data kita berhasil atau tidak, kita uji kembali normalitas data kita dengan kolmogorov smirnov.

normal10

Dari hasil uji kolmogorov-smirnov, diperoleh p>0,05, sehingga dapat dikatakan bahwa variabel transformasi kepuasan ini terdistribusi secara normal.

Catatan mengenai transformasi data:

Transformasi data tidak hanya dapat digunakan untuk mengatasi ketidaknormalan data, tapi juga dapat digunakan untuk mengatasi pelanggaran asumsi lainnya, seperti lineraritas dan homogentitas varians pada uji beda. Meskipun umum digunakan, namun penggunaan transformasi data sendiri juga tidak lepas dari pro dan kontra. Beberapa diskusi terkait dapat dilihat di sini
Jika transformasi data dilakukan, maka data yang ditampilkan dalam laporan kita tetaplah data asli. Namun data yang digunakan untuk uji statistik parametrik menggunakan data transformasi.
Jika uji statistik dilakukan untuk mengkorelasikan dua atau lebih variabel, maka setiap variabel juga harus ditransformasikan dalam bentuk yang sama. Artinya, dalam contoh di atas, variabel pelayanan juga harus ditransformasi ke bentuk SQRT(k-pelayanan).

Mengubah Analisis ke Non-Parametrik

Cara terakhir jika dengan menghapus outliers dan mentransformasi data kita belum berhasil adalah dengan mengubah teknik analisis kita ke analisis non-parametrik. Analisis non-parametrik tidak memerlukan asumsi normalitas seperti yang diperlukan pada analisis parametrik. Meskipun demikian, daya generalisasi analisis non-parametrik ini tentu lebih lemah jika dibandingkan dengan analisis parametrik. Beberapa teknik analisis pengganti analisis parametrik disajikan dalam tabel di bawah ini.

Analisis Parametrik	Analisis Non Parametrik	Fungsi
Paired sample t-test	Uji tanda	Meneliti perbedaan dalam suatu kelompok
Independent sample t-test	Uji Mann-Whitney U; Uji Wilcoxon jumlah peringkat	Membandingkan dua sample bebas
Anava satu jalur	Anava dengan menggunakan peringkat Kruskal-Wallis	Membandingkan tiga kelompok atau lebih
Anava dua jalur	Anava dua jalur Friedman	Membandingkan tiga kelompok atau lebih dengan menggunakan dua faktor yang berbeda
Korelasi Pearson	Korelasi peringkat Spearman	Mengetahui hubungan korelasi linier antara dua perubah

Sumber : https://www.semestapsikometrika.com

2 Balasan ke Data Berdistribusi Tidak Normal

Winda Damayanti berkata:

22 Mei 2019 pukul 10:58 pm

terima kasih, pak. sangat membantu dan mudah dipahami 🙂

SukaSuka

Balas
- Nori Sahrun berkata:
  
  14 Desember 2019 pukul 11:38 am
  
  syukurlah…jangan lupa sertakan di daftar pustaka anda agar bisa jadi referensi yang bermanfaat untuk orang banyak
  
  SukaSuka
  
  Balas