Outliers adalah data yang menyimpang terlalu jauh dari data yang lainnya dalam suatu rangkaian data. Adanya data outliers ini akan membuat analisis terhadap serangkaian data menjadi bias, atau tidak mencerminkan fenomena yang sebenarnya. Istilah outliers juga sering dikaitkan dengan nilai esktrem, baik ekstrem besar maupun ekstrem kecil. Sebagai ilustrasi, jika ada empat mahasiswa, mahasiswa pertama mempunyai uang saku per bulan Rp. 500 ribu, mahasiswa kedua Rp. 600 ribu, mahasiswa ketiga Rp. 700 ribu, dan mahasiswa keempat karena merupakan anak orang kaya, mempunyai uang saku per bulan sampai dengan Rp. 5 juta. Secara sekilas tampak bahwa nilai 5 juta relatif jauh dibandingkan uang saku ketiga mahasiswa yang lain.
Kalau kita rata-ratakan uang saku keempat mahasiswa tersebut, maka rata-ratanya adalah sebesar (500 ribu + 600 ribu + 700 ribu + 5 juta)/4= 6,8 juta/4 = 1,7 juta. Tiga mahasiswa yang lain tentunya keberatan jika dinyatakan bahwa rata-rata uang saku mereka adalah Rp. 1,7 juta per bulan karena jauh sekali dari nilai yang sebenarnya. Contoh lain misalnya kita ingin merata-ratakan kekayaan seorang PNS usia 30 tahunan, dengan memasukkan seorang PNS yang kebetulan mempunyai kekayaan sekitar Rp. 25 Milliar…he he he he
Penangangan Data Outliers
Harus kita apakah data outliers? Apakah harus kita keluarkan? Atau ada treatment yang lain. Pengeluaran data outliers memang tidak disalahkan, akan tetapi harus dikaji dulu, apakah data tersebut merupakan bagian dari populasi atau bukan? Sebagai contoh, seorang PNS dengan kekayaan dalam contoh di atas, sebaiknya dikeluarkan dari model penelitian karena ‘tidak’ mewakili fenomena PNS yang sebenarnya (jangan-jangan memang begitu ya fenomenanya? He he). Dalam contoh keempat mahasiswa di atas, jika tujuannya adalah untuk melihat apakah perlu menaikkan SPP atau tidak, ya sebaiknya dikeluarkan karena tentunya 3 orang yang mempunyai uang saku di bawah 1 juga akan keberatan. Akan tetapi dalam kasus yang lain, data tersebut boleh saja dipergunakan jika memang mewakili kondisi subjek penelitian. Misalnya, penelitian perusahaan selama krisis di mana hampir semua perusahaan mengalami kerugian. Akan tetapi ada satu atau beberapa perusahaan yang dengan jitu melakukan strategi sehingga menghasilkan profit. Nah, hasil penelitian akan lebih menarik jika data outliers tidak dikeluarkan. Dalam hal ini, peneliti bahkan dapat mengkaji strategi apa yang digunakan sehingga dapat dijadikan rujukan bagi perusahaan yang lain.
Dalam statistik, data outliers sering menimbulkan hasil yang bias. Oleh karena itu, harus diberikan perlakuan khusus. Pengeluaran data outliers atau penggunaan data outliers tidak semata-mata merujuk kepada statistiknya, tetapi juga adjustment dari peneliti. Jika memang data outliers tersebut tidak dapat dikeluarkan karena masih merupakan fenomena subjek penelitian ya sebaiknya tetap dipergunakan. Agar efek outliers dapat direduksi, maka data dilakukan transformasi data, misalnya dengan logaritman natural, atau akar kuadrat. Atau juga bisa menggunakan alat statistik non parametrik, sehingga data outliers tidak akan nampak sebagai outliers karena data dianggap berskala ordinal. Sebagai contoh, keempat mahasiswa tadi diubah menjadi data ordinal, sehingga mahasiswa dengan uang saku Rp. 500 ribu menjadi 1, uang saku Rp. 600 ribu menjadi 2, uang saku Rp. 700 ribu menjadi 3, dan yang paling besar menjadi 4. Ini hanya contoh saja, dan sebagai informasi data dalam bentuk ordinal tidak dapat dirata-ratakan, akan tetapi dapat digunakan untuk mencari korelasi dengan variabel lain.
mas ni aq rina lg hehee..pindah di outlier nih,,aq mau nanya kalo data udah normal, musti pake outlier lg g?makasih :)
BalasHapusbantu pendapat: sepertinya langsung di uji aja.gak perlu lagi tes outlier.
Hapusok makasih mas,,nanti kalo g dong tanya2 lagi ya...=)
BalasHapussiang, saya ingin bertanya apakah data sudah normal, dan outlier dipakai pada uji asumsi klasik lain misalnya hetero, dan untuk mendapatkan signifikansi simultan, apakah itu boleh?
BalasHapusthanks
Coba di cek dengan metode statistik yang ada. Terima kasih.
Hapussaya mau bertanya, saya menguji normalitas utk 1 variabel dependen dan 2 variabel independen, tp data saya tidak normal, lalu saya trimming dan ada data outliernya, data tersebut mau saya keluarkan, tp data saya menggunakan 115 perusahaan dr tahun 2010-2015, jika yg outlier hanya di 1 perusahaan dan hanya ditahun 2014 saja, serta hanya di 1 variabel saja, apa perlu saya mengeluarkan semua data di perusahaan itu, atau ditahun 2014 saja?
BalasHapusJika regresi, maka yang digunakan adalah normalitas multivariate. Terima kasih.
Hapusmaaf saya mau bertanya, dari 124 data sampel ada 2 data yang di outlier...
BalasHapuspermaslahannya adalah jika data di outlier, bagaimana cara mengatasi pada bagian kriteria sampel sampel?
karena sebelumnya saya menggunkan pusposive sampling dengan 5 kriteria, tetapi 2 data itu awalnya masuk sampel... ternyata seetelah di analisis, 2 data tersebut harus di outlier..
saya mau bertanya, bagaimana cara mengatasi data outlier? apakah karakteristik sampel harus diganti ? atau bagaimana ?
terimakasih
Di artikel sudah ada uraiannya. Terima kasih.
Hapusmau nanya mas atau mbak, adakah maksimal banyaknya data yg boleh dioutlier dari jumlah sampel yg digunakan? lalu, salah satu uji asumsi yaitu uji autokorelasi tidak lulus, baru bisa lulus setelah mengoutlier 55 dari 156 data sampel, bagaimana menurut anda?
BalasHapusTergantung justifikasi Anda sendiri. Nyaman gak menghilangkan sepertiga dari data yang ada? Terima kasih.
Hapusmaaf saya mau bertanya apakah outlier dapat dilakukan lebih dari satu kali ? maksudnya apabila saya melakukan regresi kemudian saya outlier menggunakan z score dan menghapus yang nilainya lebih dari 2,5 dan -2,5 tetapi data saya belum juga normal apakah setelah saya hapus data tersebut dan saya regresi ulang dapat saya outlier kembali ?
BalasHapusBoleh. Terima kasih.
Hapusmaaf, saya mau bertanya, kalau data panel, apakah harus uji oulier juga ?
BalasHapusJika diperlukan saja. Terima kasih.
Hapusmaaf, saya mau bertnya, saya mnguji penelitian GCG dan kinerja lingkungan terhadap kinerja keuangan perusahaan bumn. apakah perlu di tulis data outlier di bab 4 analisis?
BalasHapustrims
Data outliers tidak berkaitan langsung dengan topik penelitian. Terima kasih.
Hapusselamat pagi, siang, malam masss. mas izin nanya. ketika data data penelitian kena outlier, dan setelah membuang datanya. data yang dipakai untuk pengujian, apakah data sebelumnya atau data outliernya? terima kasih
BalasHapusLha tujuan membuang data outlier untuk apa? Terima kasih.
HapusSelamat malam kak, say mu bertanya. Data saya termasuk dat panel dan sebaran datanya sangat tidak teratur. Setelah di uji normalitas dan regresi hasilnya tidak normal. Adakh cara untuk menghaluskn data agar sebaranya teratur. Terima kasih
BalasHapusSilahkan baca2 blog ini untuk mendapatkan gambaran yang lebih lengkap dulu. Terima kasih.
Hapusmas pak mbk buk saya mau txak apak data outlier it hrs dibuang jka mmg data yg d olah tdk normal...
BalasHapusSilahkan dibuang jika memang hasilnya lebih baik. Terima kasih.
Hapusselamat malam, saya ingin tanya, saya coba plot data dg menggunakan box plot, terlihat ada pencilan. kemudian saya buang(karena ditugas disuruh spt itu), tetapi setelah saya plot kembali, masih terdapat pencilan dari data yg sebelumnya tidak termasuk pencilan. itu bagaimna ya? bukannya seharusnya setelah pencilan dibuang, di boxplt sudah tidak ada lagi pencilannya?
BalasHapusLakukan sesuai tugas yang diberikan. Terima kasih.
HapusMaaf mas saya mau bertanya, jika uji normalitas nya menggunakan outlier, yg mau saya tanyakan, untuk pengujian hipotesis data selanjutnya menggunakan data yg sudah di outlier atau data awal sebelum di outlier?
BalasHapusPernah rehab rumah atau service kendaraan yang rusak? Analoginya sama. Terima kasih.
HapusPak saya mau tanya skripsi saya ada 5 th periode (2012-2016), jika data sudah dioutlier sampai 9 kali tetap hasilnya tidak normal dan ketika outlier yang dibuang perusahaan yg bermasalah walau misal di perusahaan itu hanya 2 yg di outlier (2013-2014 saja) tapi hasilnya jadi normal.. apa tidak apa" membuang perperusahaan?
BalasHapusAnalisis data outliers memang untuk menentukan data atau sampel penelitian yang terpencil dari data atau sampel yang lain. Terima kasih.
HapusAslm. Selamat Malam, min maaf apakah ada aturan khusus dlm pembuangan data outliers? Misal dlm 1 tahun (12 bulan)ada 4 buah (4 bulan)data yg outlier,apakah boleh dibuang semua guna hasil yg baik?
BalasHapusTidak ada rumus yang pasti. Jika terlalu banyak, konsultasikan dengan pembimbing Anda. Terima kasih.
HapusAssalamu'alaikum.wr.wb,
BalasHapusSaya mau tnya.. Selain mnghilangkan data outlier untuk mnormalkan data, itu bs dilakukan transformasi kn ya ?? , trs apakah ada ketentuan dlm mnormalkan data harus dilakukan transformasi data dulu atau pnghilangn data outlier dulu, atau bs dilakukan salah stu ? Terimakasih
Tidak ada ketentuan yang pasti. seperti pada artikel di atas, pengeluaran outliers sebaiknya ada adjustment khusus dari peneliti,misalnya tidak mewakili populasi keseluruhan. Terima kasih.
HapusAssalamualaikum min saya mau tanya, apakah data yg tidak normal it sudah pasti ada outlierny?
BalasHapusBelum tentu. Terima kasih.
HapusApakah ada ketentuan jumlah maksimal outlier yang boleh dikeluarkan? Misalnya 5% dari sampel yg diiznkan
BalasHapusKami juga belum menemukan referensi tentang itu. Mohon maaf.
HapusData yg digunakan untuk mngji data outlier ini ..??
BalasHapusjika 2 data yg d.gunakan data angket kecerdasan dan tes prestasi
Mohon maaf kurang jelas maksudnya. Terima kasih.
Hapusmin may nanya Saya sedang melakukan pengujian data ada sebanyak 4 tempat (A, B, C, D) yang disetiap tempat terdapat 10 data primer yang semuanya akan dipakai dalam waktu bersamaan. Pada pengujian di tempat D datanya mengalami penyimpangan dan harus di outlier.(contoh data ke 8 harus dioutlier) apakah saya harus membuang data ke 8 pada tempat A, B dan C juga? terima kasih
BalasHapusMohon maaf kami kurang paham. Terima kasih.
HapusMau bertanya untuk data time series dari 2012-2017 terdapat hanya 1 data outlier harus dibuang atau dipertahankan? Jika dipertahankan malah datanya tidak normal. Terimakasih
BalasHapusSilahkan visit Forum Diskusi untuk diskusi lebih leluasa tanpa moderasi. Terima kasih.
Hapusmin mau tanya, sy meneliti 11 perusahaan dengan rentang waktu tahun 2013-2017. Pada salah satu perusahaan di tahun 2014 terdapat outlier. Nah, apakah jika sy mau menghilangkan oulier di tahun 2014 pada perusahaan tsb harus menghilangkan perusahaan lain di tahun 2014 juga? terima kasih.
BalasHapusSilahkan visit Forum Diskusi untuk diskusi lebih leluasa tanpa moderasi. Terima kasih.
Hapusmau tanya, apakah uji dengan regrsi logistik masih memerlukan data outlier ??
BalasHapusSilahkan visit Forum Diskusi untuk diskusi lebih leluasa tanpa moderasi. Terima kasih.
HapusAssalamualaikum mau tanya data yang saya gunakan ada satuan persen dan rupiah ... Setelah di uji menggunakan eviews data normal... Pertanyaan nya apakah data yang berbeda satuan haru di LN walaupun data itu normal ?
BalasHapusSilahkan visit Forum Diskusi untuk diskusi lebih leluasa tanpa moderasi. Terima kasih.
HapusPak kalau saya outlier menggunakan boxplot apakah boleh untuk menentukan data extreem? Tanpa melakaukan z score maupun homolonobis, sebab saya terlanjur menggunakan boxplot untuk mengetahui data yg extreem dan membuangnya sebab kemungkinan memang saat pengisian kuesioner responden mengisinya asal asalan, apakah diizinkan pak outlier dgn menggubakan boxplot saja? Dan setelah dibuang hasilnya sudah normal dan uji2 slanjutnya jg llos spt uji multi, hetero smua llos
BalasHapusSilahkan visit Forum Diskusi untuk diskusi lebih leluasa tanpa moderasi. Terima kasih.
Hapus