Mau Data Anda diolah secara gratis? Klik pada gambar 2 x !! No Tipu

Data Outliers

Outliers adalah data yang menyimpang terlalu jauh dari data yang lainnya dalam suatu rangkaian data. Adanya data outliers ini akan membuat analisis terhadap serangkaian data menjadi bias, atau tidak mencerminkan fenomena yang sebenarnya. Istilah outliers juga sering dikaitkan dengan nilai esktrem, baik ekstrem besar maupun ekstrem kecil. Sebagai ilustrasi, jika ada empat mahasiswa, mahasiswa pertama mempunyai uang saku per bulan Rp. 500 ribu, mahasiswa kedua Rp. 600 ribu, mahasiswa ketiga Rp. 700 ribu, dan mahasiswa keempat karena merupakan anak orang kaya, mempunyai uang saku per bulan sampai dengan Rp. 5 juta. Secara sekilas tampak bahwa nilai 5 juta relatif jauh dibandingkan uang saku ketiga mahasiswa yang lain.
Kalau kita rata-ratakan uang saku keempat mahasiswa tersebut, maka rata-ratanya adalah sebesar (500 ribu + 600 ribu + 700 ribu + 5 juta)/4= 6,8 juta/4 = 1,7 juta. Tiga mahasiswa yang lain tentunya keberatan jika dinyatakan bahwa rata-rata uang saku mereka adalah Rp. 1,7 juta per bulan karena jauh sekali dari nilai yang sebenarnya. Contoh lain misalnya kita ingin merata-ratakan kekayaan seorang PNS usia 30 tahunan, dengan memasukkan seorang PNS yang kebetulan mempunyai kekayaan sekitar Rp. 25 Milliar…he he he he

Penangangan Data Outliers
Harus kita apakah data outliers? Apakah harus kita keluarkan? Atau ada treatment yang lain. Pengeluaran data outliers memang tidak disalahkan, akan tetapi harus dikaji dulu, apakah data tersebut merupakan bagian dari populasi atau bukan? Sebagai contoh, seorang PNS dengan kekayaan dalam contoh di atas, sebaiknya dikeluarkan dari model penelitian karena ‘tidak’ mewakili fenomena PNS yang sebenarnya (jangan-jangan memang begitu ya fenomenanya? He he). Dalam contoh keempat mahasiswa di atas, jika tujuannya adalah untuk melihat apakah perlu menaikkan SPP atau tidak, ya sebaiknya dikeluarkan karena tentunya 3 orang yang mempunyai uang saku di bawah 1 juga akan keberatan. Akan tetapi dalam kasus yang lain, data tersebut boleh saja dipergunakan jika memang mewakili kondisi subjek penelitian. Misalnya, penelitian perusahaan selama krisis di mana hampir semua perusahaan mengalami kerugian. Akan tetapi ada satu atau beberapa perusahaan yang dengan jitu melakukan strategi sehingga menghasilkan profit. Nah, hasil penelitian akan lebih menarik jika data outliers tidak dikeluarkan. Dalam hal ini, peneliti bahkan dapat mengkaji strategi apa yang digunakan sehingga dapat dijadikan rujukan bagi perusahaan yang lain.
Dalam statistik, data outliers sering menimbulkan hasil yang bias. Oleh karena itu, harus diberikan perlakuan khusus. Pengeluaran data outliers atau penggunaan data outliers tidak semata-mata merujuk kepada statistiknya, tetapi juga adjustment dari peneliti. Jika memang data outliers tersebut tidak dapat dikeluarkan karena masih merupakan fenomena subjek penelitian ya sebaiknya tetap dipergunakan. Agar efek outliers dapat direduksi, maka data dilakukan transformasi data, misalnya dengan logaritman natural, atau akar kuadrat. Atau juga bisa menggunakan alat statistik non parametrik, sehingga data outliers tidak akan nampak sebagai outliers karena data dianggap berskala ordinal. Sebagai contoh, keempat mahasiswa tadi diubah menjadi data ordinal, sehingga mahasiswa dengan uang saku Rp. 500 ribu menjadi 1, uang saku Rp. 600 ribu menjadi 2, uang saku Rp. 700 ribu menjadi 3, dan yang paling besar menjadi 4. Ini hanya contoh saja, dan sebagai informasi data dalam bentuk ordinal tidak dapat dirata-ratakan, akan tetapi dapat digunakan untuk mencari korelasi dengan variabel lain.

Berikut adalah simulasi trimming data outliers dengan SPSS Versi 25:



68 komentar:

  1. mas ni aq rina lg hehee..pindah di outlier nih,,aq mau nanya kalo data udah normal, musti pake outlier lg g?makasih :)

    BalasHapus
    Balasan
    1. bantu pendapat: sepertinya langsung di uji aja.gak perlu lagi tes outlier.

      Hapus
  2. ok makasih mas,,nanti kalo g dong tanya2 lagi ya...=)

    BalasHapus
  3. siang, saya ingin bertanya apakah data sudah normal, dan outlier dipakai pada uji asumsi klasik lain misalnya hetero, dan untuk mendapatkan signifikansi simultan, apakah itu boleh?

    thanks

    BalasHapus
    Balasan
    1. Coba di cek dengan metode statistik yang ada. Terima kasih.

      Hapus
  4. saya mau bertanya, saya menguji normalitas utk 1 variabel dependen dan 2 variabel independen, tp data saya tidak normal, lalu saya trimming dan ada data outliernya, data tersebut mau saya keluarkan, tp data saya menggunakan 115 perusahaan dr tahun 2010-2015, jika yg outlier hanya di 1 perusahaan dan hanya ditahun 2014 saja, serta hanya di 1 variabel saja, apa perlu saya mengeluarkan semua data di perusahaan itu, atau ditahun 2014 saja?

    BalasHapus
    Balasan
    1. Jika regresi, maka yang digunakan adalah normalitas multivariate. Terima kasih.

      Hapus
    2. Saya juga mengalami hal yang sama. Bagaimana yg harus saya lakukan :(

      Hapus
    3. Silahkan lakukan hal yang sama. Normalitas pada regresi adalah normalitas multivariate-nya atau residualnya. Terima kasih.

      Hapus
  5. maaf saya mau bertanya, dari 124 data sampel ada 2 data yang di outlier...
    permaslahannya adalah jika data di outlier, bagaimana cara mengatasi pada bagian kriteria sampel sampel?
    karena sebelumnya saya menggunkan pusposive sampling dengan 5 kriteria, tetapi 2 data itu awalnya masuk sampel... ternyata seetelah di analisis, 2 data tersebut harus di outlier..
    saya mau bertanya, bagaimana cara mengatasi data outlier? apakah karakteristik sampel harus diganti ? atau bagaimana ?

    terimakasih

    BalasHapus
  6. mau nanya mas atau mbak, adakah maksimal banyaknya data yg boleh dioutlier dari jumlah sampel yg digunakan? lalu, salah satu uji asumsi yaitu uji autokorelasi tidak lulus, baru bisa lulus setelah mengoutlier 55 dari 156 data sampel, bagaimana menurut anda?

    BalasHapus
    Balasan
    1. Tergantung justifikasi Anda sendiri. Nyaman gak menghilangkan sepertiga dari data yang ada? Terima kasih.

      Hapus
  7. maaf saya mau bertanya apakah outlier dapat dilakukan lebih dari satu kali ? maksudnya apabila saya melakukan regresi kemudian saya outlier menggunakan z score dan menghapus yang nilainya lebih dari 2,5 dan -2,5 tetapi data saya belum juga normal apakah setelah saya hapus data tersebut dan saya regresi ulang dapat saya outlier kembali ?

    BalasHapus
  8. maaf, saya mau bertanya, kalau data panel, apakah harus uji oulier juga ?

    BalasHapus
  9. maaf, saya mau bertnya, saya mnguji penelitian GCG dan kinerja lingkungan terhadap kinerja keuangan perusahaan bumn. apakah perlu di tulis data outlier di bab 4 analisis?

    trims

    BalasHapus
    Balasan
    1. Data outliers tidak berkaitan langsung dengan topik penelitian. Terima kasih.

      Hapus
  10. selamat pagi, siang, malam masss. mas izin nanya. ketika data data penelitian kena outlier, dan setelah membuang datanya. data yang dipakai untuk pengujian, apakah data sebelumnya atau data outliernya? terima kasih

    BalasHapus
    Balasan
    1. Lha tujuan membuang data outlier untuk apa? Terima kasih.

      Hapus
  11. Selamat malam kak, say mu bertanya. Data saya termasuk dat panel dan sebaran datanya sangat tidak teratur. Setelah di uji normalitas dan regresi hasilnya tidak normal. Adakh cara untuk menghaluskn data agar sebaranya teratur. Terima kasih

    BalasHapus
    Balasan
    1. Silahkan baca2 blog ini untuk mendapatkan gambaran yang lebih lengkap dulu. Terima kasih.

      Hapus
  12. mas pak mbk buk saya mau txak apak data outlier it hrs dibuang jka mmg data yg d olah tdk normal...

    BalasHapus
    Balasan
    1. Silahkan dibuang jika memang hasilnya lebih baik. Terima kasih.

      Hapus
  13. selamat malam, saya ingin tanya, saya coba plot data dg menggunakan box plot, terlihat ada pencilan. kemudian saya buang(karena ditugas disuruh spt itu), tetapi setelah saya plot kembali, masih terdapat pencilan dari data yg sebelumnya tidak termasuk pencilan. itu bagaimna ya? bukannya seharusnya setelah pencilan dibuang, di boxplt sudah tidak ada lagi pencilannya?

    BalasHapus
    Balasan
    1. Lakukan sesuai tugas yang diberikan. Terima kasih.

      Hapus
  14. Maaf mas saya mau bertanya, jika uji normalitas nya menggunakan outlier, yg mau saya tanyakan, untuk pengujian hipotesis data selanjutnya menggunakan data yg sudah di outlier atau data awal sebelum di outlier?

    BalasHapus
    Balasan
    1. Pernah rehab rumah atau service kendaraan yang rusak? Analoginya sama. Terima kasih.

      Hapus
  15. Pak saya mau tanya skripsi saya ada 5 th periode (2012-2016), jika data sudah dioutlier sampai 9 kali tetap hasilnya tidak normal dan ketika outlier yang dibuang perusahaan yg bermasalah walau misal di perusahaan itu hanya 2 yg di outlier (2013-2014 saja) tapi hasilnya jadi normal.. apa tidak apa" membuang perperusahaan?

    BalasHapus
    Balasan
    1. Analisis data outliers memang untuk menentukan data atau sampel penelitian yang terpencil dari data atau sampel yang lain. Terima kasih.

      Hapus
  16. Aslm. Selamat Malam, min maaf apakah ada aturan khusus dlm pembuangan data outliers? Misal dlm 1 tahun (12 bulan)ada 4 buah (4 bulan)data yg outlier,apakah boleh dibuang semua guna hasil yg baik?

    BalasHapus
    Balasan
    1. Tidak ada rumus yang pasti. Jika terlalu banyak, konsultasikan dengan pembimbing Anda. Terima kasih.

      Hapus
  17. Assalamu'alaikum.wr.wb,
    Saya mau tnya.. Selain mnghilangkan data outlier untuk mnormalkan data, itu bs dilakukan transformasi kn ya ?? , trs apakah ada ketentuan dlm mnormalkan data harus dilakukan transformasi data dulu atau pnghilangn data outlier dulu, atau bs dilakukan salah stu ? Terimakasih

    BalasHapus
    Balasan
    1. Tidak ada ketentuan yang pasti. seperti pada artikel di atas, pengeluaran outliers sebaiknya ada adjustment khusus dari peneliti,misalnya tidak mewakili populasi keseluruhan. Terima kasih.

      Hapus
  18. Assalamualaikum min saya mau tanya, apakah data yg tidak normal it sudah pasti ada outlierny?

    BalasHapus
  19. Apakah ada ketentuan jumlah maksimal outlier yang boleh dikeluarkan? Misalnya 5% dari sampel yg diiznkan

    BalasHapus
    Balasan
    1. Kami juga belum menemukan referensi tentang itu. Mohon maaf.

      Hapus
  20. Data yg digunakan untuk mngji data outlier ini ..??
    jika 2 data yg d.gunakan data angket kecerdasan dan tes prestasi

    BalasHapus
    Balasan
    1. Mohon maaf kurang jelas maksudnya. Terima kasih.

      Hapus
  21. min may nanya Saya sedang melakukan pengujian data ada sebanyak 4 tempat (A, B, C, D) yang disetiap tempat terdapat 10 data primer yang semuanya akan dipakai dalam waktu bersamaan. Pada pengujian di tempat D datanya mengalami penyimpangan dan harus di outlier.(contoh data ke 8 harus dioutlier) apakah saya harus membuang data ke 8 pada tempat A, B dan C juga? terima kasih

    BalasHapus
  22. Selamat malam mas, saya mau tanya bagaimana cara mengatasi uji F yg tidak berpengaruh?

    BalasHapus
    Balasan
    1. Banyak sekali. Salah satu di antaranya, pastikan data Anda adalah benar, diambil dengan cara yang benar dan melalui prosedur yang benar. Biasanya data akan cenderung enak untuk di analisis. Terima kasih.

      Hapus
  23. Maaf mau bertanya, data outlier dalam data panel apakah harus dikeluarkan? Padahal uji normalitas dan asumsi klasik lainnya sudah terpenuhi, terimakasih.

    BalasHapus
    Balasan
    1. Tidak harus, tergantung adjustment dari peneliti juga. Terima kasih.

      Hapus
  24. Mau tanya min kalau data hasil outlier semisal ada 2 variabel independen dan 1 variabel dependen dan hasil dari outlier yg berubah hanya varibel Y dan X1 nya saja apakah diperbolehkan?

    BalasHapus
    Balasan
    1. Gunakan prosedur yang sudah ada saja. Terima kasih.

      Hapus
  25. mau tanya kak, kalo data panel ga lulus uji normalitas dan autokorelasi tetapi data yang digunakan sudah logaritma natural, karena data provinsi dimana ada provinsi yang dapet lebih besar dan ada yang ga besar bgt, apakah itu bisa dibilang outlier? kemudian apakah bisa lolos uji normalitas dan autokorelasi nantinya dg tetap menggunakan panel? terimakasih

    BalasHapus
    Balasan
    1. Kriteria outlier (pencilan) sudah ada, silahkan diaplikasikan. Terima kasih.

      Hapus
  26. Maaf mau bertanya jika pakai uji logistic apakah outlier harus dihilangkan? Uji saya y adalah ketepatan waktu, 1 tepat waktu , 0 tidak tepat waktu...sedangkan jika sudah saya ilangin outliernya hasil chi square jadi 000, apakah outlier harus dihilangkan?

    BalasHapus
    Balasan
    1. Di artikel sudah dituliskan, tidak harus dikeluarkan. Terima kasih.

      Hapus
  27. Permisi saya mau bertanya.
    Sya menggunakan regresi logistik.
    Ketika saya melakukan uji logistik, hasil hosmer and lemeshow sya tidak memenuhi syarat. Setelah sya cek, sya menemukan 11 data outlier. Lalu sya coba hilangkan 11 data outlier tsb, kemudian hasil hosmer and lemeshow sya jdi memenuhi syarat. Tetapi setelah sya cek lg trnyt muncul lg 6 data outlier setelah sya hapus 11 data outlier sbeleumny. Apakah sya perlu menghapus lg 6 data outlier yg bru muncul atau cukup smpai penghapusan awal 11 data outlier? Karna stlh d cek hasil uji yg lain sudah memenuhi syarat.

    BalasHapus
    Balasan
    1. Di artikel sudah dituliskan, outlier tidak harus dihapus jika memang syarat yang diinginkan sudah terpenuhi. Terima kasih.

      Hapus
  28. Permisi kak, saya mau bertanya. Sebelumnya saya akan memberitahu terlebih dahulu kalau saya menggunakan regresi logistik di mana pada uji hosmer and lemenshow test nilai sig tidak berada di atas 0.05 yang menandakan model tidak layak. Kmarin saya ada buang data outlier dengan asumsi data yng besar saya buang yang berbeda dengan data yg lain namun tidak menggunakan metode metode yang diperlukan dalam membuang data outlier. Apakah itu diperbolehkan kak? Terima kasih

    BalasHapus
    Balasan
    1. Outlier bisa dihapus, tetapi tetap gunakan prosedur yang sesuai untuk menentukan data mana yang outlier. Terima kasih.

      Hapus
  29. Malam Kak.. variabel dependen sy ada 1 dan independen ada 5.
    Trus data saya setelah dioutlier (dari N=80 tinggal N=53) sdh normal dan tidak terjadi heteroskedastisitas. Tapi multikolinearitas msh terjadi pd 1 variabel independen. Dan juga autokorelasinya tdk dpt disimpulkan krn DW ada di antara DL dan Du.
    Apa yg hrs saya lakukan selanjutnya? Outlier lagi atau transform data atau nambah sampel?
    Outlier sebanyak itu (dari 80 jadi 53) bolehkah?

    Terima kasih ya:)

    BalasHapus
    Balasan
    1. Selalu mencoba alternatif. Itu sudah disebutkan, transformasi, tambah data/sampel dll. Terima kasih.

      Hapus
    2. Oke. Jadi inti olah data pada sebuah penelitian tu seberapa tangguh kita utak atik data ya? Dari situ kita dapet ilmu, bukan sekadar nilai mata kuliah penelitian..

      Hapus
  30. Pak data awal saya 336 (tidak normal) lalu saya buang 49 data ekstrem, tapi tetap tidak lolos uji normalitas. Apakah itu mungkin pak?

    BalasHapus
    Balasan
    1. Mungkin saja. Itu kan kakak sendiri juga mengalami ya kak :)

      Hapus
  31. Kak hasil uji normalitas saya tidak normal karena dibawah 0,05. Untuk melalukan outlier apa saya harus membuang data² yg ekstrem?

    BalasHapus
    Balasan
    1. Silahkan Kak, kalau memang memungkinkan untuk dikeluarkan dari model penelitian. Terima kasih.

      Hapus
  32. Kak mau tanya, data saya sudah normal tetapi uji f dan uji t hasilnya tidak ada pengaruh, kalau begitu apa masih boleh outlier data? Terima kasih

    BalasHapus
    Balasan
    1. Coba lihat uji asumsi klasik yang lain, juga pastikan bahwa model spesifikasi telah sesuai dan juga pengambilan sampel telah sesuai kak. Terima kasih.

      Hapus

Baca dulu sebelum tulis komentar:

Sebelum menuliskan pertanyaan, mohon disimak tanya jawab yang ada terlebih dahulu. Pertanyaan yang sama atau senada biasanya tidak terjawab. Atau simak dulu di Mengapa Pertanyaan Saya Tidak Dijawab?
Simak juga Channel kami di Statistik TV
Terima kasih.


Promo Domain Murah mulai Rp. 15rb