Tampilkan postingan dengan label Outliers. Tampilkan semua postingan
Tampilkan postingan dengan label Outliers. Tampilkan semua postingan

Contoh Perhitungan dengan Tabel Z atau Kurva Normal

Di artikel sebelumnya kita telah mengenal tentang Tabel Z dan juga Kurva Normal atau pun Z Score. Kali ini kita akan membuat simulasi perhitungan dengan menggunakan Tabel Z atau pun kurva normal. Sebagai ilustrasi, ada 150 kepala keluarga dalam suatu kompleks perumahan. Data yang telah diketahui adalah bahwa gaji rata-rata adalah 6 juta dengan simpangan baku sebesar 2 juta. (Ini hanya contoh saja). Pertanyaannya adalah berapa orang yang mempunyai gaji di atas 8 juta?

Pertanyaan ini dapat dijawab dengan menggunakan kurva normal atau pun Tabel Z seperti yang pernah kita bahas bersama. Informasi yang diperoleh adalah rata-rata dan simpangan baku. Jadi jika kita masukkan ke dalam rumus untuk mencari Z-Score akan diperoleh hasil sebagai berikut:

Hasilnya nilai ZScore adalah 1 dan jika kita lihat di grafik Kurva Normal untuk nilai 1 maka luasnya adalah 34,13.

Tabel Z
Jadi kepala keluarga yang mempunyai gaji antara 6 sd 8 juga adalah sebanyak 50% - 34,13% = 15,87%. 
Kurva Normal
Lebih detailnya lagi, kurva dibagi menjadi 2 kiri dan kanan secara simetris, sehingga luasan yang sebelah kanan (atau kiri) adalah 50%. Karena luasan dengan ZScore 1 adalah 34,13 maka sisanya 15,87%. Jadi jumlah kepala keluarga yang mempunyai gaji di atas 8 juta adalah sebanyak 15,87% x 150 = 23,805 atau sekitar 24 orang. 

Simulasi seperti ini bisa diterapkan untuk berbagai keperluan dengan tujuan pengambilan keputusan, misalnya dalam data demografi.

Demikian simulasi penggunaan kurva normal dan Tabel Z.

Share:

Apa itu Tabel Z?

Tabel Z adalah suatu tabel yang berisi nilai luasan di bawah kurva normal. Suatu distribusi data dikatakan normal jika menyerupai bentuk lonceng, di mana nilai rata-rata akan dekat dengan nilai mediannya. Selain itu, data yang bernilai besar atau kecil relatif sedikit atau mengumpul di tengah. Untuk lebih jelasnya bisa dilihat di gambar di bawah ini:

Contoh Gambar Kurva Normal

Gambar di atas mungkin sering kita lihat jika kita memang sedang membaca tentang statistik. Di gambar itu ada angka dalam prosentase dan juga dalam (s). Mungkin bisa kita uraikan bersama-sama di sini. Sangat diperlukan pemahaman tentang Z-Score. Artikel tentang Z-Score telah kita bahas di sini. Dalam artikel tersebut telah diuraikan tentang Z-Score dan cara menghitungnya atau rumusnya. Nah, huruf (s) dalam gambar itu menyatakan nilai Z-Score. Jadi 1s berarti nilai Z-Score nya adalah 1, demikian juga dengan 2 dan 3.

Pada gambar itu, pada bagian pinggir kiri dan kanan sebenarnya garisnya tidak berhimpit dengan Sumbu X, tetapi panjang sekali dan baru berhimpit dengan Sumbu X pada tak hingga. Jadi bisa dipahami bahwa jika nilai Z-Score tinggi, di atas 3 maka biasanya masuk kategori Outliers, atau pencilan atau nilainya berbeda jauh dengan nilai lainnya pada distribusi data tersebut.

Lebih lanjut, di gambar tersebut adalah nilai dalam prosentase. Nah, untuk memahaminya, berikut adalah Tabel Z:

Tabel Z

Dari gambar kurva di atas, anggaplah bahwa luasan di bawah kurva adalah 1 atau 100% atau utuh. Maka jika kita bagi dua, tepat di tengahnya, maka nilainya adalah setengahnya atau bisa kita tulis 0,5. Penyebutan 50% juga bisa.

Dari Tabel Z, yang kita tandai dengan lingkaran, kolom paling kiri adalah 1, atau luasan antara tengah kurva sampai dengan 1s, yaitu sebesar 0,3413 maka di Kurva normal tertulis angka 34,13% baik di belahan kanan, maupun belahan kiri. Artinya luasan di bawah kurva tersebut antara tengah sampai dengan 1s adalah 34,13% dari luasan total.

Selanjutnya pada Tabel Z, untuk kolom paling kiri sebesar 2, maka nilainya adalah 0,4772. Bisa kita hitung 0,4772 - 0,3413 = 0,1359 atau bisa juga ditulis 13,59%. Itu ada di sebelah kiri ataupun di sebelah kanan.

Silahkan dicoba untuk 3s yang tentunya hasilnya adalah 2,27%. Betul?

Nah setelah itu apa kegunaannya? Tentunya sangat berguna. Artikel berikut kita akan membahas kegunaan Tabel Z dan juga berkaitan erat dengan Kurva Normal.

Share:

Z Score, Cara Menghitung dan Kegunaannya

Z Score adalah salah satu bentuk transformasi data yang sangat sering dipergunakan. Z Score adalah suatu ukurang yang menentukan seberapa jauh suatu data dengan nilai rata-ratanya dalam satuan standar deviasinya. Z Score dihitung dengan persamaan sebagai berikut:

Z Score = (X - Mean)/Standard deviasi

Berikut adalah simulasi dengan 25 data seperti pada gambar di bawah ini dengan Microsoft Excel:

Contoh Tabulasi Data dengan Mean dan Standard Deviasi
Dari 25 data di atas, dicari nilai rata-rata dengan formulai AVERAGE yaitu sebesar 127,65. Sedangkan Standard Deviasi dihitung dengan menu STDEV, tanpa huruf P di belakang. Jika dengan P maka yang dihitung adalah standard deviasi populasi. Di sini kita menggunakan yang sampel. Anda bisa mempelajari perhitungan varians dengan Microsoft Excel lebih lanjut.

Setelah itu masing-masing data dihitung dengan rumus di atas sehingga diperoleh hasil sebagai berikut:

Perhitungan Nilai Z Score
Tampak bahwa persamaan formula yang dipergunakan diberikan tanda $ agar bisa ditarik atau di copas dengan Microsoft Excel. Kolom paling kanan adalah nilai Z Score.

Nilai Z Score yang besar menunjukkan bahwa data itu jauh dari nilai rata-rata dan sangat mungkin merupakan data outliers. Jadi nilai Z Score juga dapat dipergunakan untuk melakukan trimming data outlier. Juga banyak penggunaan yang lain yang mungkin terlalu banyak untuk disebutkan satu persatu.

Sedangkan jika menggunakan SPSS maka pilih Analyze, lalu pilih Descriptive Statistics lalu klik pada Descriptives seperti pada gambar di bawah:
Menu Analisis Deskriptif
Maka akan diarahkan ke menu analisis deskriptif. Masukkkan variabel data, lalu berikan tanda centang pada Save standardized values as variables seperti pada gambar di bawah:
Memasukkan Variabel
Artinya memerintahkan program untuk menyimpan nilai Z Score dari variabel yang dimaksud. Setelah itu klik OK maka akan keluar output dan pada tabulasi SPSS akan keluar variabel baru pada kolom paling kanan.
Menyimpan Variabel Z Score
Nilai Z Score akan diberi nama di depannya dengan Z lalu diikuti nama variabel aslinya. Untuk contoh di atas menjadi ZData. Nilai ini sama persis dengan nilai yang dihitung dengan Microsoft Excel.

Share:

Trimming Data Outliers pada Uji Normalitas dengan SPSS Versi 23

Berikut adalah simulasi uji normalitas data dengan metode Kolmogorov-Smirnov termasuk upaya untuk menormalkan data yang tidak normal. Alat bantu yang dipergunakan adalah SPSS Versi 23.  Terdapat 52 data dalam simulasi ini. 

Menu Uji Kolmogorov-Smirnov pada SPSS Versi 23
Pilih Analyze, pilih Nonparametric Tests, pilih pada Legacy Dialogs dan klik pada 1_Sample K-S seperti pada gambar di atas. Maka akan  masuk ke menu sebagai berikut:

Uji One-Sample Kolmogorov-Smirnov Test
Masukkan variabel data ke dalam box di sebelah kanan. Test Distrbution klik pada Normal lalu klik OK sehingga akan keluar output sebagai berikut:

Output Uji Normalitas dengan Kolmogorov-Smirnov
Tampak bahwa nilai Signifikansi adalah sebesar 0,41 < 0,05 yang berarti data tidak normal. Upaya agar data menjadi normal dilakukan dengan mengeluarkan data outliers dengan menu Explore yaitu sebagai berikut:
Menu Explore untuk Mencari Data Outliers dengan Boxplot
Maka akan diarahkan ke box baru. Pindahkan data ke box paling atas seperti pada gambar di bawah:

Menu Explore
Lalu klik pada Statistic di kanan atas dan berikan tanda centang pada Outliers seperti pada gambar di bawah:
Sub Menu Outliers
Setelah itu klik Continue lalu klik OK sehingga akan keluar output sebagai berikut:
Output Boxplot
Tampak pada gambar di atas bahwa data ke-36 adalah outliers karena menyimpang terlalu jauh dibandingkan dengan data yang lain. Item data ke-36 kita keluarkan dari uji normalitas dengan cara Trimming data sehingga kita tidak perlu menghapus data tersebut hanya memerintahkan kepada SPSS agar tidak menggunakan data tersebut dalam analisis selanjutnya. Setelah data ke-36 dikeluarkan, maka hasilnya adalah sebagai berikut:
Output Uji Normalitas dengan 51 Data tanpa Outliers
Tampak bahwa nilai Signifikansi adalah sebesar 0,088 > 0,05 yang berarti data telah normal. Data yang dipergunakan hanya 51 karena ada 1 yang dikeluarkan yaitu data ke-36.

Share:

Data Outliers

Outliers adalah data yang menyimpang terlalu jauh dari data yang lainnya dalam suatu rangkaian data (pencilan). Adanya data outliers ini akan membuat analisis terhadap serangkaian data menjadi bias, atau tidak mencerminkan fenomena yang sebenarnya. Istilah outliers juga sering dikaitkan dengan nilai esktrem, baik ekstrem besar maupun ekstrem kecil. Sebagai ilustrasi, jika ada empat mahasiswa, mahasiswa pertama mempunyai uang saku per bulan Rp. 500 ribu, mahasiswa kedua Rp. 600 ribu, mahasiswa ketiga Rp. 700 ribu, dan mahasiswa keempat karena merupakan anak orang kaya (sultan), mempunyai uang saku per bulan sampai dengan Rp. 5 juta. Secara sekilas tampak bahwa nilai 5 juta relatif jauh dibandingkan uang saku ketiga mahasiswa yang lain.

Kalau kita rata-ratakan uang saku keempat mahasiswa tersebut, maka rata-ratanya adalah sebesar (500 ribu + 600 ribu + 700 ribu + 5 juta)/4= 6,8 juta/4 = 1,7 juta. Tiga mahasiswa yang lain tentunya keberatan jika dinyatakan bahwa rata-rata uang saku mereka adalah Rp. 1,7 juta per bulan karena jauh sekali dari nilai yang sebenarnya. Contoh lain misalnya kita ingin merata-ratakan kekayaan seorang PNS usia 30 tahunan, dengan memasukkan seorang PNS yang kebetulan mempunyai kekayaan sekitar Rp. 25 Milliar…he he he he

Penangangan Data Outliers

Harus kita apakah data outliers? Apakah harus kita keluarkan? Atau ada treatment yang lain. Pengeluaran data outliers memang tidak disalahkan, akan tetapi harus dikaji dulu, apakah data tersebut merupakan bagian dari populasi atau bukan? Sebagai contoh, seorang PNS dengan kekayaan dalam contoh di atas, sebaiknya dikeluarkan dari model penelitian karena ‘tidak’ mewakili fenomena PNS yang sebenarnya (jangan-jangan memang begitu ya fenomenanya? He he). Dalam contoh keempat mahasiswa di atas, jika tujuannya adalah untuk melihat apakah perlu menaikkan SPP atau tidak, ya sebaiknya dikeluarkan karena tentunya 3 orang yang mempunyai uang saku di bawah 1 juga akan keberatan. Akan tetapi dalam kasus yang lain, data tersebut boleh saja dipergunakan jika memang mewakili kondisi subjek penelitian. Misalnya, penelitian perusahaan selama krisis di mana hampir semua perusahaan mengalami kerugian. Akan tetapi ada satu atau beberapa perusahaan yang dengan jitu melakukan strategi sehingga menghasilkan profit. Nah, hasil penelitian akan lebih menarik jika data outliers tidak dikeluarkan. Dalam hal ini, peneliti bahkan dapat mengkaji strategi apa yang digunakan sehingga dapat dijadikan rujukan bagi perusahaan yang lain.

Dalam statistik, data outliers sering menimbulkan hasil yang bias. Oleh karena itu, harus diberikan perlakuan khusus. Pengeluaran data outliers atau penggunaan data outliers tidak semata-mata merujuk kepada statistiknya, tetapi juga adjustment dari peneliti. Jika memang data outliers tersebut tidak dapat dikeluarkan karena masih merupakan fenomena subjek penelitian ya sebaiknya tetap dipergunakan. Agar efek outliers dapat direduksi, maka data dilakukan transformasi data, misalnya dengan logaritma natural, atau akar kuadrat. Atau juga bisa menggunakan alat statistik non parametrik, sehingga data outliers tidak akan nampak sebagai outliers karena data dianggap berskala ordinal. Sebagai contoh, keempat mahasiswa tadi diubah menjadi data ordinal, sehingga mahasiswa dengan uang saku Rp. 500 ribu menjadi 1, uang saku Rp. 600 ribu menjadi 2, uang saku Rp. 700 ribu menjadi 3, dan yang paling besar menjadi 4. Ini hanya contoh saja, dan sebagai informasi data dalam bentuk ordinal tidak dapat dirata-ratakan, akan tetapi dapat digunakan untuk mencari korelasi dengan variabel lain.

Berikut adalah simulasi trimming data outliers dengan SPSS Versi 25:


Share:

Artikel Terbaru

Translate

Artikel Terbaru

Tutorial Cara Download File dari Google Drive

Dalam artikel sebelumnya telah kita sampaikan bahwa jika menginginkan file yang dipergunakan dalam simulasi di blog ini dapat di download di...

Artikel Populer Seminggu Terakhir

Komentar Terbaru

`

Ingin menghubungi kami untuk kerja sama?

Nama

Email *

Pesan *