BerandaIstilahGoodness-of-Fit

Goodness-of-Fit

Apa Itu Goodness-of-Fit?

Istilah goodness-of-fit mengacu pada uji statistik yang menentukan seberapa baik data sampel cocok dengan distribusi dari populasi dengan distribusi normal. Sederhananya, uji ini menghipotesiskan apakah suatu sampel condong atau mewakili data yang Anda harapkan untuk ditemukan dalam populasi yang sebenarnya.

Goodness-of-fit menetapkan perbedaan antara nilai yang diamati dan nilai yang diharapkan dari model dalam kasus distribusi normal. Ada beberapa metode untuk menentukan goodness-of-fit, termasuk chi-square.

Memahami Goodness-of-Fit

Uji Goodness-of-fit adalah metode statistik yang membuat kesimpulan tentang nilai yang diamati. Misalnya, Anda dapat menentukan apakah kelompok sampel benar-benar mewakili seluruh populasi. Dengan demikian, uji ini menentukan bagaimana nilai aktual terkait dengan nilai prediksi dalam sebuah model. Ketika digunakan dalam pengambilan keputusan, uji goodness-of-fit memudahkan untuk memprediksi tren dan pola di masa depan.

Seperti disebutkan di atas, ada beberapa jenis uji goodness-of-fit. Mereka termasuk uji chi-square, yang merupakan yang paling umum, serta uji Kolmogorov-Smirnov, dan uji Shapiro-Wilk. Pengujian ini biasanya dilakukan dengan menggunakan perangkat lunak komputer. Namun, ahli statistik dapat melakukan pengujian ini menggunakan rumus yang disesuaikan dengan jenis pengujian tertentu.

Untuk melakukan pengujian, Anda memerlukan variabel tertentu, bersama dengan asumsi tentang bagaimana variabel tersebut didistribusikan. Anda juga memerlukan kumpulan data dengan nilai yang jelas dan eksplisit, seperti:

  • Nilai-nilai yang diamati, yang berasal dari kumpulan data aktual
  • Nilai yang diharapkan, yang diambil dari asumsi yang dibuat
  • Jumlah total kategori dalam set

Menetapkan Level Alpha

Untuk menginterpretasikan uji goodness-of-fit, penting bagi ahli statistik untuk menetapkan tingkat alfa, seperti nilai-p untuk uji chi-square. Nilai-p mengacu pada probabilitas untuk mendapatkan hasil yang mendekati hasil ekstrem dari hasil yang diamati. Hal ini mengasumsikan bahwa hipotesis nol adalah benar. Hipotesis nol menyatakan bahwa tidak ada hubungan yang ada di antara variabel, dan hipotesis alternatif mengasumsikan bahwa ada hubungan.

Sebaliknya, frekuensi nilai yang diamati diukur dan kemudian digunakan dengan nilai yang diharapkan dan derajat kebebasan untuk menghitung chi-square. Jika hasilnya lebih rendah dari alpha, hipotesis nol tidak valid, yang mengindikasikan adanya hubungan di antara variabel-variabel tersebut.

Jenis-jenis Uji atau Test Goodness-of-Fit 

Chi-Square Test

Uji chi-square, yang juga dikenal sebagai uji chi-square untuk independensi, adalah metode statistik inferensial yang menguji validitas klaim yang dibuat tentang suatu populasi berdasarkan sampel acak, digunakan secara eksklusif untuk data yang dipisahkan ke dalam kelas-kelas (bin), dan membutuhkan ukuran sampel yang cukup untuk menghasilkan hasil yang akurat. Tetapi tidak menunjukkan jenis atau intensitas hubungan. Misalnya, tidak menyimpulkan apakah hubungannya positif atau negatif. Untuk menghitung goodness-of-fit chi-square, tetapkan tingkat signifikansi alfa yang diinginkan. Jadi, jika tingkat kepercayaan Anda adalah 95% (atau 0,95), maka alphanya adalah 0,05. Selanjutnya, identifikasi variabel kategorikal yang akan diuji, kemudian tentukan pernyataan hipotesis tentang hubungan di antara variabel-variabel tersebut.

Kolmogorov-Smirnov (K-S) Test

Dinamakan sesuai dengan nama matematikawan Rusia Andrey Kolmogorov dan Nikolai Smirnov, uji Kolmogorov-Smirnov (K-S) adalah metode statistik yang menentukan apakah sebuah sampel berasal dari distribusi tertentu di dalam sebuah populasi. Uji ini, yang direkomendasikan untuk sampel besar (misalnya, lebih dari 2000), bersifat non-parametrik. Artinya, uji ini tidak bergantung pada distribusi apa pun agar valid. Tujuannya adalah untuk membuktikan hipotesis nol, yaitu sampel berasal dari distribusi normal.

Seperti chi-square, uji ini menggunakan hipotesis nol dan alternatif serta tingkat signifikansi alfa. Nol menunjukkan bahwa data mengikuti distribusi tertentu dalam populasi, dan alternatif menunjukkan bahwa data tidak mengikuti distribusi tertentu dalam populasi. Alfa digunakan untuk menentukan nilai kritis yang digunakan dalam pengujian. Namun tidak seperti uji chi-square, uji Kolmogorov-Smirnov berlaku untuk distribusi kontinu.

Statistik uji yang dihitung sering dilambangkan sebagai D. Statistik ini menentukan apakah hipotesis nol diterima atau ditolak. Jika D lebih besar dari nilai kritis pada alpha, hipotesis nol ditolak. Jika D lebih kecil dari nilai kritis, hipotesis nol diterima.

The Anderson-Darling (A-D) Test

Uji Anderson-Darling (A-D) adalah variasi dari uji K-S, tetapi memberikan bobot yang lebih besar pada bagian ekor distribusi. Uji K-S lebih sensitif terhadap perbedaan yang mungkin terjadi lebih dekat ke pusat distribusi, sedangkan uji A-D lebih sensitif terhadap variasi yang diamati pada bagian ekor. Karena risiko ekor dan gagasan “ekor berlemak” lazim di pasar keuangan, uji A-D dapat memberikan lebih banyak kekuatan dalam analisis keuangan. Seperti uji K-S, uji A-D menghasilkan statistik, dilambangkan sebagai A2, yang dapat dibandingkan dengan hipotesis nol.

Shapiro-Wilk (S-W) Test

Uji Shapiro-Wilk (S-W) menentukan apakah sebuah sampel mengikuti distribusi normal. Uji ini hanya memeriksa normalitas ketika menggunakan sampel dengan satu variabel data kontinu dan direkomendasikan untuk ukuran sampel kecil hingga 2000.

Uji Shapiro-Wilk menggunakan plot probabilitas yang disebut QQ Plot, yang menampilkan dua set kuantil pada sumbu y yang disusun dari yang terkecil hingga terbesar. Jika setiap kuantil berasal dari distribusi yang sama, maka rangkaian plot tersebut bersifat linier.

QQ Plot digunakan untuk mengestimasi varians. Dengan menggunakan varians QQ Plot bersama dengan estimasi varians populasi, seseorang dapat menentukan apakah sampel termasuk dalam distribusi normal. Jika hasil bagi dari kedua varians sama dengan atau mendekati 1, hipotesis nol dapat diterima. Jika jauh lebih rendah dari 1, hipotesis nol dapat ditolak.

Sama seperti pengujian yang disebutkan di atas, pengujian ini menggunakan alfa dan membentuk dua hipotesis: nol dan alternatif. Hipotesis nol menyatakan bahwa sampel berasal dari distribusi normal, sedangkan hipotesis alternatif menyatakan bahwa sampel tidak berasal dari distribusi normal.

Test atau Uji Goodness-of-Fit Lainnya 

Selain jenis pengujian yang lebih umum yang disebutkan di atas, ada banyak pengujian kesesuaian lainnya yang dapat digunakan oleh seorang analis:

  • Bayesian information criterion (BIC) adalah ukuran statistik yang digunakan untuk pemilihan model di antara sekumpulan model yang terbatas. BIC adalah uji kesesuaian yang menyeimbangkan kompleksitas model dengan kesesuaiannya terhadap data.
  • Cramer-von Mises criterion (CVM) adalah uji kesesuaian yang digunakan untuk menilai seberapa baik sekumpulan data teramati sesuai dengan distribusi probabilitas yang dihipotesiskan. Sering digunakan dalam ekonomi, teknik, atau keuangan, uji ini didasarkan pada fungsi distribusi kumulatif dari data teramati dan distribusi yang dihipotesiskan.
  • Akaike information criterion (AIC) adalah ukuran kualitas relatif model statistik untuk sekumpulan data tertentu, dan memberikan keseimbangan antara kesesuaian model dan kompleksitasnya. Model ini didasarkan pada teori informasi dan mengukur jumlah informasi yang hilang oleh model saat digunakan untuk memperkirakan distribusi data dasar yang sebenarnya.
  • Hosmer-Lemeshow test membandingkan frekuensi yang diharapkan dari hasil biner dengan frekuensi yang diamati dari hasil tersebut dalam kelompok atau interval yang berbeda. Kelompok tersebut biasanya dibentuk dengan membagi probabilitas hasil yang diprediksi menjadi sepuluh kelompok atau wadah.
  • Kuiper’s test mirip dengan uji Kolmogorov-Smirnov, tetapi lebih sensitif terhadap perbedaan pada ekor distribusi.
  • Moran’s I test atau Moran’s Index adalah uji statistik yang digunakan untuk menilai autokorelasi spasial dalam data. Autokorelasi spasial adalah ukuran tingkat kesamaan atau perbedaan pengamatan variabel dalam ruang.

Pentingnya Uji Goodness-of-Fit

Uji Goodness-of-fit penting dalam statistik karena berbagai alasan. Pertama, uji ini menyediakan cara untuk menilai seberapa baik model statistik sesuai dengan sekumpulan data yang diamati. Pentingnya utama menjalankan uji goodness-of-fit adalah untuk menentukan apakah data yang diamati konsisten dengan model statistik yang diasumsikan. Selain itu, uji goodness-of-fit dapat berguna dalam memilih di antara berbagai model yang mungkin lebih sesuai dengan data.

Uji goodness-of-fit juga dapat membantu mengidentifikasi outlier atau ketidaknormalan pasar yang mungkin memengaruhi kecocokan model. Pencilan dapat berdampak besar pada kecocokan model dan mungkin perlu dihilangkan atau ditangani secara terpisah. Terkadang, outlier tidak mudah diidentifikasi hingga mereka diintegrasikan ke dalam model analitis.

Uji goodness-of-fit juga dapat memberikan informasi tentang variabilitas data dan estimasi parameter model. Informasi ini dapat berguna untuk membuat prediksi dan memahami perilaku sistem yang sedang dimodelkan. Berdasarkan data yang dimasukkan ke dalam model, mungkin perlu untuk menyempurnakan model khusus untuk set data yang diuji, residual yang dihitung, dan nilai-p untuk data yang berpotensi ekstrem.

Goodness-of-Fit Test vs. Independence Test

Uji goodness-of-fit dan uji independen keduanya merupakan uji statistik yang digunakan untuk menilai hubungan antara variabel; oleh karena itu, mungkin mudah untuk membingungkan keduanya. Namun, masing-masing dirancang untuk menjawab pertanyaan yang berbeda.

Uji goodness-of-fit digunakan untuk mengevaluasi seberapa baik satu set data yang diamati sesuai dengan distribusi probabilitas tertentu. Di sisi lain, uji independensi digunakan untuk menilai hubungan antara dua variabel. Uji ini digunakan untuk menguji apakah ada hubungan antara dua variabel. Tujuan utama dari uji independensi adalah untuk melihat apakah perubahan pada satu variabel terkait dengan perubahan pada variabel lain.

Uji independensi biasanya digunakan ketika pertanyaan penelitian difokuskan untuk memahami hubungan antara dua variabel dan apakah variabel-variabel tersebut saling berhubungan atau independen. Dalam banyak kasus, uji independensi diarahkan pada dua variabel tertentu (misalnya, apakah merokok menyebabkan kanker paru-paru?). Di sisi lain, uji kecocokan digunakan pada seluruh rangkaian data yang diamati untuk mengevaluasi kesesuaian model tertentu.

Contoh dari Goodness-of-Fit 

Berikut adalah contoh hipotetis untuk menunjukkan cara kerja uji goodness-of-fit.

Misalkan sebuah pusat kebugaran komunitas kecil beroperasi dengan asumsi bahwa kehadiran tertinggi pada hari Senin, Selasa, dan Sabtu, kehadiran rata-rata pada hari Rabu, dan Kamis, dan kehadiran terendah pada hari Jumat dan Minggu. Berdasarkan asumsi ini, gym mempekerjakan sejumlah anggota staf setiap hari untuk mendaftarkan anggota, membersihkan fasilitas, menawarkan layanan pelatihan, dan mengajar kelas.

Namun, performa gym tidak bagus secara finansial dan pemiliknya ingin mengetahui apakah asumsi kehadiran dan tingkat staf sudah benar. Pemilik memutuskan untuk menghitung jumlah pengunjung gym setiap hari selama enam minggu. Mereka kemudian dapat membandingkan asumsi kehadiran gym dengan kehadiran yang teramati dengan menggunakan uji goodness-of-fit chi-square, misalnya.

Setelah memiliki data baru, mereka dapat menentukan cara terbaik untuk mengelola gym dan meningkatkan profitabilitas.

Artikel Sebelumnya
Artikel Berikutnya

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini

Artikel Terbaru