Correlation Coefficient adalah ukuran statistik dari kekuatan hubungan linier antara dua variabel. Nilainya dapat berkisar dari -1 hingga 1. Correlation Coefficient -1 menggambarkan korelasi negatif sempurna, atau kebalikannya, dengan nilai dalam satu seri meningkat saat nilai dalam seri lainnya menurun, dan sebaliknya. Koefisien 1 menunjukkan korelasi positif sempurna, atau hubungan langsung. Correlation Coefficient 0 berarti tidak ada hubungan linier.
Correlation Coefficient digunakan dalam ilmu pengetahuan dan keuangan untuk menilai tingkat hubungan antara dua variabel, faktor, atau kumpulan data. Contohnya, karena harga minyak yang tinggi menguntungkan bagi produsen minyak mentah, kita dapat mengasumsikan korelasi antara harga minyak dan imbal hasil berjangka saham minyak sangat positif. Menghitung Correlation Coefficient untuk variabel-variabel ini berdasarkan data pasar menunjukkan korelasi yang moderat dan tidak konsisten dalam jangka waktu yang panjang.
Memahami Correlation Coefficient
Berbagai jenis Correlation Coefficient digunakan untuk menilai korelasi berdasarkan sifat-sifat data yang dibandingkan. Sejauh ini yang paling umum adalah koefisien Pearson, atau Pearson’s r, yang mengukur kekuatan dan arah hubungan linier antara dua variabel. Koefisien Pearson tidak dapat menilai hubungan nonlinier antara variabel dan tidak dapat membedakan antara variabel dependen dan independen.
Koefisien Pearson menggunakan rumus statistik matematika untuk mengukur seberapa dekat titik-titik data yang menggabungkan dua variabel (dengan nilai dari satu seri data yang diplot pada sumbu x dan nilai yang sesuai dari seri lainnya pada sumbu y) mendekati garis kecocokan terbaik. Garis kecocokan terbaik dapat ditentukan melalui analisis regresi.
Semakin jauh koefisiennya dari nol, baik itu positif atau negatif, semakin baik kecocokannya dan semakin besar korelasinya. Nilai -1 (untuk korelasi negatif) dan 1 (untuk korelasi positif) menggambarkan kecocokan sempurna di mana semua titik data sejajar dalam satu garis lurus, yang mengindikasikan bahwa variabel-variabel tersebut berkorelasi sempurna. Dengan kata lain, hubungan tersebut sangat mudah diprediksi sehingga nilai satu variabel dapat ditentukan dari nilai yang cocok dengan variabel lainnya. Semakin dekat Correlation Coefficient dengan nol, semakin lemah korelasinya, sampai pada titik nol tidak ada hubungan linier sama sekali.
Penilaian kekuatan korelasi berdasarkan nilai Correlation Coefficient berbeda-beda menurut aplikasinya. Dalam fisika dan kimia, Correlation Coefficient harus lebih rendah dari -0,9 atau lebih tinggi dari 0,9 agar korelasi dianggap bermakna, sedangkan dalam ilmu sosial ambang batasnya bisa setinggi -0,5 dan serendah 0,5. Untuk Correlation Coefficient yang berasal dari pengambilan sampel, penentuan signifikansi statistik bergantung pada nilai p, yang dihitung dari ukuran sampel data serta nilai koefisien.
Persamaan Correlation Coefficient
Untuk menghitung korelasi Pearson, mulailah dengan menentukan standar deviasi masing-masing variabel serta kovarian di antara keduanya. Correlation Coefficient adalah kovariansi dibagi dengan hasil kali standar deviasi kedua variabel.
Standar deviasi adalah ukuran penyebaran data dari rata-ratanya. Kovarians menunjukkan apakah dua variabel cenderung bergerak ke arah yang sama, sedangkan Correlation Coefficient mengukur kekuatan hubungan tersebut pada skala yang dinormalisasi, dari -1 hingga 1.Rumus di atas dapat dijabarkan sebagai
Statistik Korelasi dan Investasi
Correlation Coefficient sangat membantu dalam menilai dan mengelola risiko investasi. Contohnya, teori portofolio modern menyatakan bahwa diversifikasi dapat mengurangi volatilitas imbal hasil portofolio dan mengurangi risiko. Correlation Coefficient antara imbal hasil historis dapat mengindikasikan apakah menambahkan investasi ke dalam portofolio akan meningkatkan diversifikasinya.
Perhitungan korelasi juga merupakan pokok dari investasi faktor, sebuah strategi untuk membangun portofolio berdasarkan faktor-faktor yang terkait dengan kelebihan imbal hasil. Sementara itu, trader kuantitatif menggunakan korelasi historis dan Correlation Coefficient untuk mengantisipasi perubahan harga sekuritas dalam waktu dekat.
Keterbatasan Correlation Coefficient Pearson
Korelasi tidak menyiratkan sebab-akibat, seperti kata pepatah, dan koefisien Pearson tidak dapat menentukan apakah salah satu variabel yang berkorelasi bergantung pada variabel lainnya.Correlation Coefficient juga tidak menunjukkan berapa proporsi variasi dalam variabel dependen yang disebabkan oleh variabel independen. Hal ini ditunjukkan oleh koefisien determinasi, yang juga dikenal sebagai R-squared, yang secara sederhana merupakan Correlation Coefficient yang dikuadratkan.Correlation Coefficient tidak menggambarkan kemiringan garis kecocokan terbaik; kemiringan dapat ditentukan dengan metode kuadrat terkecil dalam analisis regresi.
Correlation Coefficient Pearson tidak dapat digunakan untuk menilai asosiasi nonlinier atau yang muncul dari data sampel yang tidak tunduk pada distribusi normal. Koefisien ini juga dapat terdistorsi oleh titik-titik data pencilan yang berada jauh di luar diagram pencar suatu distribusi. Hubungan tersebut dapat dianalisis dengan menggunakan metode nonparametrik, seperti Correlation Coefficient Spearman, Correlation Coefficient peringkat Kendall, atau Correlation Coefficient polinomial.