Setelah sebelumnya kita membahas tentang Pengertian Statistika, maka kali ini kita akan melihat lebih dalam tentang Pengertian Korelasi Regresi. Kajian tentang Korelasi Regresi merupakan salah satu kajian penting dalam statistik. Mengapa demikian?
Pengertian Korelasi dan Regresi
Kita harus mencermati kesamaan dan perbedaan kedua analisis regresi dan korelasi, karena hal tersebut diperlukan untuk menentukan ketepatan cara penggunaannya masing-masing. Apakah kita melihat duplikasi analisis? Penggunaan utama koefisien korelasi (linear) adalah menjawab pertanyaan: Apakah kedua peubah itu berhubungan linear? Terdapat cara lain untuk membuat pertanyaan dasar ini. Sebagai contoh: Apakah terdapat hubungan linear antara konsumsi tahunan minuman segar (X) dengan gaji yang dibayarkan kepada pegawai (1) di kota ini? Koefisien korelasi dapat digunakan untuk menunjukkan hubungan antara peubah X dan Y dalam model linear. Pengujian koefisien regresi linear Y atas X juga menguji konsep dasar yang sama. Satu di antara dua (korelasi atau regresi) sudah cukup untuk menjawab pertanyaan tadi. Namun demikian, analisis regresi menggunakan peubah bebas X sebagai penduga (penjelas) peubah terikat Y, sedangkan analisis korelasi memperlakukan kedua peubah X dan Y secara simetris. Artinya, analisis korelasi tidak mengenal adanya peubah bebas dan peubah terikat.
Namun, kita dapat melakukan pengujian atau diagnosis hubungan dua peubah secara subjektif dengan memperhatikan diagram pencar. Jika diagram pencar dibuat dengan teliti (dengan bantuan komputer) keputusan subjektif akan menentukan Y model matematis untuk koefisien korelasi atau garis regresi yang diyakini akan cocok dengan data. Perlu ditekankan bahwa keputusan subjektif tentang hubungan dua peubah hanyalah bersifat dugaan, dan masih harus diuji secara statistis.
Kedua konsep, korelasi dan regresi linear, agak berbeda sebab masing-masing mengukur ciri yang berbeda. Ada kemungkinan kita mempunyai data dengan koefisien korelasi yang kuat dan memilih model yang salah. Sebagai contoh, garis lurus dapat digunakan untuk mendekati hampir semua kurva jika rentang daerah asal (domain) cukup terbatas. Dalam kasus seperti ini, koefisien korelasi bisa tinggi sekali, tetapi kurva bukan garis lurus. Gambar 1.1 menunjukkan sebuah interval (5, 10) dengan koefisien korelasi yang signifikan (mendekati garis lurus), tetapi diagram pencar tidak mengikuti garis lurus untuk interval yang lebih panjang, misalnya interval (5, 15) sudah menunjukkan kecenderungan garis lengkung. Demikian pula jika interval daerah asal diperluas menjadi (0, 10), kesimpulan bisa menyatakan bahwa tidak ada hubungan linear antara X dan Y.
Seperti analisis korelasi, analisis regresi dapat digunakan untuk menjawab pertanyaan tentang hubungan antara dua peubah. Tetapi, pertanyaan seperti Apakah bentuk hubungan itu? Bagaimana dua peubah itu berhubungan? dan seterusnya memerlukan analisis regresi. Jawaban pertanyaan seperti ini dapat dijelaskan dengan argumentasi ilmiah yang rasional dan dapat diuji secara statistis dengan data empiris. Karena itu, sifat hubungan antarpeubah perlu dipahami lebih dahulu sebelum menggunakan statistika sebagai alat bantu analisis.
Namun, kita dapat melakukan pengujian atau diagnosis hubungan dua peubah secara subjektif dengan memperhatikan diagram pencar. Jika diagram pencar dibuat dengan teliti (dengan bantuan komputer) keputusan subjektif akan menentukan Y model matematis untuk koefisien korelasi atau garis regresi yang diyakini akan cocok dengan data. Perlu ditekankan bahwa keputusan subjektif tentang hubungan dua peubah hanyalah bersifat dugaan, dan masih harus diuji secara statistis.
Kedua konsep, korelasi dan regresi linear, agak berbeda sebab masing-masing mengukur ciri yang berbeda. Ada kemungkinan kita mempunyai data dengan koefisien korelasi yang kuat dan memilih model yang salah. Sebagai contoh, garis lurus dapat digunakan untuk mendekati hampir semua kurva jika rentang daerah asal (domain) cukup terbatas. Dalam kasus seperti ini, koefisien korelasi bisa tinggi sekali, tetapi kurva bukan garis lurus. Gambar 1.1 menunjukkan sebuah interval (5, 10) dengan koefisien korelasi yang signifikan (mendekati garis lurus), tetapi diagram pencar tidak mengikuti garis lurus untuk interval yang lebih panjang, misalnya interval (5, 15) sudah menunjukkan kecenderungan garis lengkung. Demikian pula jika interval daerah asal diperluas menjadi (0, 10), kesimpulan bisa menyatakan bahwa tidak ada hubungan linear antara X dan Y.
Seperti analisis korelasi, analisis regresi dapat digunakan untuk menjawab pertanyaan tentang hubungan antara dua peubah. Tetapi, pertanyaan seperti Apakah bentuk hubungan itu? Bagaimana dua peubah itu berhubungan? dan seterusnya memerlukan analisis regresi. Jawaban pertanyaan seperti ini dapat dijelaskan dengan argumentasi ilmiah yang rasional dan dapat diuji secara statistis dengan data empiris. Karena itu, sifat hubungan antarpeubah perlu dipahami lebih dahulu sebelum menggunakan statistika sebagai alat bantu analisis.