Paling sedikit ada dua pertimbangan utama yang digunakan dalam menilai keandalan sebuah model regresi. Pertama, pemilihan peubah-peubah yang relevan mempunyai hubungan fungsional dilakukan dengan pertimbangan ilmiah dan logika yang benar (scientifically important). Kedua, model itu sendiri signifikan secara statistis berdasarkan data empiris (statistically significant). Kedua kriteria ini tidak saling bergantungan, yang berarti scientifically important dan statistically significant
merupakan dua pertimbangan yang tidak saling berkaitan. Artinya, dua peubah yang secara ilmiah atau menurut logika mempunyai hubungan yang penting bisa saja secara statistis ditunjukkan bahwa hubungan itu tidak signifikan. Sebaliknya, dua peubah yang sama sekali tidak ada hubungannya, namun data empiris dapat menunjukkan bahwa hubungan itu signifikan secara statistis.
Salah satu hubungan fungsional yang banyak dibicarakan adalah hubungan sebab-akibat. Perlu ditegaskan bahwa metode statistika apa pun, termasuk analisis korelasi dan regresi tidak dapat mendeteksi atau membuktikan adanya hubungan sebab-akibat itu. Sudah dijelaskan bahwa hubungan sebab-akibat dapat diasumsikan berdasarkan logika atau pertimbangan ilmiah sesuai teori dan substansi yang diukur oleh peubah yang dipelajari hubungannya. Cara populer untuk menunjukkan hubungan sebab-akibat melalui eksperimen dengan mengintervensi peubah yang dipelajari dan memberikan kondisi sehingga dapat diyakini bahwa hanya perlakuan yang diberikan menyebabkan terjadinya perubahan pada peubah terikat.
Kalau kita sudah dapat meyakini adanya hubungan sebab-akibat, statistika dapat membantu menghitung seberapa besar kuatnya hubungan itu. Apakah hubungan itu secara empiris didukung oleh fakta? Pertanyaan inilah yang dapat dijawab dengan analisis korelasi atau regresi dengan taraf keyakinan tertentu (tidak pasti, namun pada umumnya hampir ioo%). Hasil pengujian statistik yang signifikan memberikan keyakinan bahwa hubungan itu terjadi secara sistematis dan bukan secara kebetulan. Artinya, kalau penelitian itu diulangi dengan cara yang sama, hasil yang sama cenderung selalu diperoleh. Perlu ditegaskan kembali bahwa metode statistika tidak dapat membuktikan adanya hubungan sebab-akibat, tetapi apabila hubungan itu ada, statistika dapat mengukur kuatnya hubungan itu secara empiris. Untuk melakukan hal ini, statistika akan mengolah data yang kadang-kadang jumlahnya sangat banyak Karena itu, penggunaan komputer menjadi keharusan dalam analisis data yang cukup besar atau teknik statistika yang lebih canggih dan rumit.
Pengertian Statistika
Pengertian Statistika. Berikut ini akan kita bahas secara lengkap mengenai Pengertian Statistika. Kata Statistika berasal dari bahasa Latin yakni Status, yang berarti keadaan politik. Dalam bentuknya yang mula-mula, statistika merujuk kepada data tentang keadaan politik; data sensus, data militer, dan data fiskal. Sensus penduduk dan kekayaan dilakukan oleh Raja Firaun di Mesir dan orang-orang Yahudi kuno.
Menurut sejarawan Yunani Herodatus, pada tahun 1400 Sebelum Masehi (SM), Raja Rameses II melakukan sensus di seluruh tanah Mesir untuk menetapkan daerah kekuasaannya. Kita juga dapat menemukan laporan yang sama untuk Cina kuno, Yunani, dan Roma. Dewasa ini, makna statistika menjadi makin luas. Makna statistika yang lebih mutakhir berkenaan dengan cara ilmiah untuk mengumpulkan, mengorganisasikan, menyajikan, dan menganalisis data, serta menarik kesimpulan sahih dan mengambil keputusan layak berdasarkan analisis yang dilakukan.
Berdasarkan fungsinya, statistika dapat digolongkan secara garis besar menjadi dua bidang yang tumpang tindih; statistika deskriptif dan statistika inferensial (induktif). Perhatian utama statistika deskriptif adalah menyajikan informasi dalam bentuk yang tepat, dapat digunakan dan dapat dimengerti. Statistika inferensial berhubungan dengan perampatan (generalization of) informasi, atau secara lebih khusus, dengan menarik kesimpulan tentang populasi yang didasarkan pada sampel yang ditarik dari populasinya. Perlu diingatkan bahwa populasi adalah keseluruhan subjek/objek yang menjadi pusat perhatian, sedangkan sampel adalah bagian dari populasi.
Seperti telah dijelaskan bahwa statistika dapat dikelompokkan ke dalam dua jenis yaitu statistika deskriptif dan statistika inferensial. Statistika deskriptif meliputi pengumpulan, pengolahan, dan penyajian data dalam bentuk angka-angka, tabel, dan grafik, sedangkan statistika inferensial mengacu kepada teknik penaksiran (estimation) parameter, peramalan (prediction), perampatan (generalisation), dan pengujian hipotesis (hypothesis testing). Parameter adalah ciri kuantitatif yang dihitung dari populasi, dan hipotesis adalah dugaan sementara yang masih perlu diuji kebenarannya. Dengan perkataan lain, statistika deskriptif mengungkapkan fakta sampel, sedangkan statistika inferensial menggunakan sampel untuk menjelaskan sifat populasi.
Selain statistika deskriptif dan statistika inferensial, dikenal juga pengelompokan menurut asumsi yang digunakan tentang sebaran populasi, yaitu statistika parametrtk dan statistika nonparametrik. Dalam melakukan penaksiran parameter atau pengujian hipotesis, sering diperlukan asumsi tentang sebaran populasi, seperti asumsi kenormalan, atau sebaran khusus yang lain. Dalam hal ini statistika yang digunakan disebut statistika parametrik, sedangkan statistika yang agak longgar asumsinya tentang sebaran populasi disebut statistika nonparametrik. Asumsi yang biasa digunakan untuk statistika nonparametrik hanyalah kemalaran (continuity) sebaran populasi. Karena itu, jenis statistika yang terakhir ini biasa disebut statistika sebaran bebas (distribution free statistics). Nama ini yang sesungguhnya lebih tepat. Dengan demikian, statistika sebaran khusus menjadi nama yang lebih tepat untuk menggantikan nama statistika parametrik.
Pemilihan metode analisis ini banyak ditentukan oleh tujuan dan ciri informasi yang diinginkan. Kalau kita mempunyai satu peubah, dengan metode deskriptif, kita dapat mengungkapkan ukuran pemusatan, ukuran lokasi, ukuran penyebaran, ukuran kemiringan, dan ukuran kecembungan data dengan berbagai jenis nilai rerata dan variansi. Jika kita memilild dua peubah, kita dapat menguji kesamaan rerata mau pun variansinya. Dalam keadaan tertentu, hubungan antarpeubah dapat dipelajari dengan cara analisis korelasi atau analisis regresi. Situasi semacam ini sudah menjadi umum di kalangan para peneliti.
Statistika dan Hubungan Sebab-akibat
Bagaimana, apakah kalian sudah paham dengan Pengertian Statistika?