BAB I
PENGANTAR
by : Amalia Juniarly, S.Psi., Psi., M.A
Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data.
Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Istilah ’statistika’ (bahasa Inggris: statistics) berbeda dengan ’statistik’ (statistic). Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu data. Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistika deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.
Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam (misalnya astronomi dan biologi maupun ilmu-ilmu sosial (termasuk sosiologi dan psikologi), maupun di bidang bisnis, ekonomi, dan industri. Statistika juga digunakan dalam pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan salah satu prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah prosedur jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum), serta jajak cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi, statistika dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan.
A. SEJARAH STATISTIK
Penggunaan istilah statistika berakar dari istilah dalam bahasa latin modern statisticum collegium (“dewan negara”) dan bahasa Italia statista (“negarawan” atau “politikus”). Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai “ilmu tentang negara (state)”. Pada awal abad ke-19 telah terjadi pergeseran arti menjadi “ilmu mengenai pengumpulan dan klasifikasi data”. Sir John Sinclair memperkenalkan nama (Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap saat.
Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-bidang dalam matematika, terutama peluang. Cabang statistika yang pada saat ini sangat luas digunakan untuk mendukung metode ilmiah, statistika inferensi, dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher (peletak dasar statistika inferensi), Karl Pearson (metode regresi linear), dan William Sealey Gosset (meneliti problem sampel berukuran kecil). Penggunaan statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak dipengaruhi oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika.
Meskipun ada pihak yang menganggap statistika sebagai cabang dari matematika, tetapi sebagian pihak lainnya menganggap statistika sebagai bidang yang banyak terkait dengan matematika melihat dari sejarah dan aplikasinya. Di Indonesia, kajian statistika sebagian besar masuk dalam fakultas matematika dan ilmu pengetahuan alam, baik di dalam departemen tersendiri maupun tergabung dengan matematika.
B. PENGERTIAN STATISTIK
a. Batasan Umum
Kata statistic telah digunakan untuk membatasi cara-cara ilmiah untuk mengumpulkan , menyusun, meringkas dan menyajikan data penyelidikan. Lebih lanjut, statistic merupakan cara untuk mengolah data tersebut dan menarik kesimpulan-kesimpulan yang teliti dan keputusan-keputusan yang logic dari pengolahan data tersebut (Hadi, 2004).
b. Batasan Khusus
Kata statistic juga digunakan untuk menunjuk kepada angka-angka pencatatan dari suatu kejadian atau kasus tertentu seperti misalnya :
- Statistic bentuk badan miss universe : 38 – 22 – 36 (dada – pinggang – pinggul)
- Statistik kecelakaan lalu lintas : januari 6, februari 38, Maret 21, …
- Statistic tinggi badan rata-rata : Rata-rata T = 164 cm, dst..
C. KONSEP DASAR
Dalam mengaplikasikan statistika terhadap permasalahan sains, industri, atau sosial, pertama-tama dimulai dari mempelajari populasi. Makna populasi dalam statistika dapat berarti populasi benda hidup, benda mati, ataupun benda abstrak. Populasi juga dapat berupa pengukuran sebuah proses dalam waktu yang berbeda-beda, yakni dikenal dengan istilah deret waktu.
Melakukan pendataan (pengumpulan data) seluruh populasi dinamakan sensus. Sebuah sensus tentu memerlukan waktu dan biaya yang tinggi. Untuk itu, dalam statistika seringkali dilakukan pengambilan sampel (sampling), yakni sebagian kecil dari populasi, yang dapat mewakili seluruh populasi. Analisis data dari sampel nantinya digunakan untuk menggeneralisasi seluruh populasi.
Jika sampel yang diambil cukup representatif, inferensial (pengambilan keputusan) dan simpulan yang dibuat dari sampel dapat digunakan untuk menggambarkan populasi secara keseluruhan. Metode statistika tentang bagaimana cara mengambil sampel yang tepat dinamakan teknik sampling.
Analisis statistik banyak menggunakan probabilitas sebagai konsep dasarnya hal terlihat banyak digunakannya uji statistika yang mengambil dasar pada sebaran peluang. Sedangkan matematika statistika merupakan cabang dari matematika terapan yang menggunakan teori probabilitas dan analisis matematika untuk mendapatkan dasar-dasar teori statistika.
Ada dua macam statistika, yaitu statistika deskriptif dan statistika inferensial. Statistika deskriptif berkenaan dengan deskripsi data, misalnya dari menghitung rata-rata dan varians dari data mentah; mendeksripsikan menggunakan tabel-tabel atau grafik sehingga data mentah lebih mudah “dibaca” dan lebih bermakna. Sedangkan statistika inferensial lebih dari itu, misalnya melakukan pengujian hipotesis, melakukan prediksi observasi masa depan, atau membuat model regresi.
- Statistika deskriptif berkenaan dengan bagaimana data dapat digambarkan dideskripsikan) atau disimpulkan, baik secara numerik (misalnya menghitung rata-rata dan deviasi standar) atau secara grafis (dalam bentuk tabel atau grafik), untuk mendapatkan gambaran sekilas mengenai data tersebut, sehingga lebih mudah dibaca dan bermakna.
- Statistika inferensial berkenaan dengan permodelan data dan melakukan pengambilan keputusan berdasarkan analisis data, misalnya melakukan pengujian hipotesis, melakukan estimasi pengamatan masa mendatang (estimasi atau prediksi), membuat permodelan hubungan (korelasi, regresi, ANOVA, deret waktu), dan sebagainya.
D. METODE STATISTIKA
a. Dua jenis penelitian: eksperimen dan survai
- Terdapat dua jenis utama penelitian: eksperimen dan survei. Keduanya sama-sama mendalami pengaruh perubahan pada peubah penjelas dan perilaku peubah respon akibat perubahan itu. Beda keduanya terletak pada bagaimana kajiannya dilakukan.
- Suatu eksperimen melibatkan pengukuran terhadap sistem yang dikaji, memberi perlakuan terhadap sistem, dan kemudian melakukan pengukuran (lagi) dengan cara yang sama terhadap sistem yang telah diperlakukan untuk mengetahui apakah perlakuan mengubah nilai pengukuran. Bisa juga perlakuan diberikan secara simultan dan pengaruhnya diukur dalam waktu yang bersamaan pula. Metode statistika yang berkaitan dengan pelaksanaan suatu eksperimen dipelajari dalam rancangan percobaan (desain eksperimen).
- Dalam survey, di sisi lain, tidak dilakukan manipulasi terhadap sistem yang dikaji. Data dikumpulkan dan hubungan (korelasi) antara berbagai peubah diselidiki untuk memberi gambaran terhadap objek penelitian. Teknik-teknik survai dipelajari dalam metode survei.
- Penelitian tipe eksperimen banyak dilakukan pada ilmu-ilmu rekayasa, misalnya teknik, ilmu pangan, agronomi, farmasi, pemasaran (marketing), dan psikologi eksperimen.
- Penelitian tipe observasi paling sering dilakukan di bidang ilmu-ilmu sosial atau berkaitan dengan perilaku sehari-hari, misalnya ekonomi, psikologi dan pedagogi, kedokteran masyarakat, dan industri.
2. Tipe pengukuran
Ada empat tipe pengukuran atau skala pengukuran yang digunakan di dalam statistika, yakni: nominal, ordinal, interval, dan rasio. Keempat skala pengukuran tersebut memiliki tingkat penggunaan yang berbeda dalam riset statistik.
- Skala nominal hanya bisa membedakan sesuatu yang bersifat kualitatif (misalnya: jenis kelamin, agama, warna kulit).
- Skala ordinal selain membedakan juga menunjukkan tingkatan (misalnya: pendidikan, tingkat kepuasan).
- Skala interval berupa angka kuantitatif namun tidak memiliki nilai nol mutlak (misalnya: tahun, suhu dalam Celcius).
- Skala rasio berupa angka kuantitatif yang memiliki nilai nol mutlak.
3. Tehnik-Tehnik Statistika
Beberapa pengujian dan prosedur yang banyak digunakan dalam penelitian antara lain:
- Analisis regresi dan korelasi
- Analisis varians (ANOVA)
- Chi-kuadrat
- Uji t-Student
E. FUNGSI DAN PERANAN STATISTIK
Menurut Guilford (Hadi, 2004), fungsi dan peranan statistic digambarkan sebagai berikut:
1. Statistik memungkinkan pencatatan paling eksak data penyelidikan
2. Statistic memaksa penyelidik menganut tata pikir dan tata kerja yang definit dan eksak
3. Statistic menyediakan cara-cara meringkas data ke dalam bentuk yang lebih banyak artinya dan lebih gampang mengerjakannya
4. Statistic memberi dasar-dasar untuk menarik kesimpulan-kesimpulan melalui proses-proses yang mengikuti tata yang dapat diterima oleh ilmu pengetahuan
5. Statistic memberi landasan untuk meramalkan secara ilmiah tentang bagaimana sesuatu gejala akan terjadi dalam kondisi-kondisi yang telah diketahui
6. Statistic memungkinkan penyelidik menganalisa, menguraikan sebab akibat yang kompleks dan rumit, yang tanpa statistic akan merupakan peristiwa yang membingungkan, kejadian yang tak teruraikan
BAB II
DISTRIBUSI FREKUENSI
A. DATA MENTAH
Adalah data yang sudah terkumpul tetapi belum terorganisasi secara numeric.
Contoh : kumpulan data berupa tinggi badan dari 100 orang mahasiswa yang diperoleh melalui daftar nama yang tercatat di universitas yang diurut berdasarkan abjad (Spiegel & Stephens, 2004).
B. DISTRIBUSI FREKUENSI
- Pada saat merangkum sejumlah besar data mentah, seringkali berguna jika kita mendistribusikan data-data tersebut ke dalam kelas atau kategori data serta menentukan banyaknya individu atau anggota dari masing-masing kelas yang disebut sebagai frekuensi kelas
- Suatu susunan data dalam bentuk tabel yang disusun berdasarkan kelas berikut dengan frekuensi kelasnya disebut sebagai distribusi frekuensi atau tabel frekuensi.
Contoh :
Tabel 2.1. Tinggi badan 100 orang mahasiswa universitas ABC
Tinggi badan (cm) | Banyaknya siswa |
160-162 163-165 166-168 169-171 172-174 | 27 42 18 8 5 |
Total | 100 |
Kelas (kategori) pertama, sebagai contoh, terdiri atas siswa-siswa yang memiliki tinggi badan berkisar antara 160-162 cm, dan ditunjukkan melalui symbol jangkauan atau kisaran 160-162. Karena lima siswa memiliki tinggi badan yang termasuk dalam kelas ini, maka frekuensi kelasnya adalah 5.
C. VARIABEL KONTINU DAN DISKRIT
Menurut Speiegel dan Stephens (2004), variabel adalah sebuah symbol seperti X. Y, H, x atau B yang dapat menyandang setiap nilai dari suatu himpunan nilai yang disebut sebagai domain dari variabel tersebut. Jika variabel hanya dapat menyandang satu nilai saja, maka variabel ini disebut dengan nama khusus sebagai konstanta.
Ada dua macam nilai variabel (Hadi,2004) yaitu :
1. Kontinu atau nilai yang bersambung
Misal : tinggi badan ; si A 165 cm, pada hakekatnya tinggi si A itu tidak mutlak tepat 165 cm, melainkan misalnya 165,30 cm. Pada umunya angka 165 cm itu untuk mewakili tinggi orang dari 164,50 cm – 165,49. Mereka yang tingginya 165,50 cm-166,49 cm dicatat 166 cm. Dengan kata lain, angka 0,50 ke atas dibulatkan ke atas, sedangkan angka dibawah 0,50 dihilangkan.
2. Diskrit atau nilai yang terpisah
Misal : hasil ujian yang dinilai benar dan salah atau lulus dan gagal merupakan nilai-nilai yang terpisah satu sama lain, sebab tidak ada nilai-nilai lain yang dipandang sebagi setengah benar atau setengah lulus.
Contoh lain : variabel jenis kelamin (laki-laki dan perempuan), pergi dan tinggal
D. JENIS DISTRIBUSI FREKUENSI
1. DISTRIBUSI FREKUENSI TUNGGAL
Contoh :
Mata pelajaran : Statistik
Murid : Laki-laki
Jumlah : 12 orang
Nilai-nilai
70 60 50 40 30 20 60 40 40 50 50 50
Tabel 2.2. Nilai statistik 15 mahasiswa
Nilai | Frekuensi (f) |
70 60 50 40 30 20 | 1 2 4 3 1 1 |
N+ = 12 |
N+ = jumlah frekuensi variabel
Tabel 2.2. disebut Tabel distribusi frekuensi tunggal. Istilah “distribusi” digunakan dalam statistic untuk menunjuk (seolah-olah) “penyebaran” nilai-nilai dengan jumlah orang yang mendapat nilai tu, sedang istilah “tunggal” menunjukkan tidak adanya pengelompokan nilai-nilai variabel dalam kolom pertama.
2. DISTRIBUSI FREKUENSI BERGOLONG
Contoh :
Psikotes : Intelegensi
Subjek : Calon mahasiswa psikologi
Tahun : 2010/2011
Jumlah : 26 orang
Nilai-nilai
80 85 87 90 93 95 98 100 82 82 115 113 81
111 83 84 91 93 99 116 95 88 81 82 99 98
Tabel 2.3. Hasil psikotes calon mahasiswa psikologi tahun 2010/2011
Kelompok Nilai | Frekuensi (f) |
80-90 91-101 102-112 113-123 | 12 10 1 3 |
N+ = 26 |
Nilai intelegensi tertinggi adalah 116, terendah adalah 80. Apabila dibuat tabel distribusi tunggal , maka kita harus membuatnya sepanjang 21 baris. Untuk menyingkat ruangan dan menghemat tenaga, maka dilakukan pengelompokkan seperti diatas.
3. ISTILAH DALAM DISTRIBUSI BERGOLONG
a. Interval kelas
- Yaitu tiap-tiap kelompok nilai variabel.
- Biasa disingkat dengan sebutan kelas atau interval saja. Dalam statistic bilamana orang menyebut kelas atau interval, yang dimaksud adalah interval kelas.
Dari tabel 2.3. diatas ada empat interval kelas dengan masing-masing sebelas nilai variabel. Misal interval kelas yang paling atas berisi nilai-nilai 80, 81, 82, 83, 84, 85, 86, 87, 88, 89 dan 90, namun yang ditulis hanya nilai 80 dan 90.
b. Batas kelas
- Yaitu nilai-nilai yang membatasi kelas yang satu dari kelas yang lain.
Misalnya : nilai 80 dan 90 pada kelas terendah, yang tertinggi 113 dan 123.
- Batas atas (lower limits): 90, 101, 112 dan 123
(Hadi, 2004)
- Batas bawah (upper limits) : 80, 91, 102, dan 113
- Batas kelas atas 90,5; 101,5; dst
(Spiegel & Stephens, 2004)
- Batas kelas bawah 80,5 ; 91,5 ; dst
-
c. Lebar kelas adalah jumlah nilai-nilai variabel dalam tiap-tiap kelas.
Misal lebar kelas dari tabel 2.3. ada sepuluh yaitu 80, 81, 82, 83, 84, 85, 86, 87, 88, 89 dan 90.
- Biasa diberi symbol “i” atau “h”. Misal : “i”= 10 artinya bahwa distribusi frekwensi disusun dalam tabel atau grafik yang menggunakan interval kelas dengan isi sepuluh angka atau nilai dalam tiap-tiap intervalnya.
d. Titik tengah adalah angka atau nilai variabel yang terdapat ditengah-tengah interval kelas.
Misal : 13, 14,15 maka titik tengahnya 14
20, 21, 22 dan 23 maka titik tengahnya ½ (20+23) = 21, 5
- Kadang-kadang disebut sebagai tanda kelas
e. Jumlah interval adalah banyaknya interval yang digunakan dalam penyusunan distribusi. Dalam tabel 2.3. jumlah intervalnya ada empat.
f. Jarak pengukuran adalah angka tertinggi dari pengukuran dikurangi dengan angka terendah. Biasa juga disebut sebagai Range of Measurement atau disingkat huruf R.
- R hanya dimiliki oleh variabel kontinu saja
4. MENENTUKAN JUMLAH INTERVAL
Ada beberapa faktor yang mempengaruhi penetapan jumlah interval, yaitu :
a. Jumlah frekuensi (N)
b. Jarak pengukuran (R)
c. Lebar interval yang hendak digunakan (i)
d. Tujuan penyusunan distribusi itu
Prinsipnya jumlah interval kelas jangan terlalu sedikit, sehingga pola-pola kelompok menjadi kabur. Misal : hanya membagi menjadi dua kelompok (tabel dengan dua interval) : anak-anak dengan nilai baik dan buruk, sehingga tidak dapat dketahui anak-anak dengan nilai sedang, cukup dsb. Namun, jangan pula terlalu besar, sehingga kita tidak akan mendapatkan gambaran tentang pola kelompok. Dalam psikologi, biasanya digunakan 5-15 interval.
5. MENENTUKAN LEBAR INTERVAL
i = Jarak pengukuran ( R ) Jumlah interval |
Contoh :
Tinggi orang tertinggi di Indonesia 180 cm, yang terendah 145 cm, jumlah interval sebanyak 9 buah, maka
i = 180,5 – 144,5
9
i = 36 / 9 = 4
Tabelnya :
Interval tinggi badan
177 – 180
173 – 176
169 – 172
165 – 168
161 – 164
157 – 160
153 – 156
149 – 152
145 – 148
6. DISTRIBUSI FREKUENSI MENINGKAT (CUMULAT IVE FREQUENCY DISTRIBUTION)
Pada dasarnya sama saja dengan penyusunan distribusi frekuensi tunggal maupun distribusi frekuensi bergolong. Bedanya dengan penyusunan kedua distribusi itu ialah menambahkan satu kolom lagi yang memuat frekuensi meningkat.
Contoh :
Tabel 2.4. Nilai berhitung 72 siswa ornag murid laki-laki SR di kota Y
Nilai | Frekuensi (f) | Frekuensi meningkat dari bawah | Frekuensi meningkat dari atas |
8 7 6 5 4 | 4 23 28 16 1 | 72 68 45 17 1 | 4 27 55 71 72 |
Jumlah | Σ f= N = 72 |
Keterangan :
Banyaknya anak yang mendapat “sesuatu nilai ke bawah”. Mereka yang mendapat nilai enam ke bawah misalnya, jumlah ada 45 orang, sedang mereka yang mendapat nilai tujuh ke bawah jumlahnya ada 68 orang.
makalah ini diambil dari blog di bawah ini : untuk lebih jelasnya bisa kunjungi di blog bawah ini. :
sumber : http://riiooemge.blogspot.co.id/2011/10/materi-kuliah-statistik-1.html
Tidak ada komentar:
Posting Komentar