Inisiasi 1
Pengertian Data dan
Statistik
Data dan statistik mempunyai hubungan yang sangat
erat. Selain itu, keduanya juga mempunyai hubungan yang sangat erat dengan
kehidupan manusia sehari-hari, dengan bidang ilmu pengetahuan, baik yang
eksakta, sosial, ekonomi, bisnis dan lain-lain. Data dan statistik serta fungsi
keduanya, banyak memberikan kegunaan yang sangat tidak ternilai bagi manusia,
bagi kita semua.
DATA,
KEGUNAAN DAN FUNGSINYA
Anda sebagai individu, seorang manajer, atau
mungkin seorang pengusaha, menginginkan untuk:
v Mengetahui siapa saja yang akan pensiun tahun depan, dari bagian mana, apa
jabatannya, berapa pesangon yang akan didapat, dan sebagainya. Tujuannya adalah
antara lain:
· Mempersiapkan dana, berapa besarnya untuk pembayaran pesangon mereka.
· Mempersiapkan penerimaan karyawan baru untuk mengganti karyawan yang bakal
pensiun tersebut (walaupun tidak semua).
Untuk maksud tersebut, Anda memerlukan data berupa data pegawai, yang
mungkin cukup didapat dari dalam perusahaan sendiri.
<!..more..>
<!..more..>
v Mengetahui tingkat kepuasan konsumen produk yang anda pasarkan, bagaimana
respon mereka terhadap mutu produk Anda, harga, pelayanan dan sebagainya. Untuk
inipun, Anda perlu data, malah mungkin data tersebut perlu dikumpulkan di
lapangan melalui survei (terlepas dari apakah dilakukan sendiri atau dengan
membayar lembaga riset yang Anda percayai).
v Mengetahui apakah proses produksi saat ini masih terkendali atau tidak.
Berapa persen dari produksi yang tertolak karena dianggap cacat, lengkap dengan
perinciannya per mesin, per lokasi, kapan, mengapa dan lain-lain. Untuk inipun,
Anda memerlukan data (yang didapat dari bagian produksi).
v Mengetahui perkembangan perekonomian (trend) untuk jangka waktu tertentu,
pertumbuhan penduduk penduduk, pendapatan nasional dan sebagainya . Termasuk
juga mengetahui faktor-faktor atau variabel yang mempengaruhi pertumbuhan ekonomi.
Dari contoh-contoh tersebut diatas, kita
mengetahui betapa pentingnya data. Dengan data, kita mengetahui gambaran
perusahaan sekarang, masalah apa yang sedang dihadapi, mengapa terjadi
masalah-masalah tersebut, bagaimana cara pemecahannya. Dengan data, kita dapat
meramal atau memperkirakan, apa yang kira-kira bakal terjadi di masa mendatang.
Dengan data, kita pun bisa membuat perencanaan, peramalan, mengontrol
pelaksanaan, mengevaluasi target apakah tercapai atau tidak, dan sebagainya.
Dengan adanya data, kita dapat banyak mengetahui tentang berbagai hal. Dengan
data, kita bisa mengambil keputusan-keputusan, kebijakan-kebijakan perusahaan,
dan sebagainya. Pendeknya, fungsi dan manfaat data sangat penting dan banyak
sekali. Sering kali, akan berbahaya jika kita mengambil kesimpulan dan
keputusan tanpa didukung oleh data. Orang bilang ”Speak with data”, berbicaralah dengan data agar objektif dan lebih
akurat. Sebenarnya apa itu data?
PENGERTIAN
DATA DAN PENGGOLONGANNYA
Dari uraian di atas, sebenarnya data adalah
kumpulan keterangan atau informasi yang diperoleh dari suatu pengamatan, dapat
berupa angka, lambang atau sifat. Jika kita mendapatkan data yang tidak baik,
sebaik apa pun cara pengolahan data yang kita lakukan, hasilnya atau kesimpulan
yang didapat dari data tersebut tetap tidak baik. Semisal, ungkapan ”garbage in, garbage out”, yang artinya
jika yang masuk sampah, yang keluar pun juga sampah. Jadi, syarat utama agar
analisa data secara statistik menghasilkan informasi atau kesimpulan yang baik
adalah data yang diolah haruslah juga baik.
Apa itu data yang baik? Data yang baik adalah data yang sifatnya representatif (mewakili), objektif
(sesuai dengan apa yang ada atau yang terjadi), relevan (ada hubungannya dengan
persoalan yang sedang dihadapi dan akan dipecahkan), mempunyai tingkat
ketelitian yang tinggi atau standard error (kesalahan baku) yang kecil.
Dari mana data diperoleh? Data dapat diperoleh dari sumber internal (internal data) dan sumber eksternal (external data). Data internal adalah data yang didapat oleh
organisasi itu sendiri untuk keperluan operasi sehari-hari. Organisasi dimaksud
dapat berupa instansi pemerintah maupun swasta, misalnya departemen-departemen,
Biro Pusat Statistik, BAPPENAS, BUMN, perusahaan-perusahaan swasta dan
sebagainya. Sedangkan, data eksternal adalah data yang didapat dari luar
organisasi yang bersangkutan, biasanya menggambarkan keadaan di luar organisasi
tersebut. Contoh data jenis ini misalnya data pendapatan nasional, penduduk,
harga-harga bahan pokok yang dukumpulkan oleh Biro Pusat Statistik, data
keuangan negara yang dikumpulkan oleh departemen keuangan, data perbankan dari
Bank Indonesia dan sebagainya, termasuk data yang dikumpulkan oleh badan-badan
internasional, seperti UNESCO, IMF, FAO dan lain-lain.
1. DATA KUANTITATIF DAN DATA KUALITATIF
v DATA KUANTITATIF
Banyak data yang berbentuk angka atau bilangan, misalnya luas tanah, jumlah
penduduk dan sebagainya. Untuk jenis data ini dapat dilakukan
perhitungan-perhitungan atau operasi matematika, seperti penambahan,
pengurangan, perkalian, pembagian dan sebagainya. Data kuantitatif nilainya
bisa berubah-ubah sehingga disebut variabel.
Data kuantitatif dapat dibagi atas:
· Data Interval
Ukuran data mempunyai interval atau jarak, misalnya berat badan antara
50-60 kg.
· Data Rasio
Data berupa angka dalam arti yang sebenarnya, sehingga mempunyai nilai nol.
Data jenis ini diperoleh melalui pengukuran dan memiliki tingkat pengukuran
paling tinggi diantara jenis data lainnya.
v DATA KUALITATIF
Data kualitatif adalah data yang bukan berbentuk angka atau bilangan,
misalnya kepuasan pelanggan (sangat puas, puas, kurang puas dan sebagainya),
sehingga kita tidak dapat melakukan operasi matematika terhadapnya. Jenis data ini disebut atribut.
Data kualitatif dapat dibagi atas:
·
Data nominal
Ukuran data nominal adalah kategori, misalnya jenis kelamin, laki-laki atau
wanita, tempat tinggal dan sebagainya. Dilihat dari tingkat pengukuran data,
data nominal mempunyai tingkatan yang paling rendah dari jenis data lainnya.
Hal tersebut karena walaupun dalam prakteknya data ini bisa diangkakan, tetapi
terhadapnya tidak bisa dilakukan operasi matematika. Contoh pemberian angka
tersebut di atas misalnya, angka ’1’ untuk yang tinggal di Jakarta, ’2’ untuk
yang tinggal di Bandung, ’3’ untuk Surabaya dan sebagainya.
· Data Ordinal
Data ordinal hampir sama dengan data nominal, hanya saja data orrdinal
mempunyai tingkatan data atau urutan kelas, ada yang lebih tinggi ada yang
lebih rendah. Contoh data ini adalah data tentang kepuasan pelanggan, yang
dibagi menjadi sangat puas, tidak puas, antara puas dan tidak puas, tidak puas
dan sangat tidak puas. Data ordinal mempunyai tingkatan yang lebih tinggi dari
data nominal. Walaupun mempunyai tingkatan, terhadap jenis data ini kita tetap
tidak dapat melakukan operasi matematika.
Dilihat dari tingkat data, urutan dari yang paling tinggi adalah data
rasio, data interval, data ordinal dan paling rendah data nominal.Untuk
mengolah data kualitatif (data nominal dan ordinal), biasanya digunakan
statistik non parametrik, sedangkan untuk data kuantitatif digunakan statistik
parametrik.
2.
DATA INTERNAL DAN DATA EKSTERNAL
· DATA INTERNAL
Data yang berasal dari dalam organisasi atau perusahaan sendiri. Data jenis
ini biasanya berkaitan langsung dengan organisasi sendiri, misalnya data
keuangan (neraca, laporan laba-rugi dan sebagainya), data kepegawaian, data
produksi dan lain-lain.
· DATA EKSTERNAL
Data yang berasal bukan dari dalam organisasi perusahaan sendiri. Data ini
sering tidak berkaitan langsung dengan organisasi sendiri, misalnya data
tentang jumlah kendaraan di Jakarta, jumlah penduduk di suatu desa dan
lain-lain.
3.
DATA PRIMER DAN DATA SEKUNDER
· DATA PRIMER
Data yang dukumpulkan, diolah serta diterbitkan sendiri oleh organisasi
yang menggunakannya. Contoh jenis data ini adalah data kependudukan yang dibuat
oleh Biro Pusat Statistik, data tentang pertanian yang dibuat oleh Departemen
Pertanian dan sebagainya.
· DATA SEKUNDER
Data yang tidak dibuat atau diterbitkan oleh penggunanya, misalnya data
tentang jumlah kendaraan dari Departemen Perhubungan merupakan data primer bagi
Departemen tersebut karena dibuat dan diterbitkannya, tapi merupakan data
sekunder bagi PT X sebagai pengguna, yang mendapatkannya dari sumber lain
(misalnya media massa) yang mengutipnya. Jadi, orang bisa mendapatkan data
sekunder dari harian, majalah, buletin dan media massa lainnya yang mengutip
data dari sumber-sumber lain yang menerbitkannya (misalnya data dikutip dari
departemen, Biro Pusat Statistik, Bank Indonesia dan lain-lain). Dengan
demikian, data eksternal bisa berupa data primer, bisa juga berupa data
sekunder.
4.
DATA DISKRIT DAN DATA KONTINYU
Seperti telah dikatakan di muka, data kuantitatif
disebut variabel, karena nilainya atau besarnya bisa berubah-ubah, data ini
dapat mempunyai variabel diskrit sehingga disebut data diskrit, dapat juga
mempunyai variabel kontinyu atau indiskrit dan disebut dengan data kontinyu.
Data diskrit adalah data yang sifatnya terputus-putus, nilainya bukan merupakan pecahan
(angka utuh). Sedangkan data kontinyu adalah data yang sifatnya sinambung atau kontinyu, nilainya bisa berupa
pecahan. Contoh data diskrit adalah data tentang jumlah penduduk, kendaraan dan
sebagainya, sedangkan contoh data kontinyu adalah data tentang hasil panen
padi, panjang jalan, berat sapi dan sebagainya.
Statistik atau statistika adalah ilmu yang
berhubungan dengan cara pengumpulan, pengolahan atau analisis, penyajian data
dan cara pengambilan kesimpulannya. Fungsi utamanya adalah membantu dalam
pengambilan keputusan dan keputusan tentang parameter populasi dengan
menggunakan data sampel yang diambil dari populasi tersebut.
PENGGOLONGAN
STATISTIK
Statistik dapat digolongkan dengan berbagai cara.
STATISTIK
DESKRIPTIF DAN INDUKTIF (INFERENSI)
· STATISTIK DESKRIPTIF
Statistik Deskriptif berusaha menjelaskan atau menggambarkan berbagai
karakteristik data, seperti berapa rata-ratanya, seberapa jauh data bervariasi
dan sebagainya, tanpa membuat interpretasi apa-apa terhadap data tersebut.
· STATISTIK INDUKTIF
(INFERENSI)
Statistik Induktif berusaha membuat berbagai inferensi terhadap sekumpulan
data yang berasal dari suatu sampel. Tindakan inferensi tersebut misalnya
melakukan perkiraan, peramalan, pengambilan keputusan dan sebagainya.
STATISTIK
PARAMETRIK DAN NON PARAMETRIK
· STATISTIK PARAMETRIK
Statistik Parametrik adalah statistik induktif untuk populasi yang parameternya
telah memenuhi persyaratan-persyaratan tertentu (misalnya, sebaran data
mengikuti distribusi normal)
· SATISTIK NON PARAMETRIK
Statistik non parametrik adalah statistik induktif yang berusaha mengambil
kesimpulan tentang keseluruhan populasi yang parameternya tidak memenuhi
persyaratan, yaitu tidak mengikuti suatu distribusi tertentu. Jadi, statistik
non parametrik digunakan untuk populasi yang tidak menetapkan
persyaratan-persyaratan parameter populasinya.
PENGERTIAN
DALAM STATISTIK PENTING YANG PERLU DIPAHAMI: POPULASI, ELEMEN, SAMPLING DAN
SAMPEL
Populasi adalah kumpulan semua elemen yang ada
yang akan diobservasi atau diteliti, sedangkan sampling adalah pengambilan
sebagian kecil dari seluruh elemen populasi tersebut yang dijadikan sebagai
contoh atau sampel yang dianggap dapat mewakili seluruh elemen dalam populasi.
Sedangkan sampling adalah cara pengumpulan data dengan mengambil sampel atau
contoh dari seluruh anggota populasi.
Misalkan, ada 100 orang murid kelas 3 di SMU
Garuda. Pimpinan Sekolah ingin melihat prestasi ujian matematika mereka pada
tahun 2001 yang lalu dan untuk itu diadakan pencatatan nilai ujian dari setiap
murid yang berjumlah 100 murid tersebut satu per satu tanpa kecuali. Setiap
murid tersebut disebut elemen.
Kumpulan dari 100 orang murid tersebut (seluruh elemen) disebut populasi dan pekerjaan untuk meneliti
seluruh elemen yang terdapat dalam populasi disebut sensus. Jika untuk maksud tersebut, hanya diambil 20 murid saja
sebagai contoh, hal tersebut disebut sampling,
dan contoh yang diambil dinamakan sampel.
Jika data yang didapat dari sensus dinamakan data sebenarnya (true value), data yang
terdapat dari sampling merupakan data dugaan sehingga nilainya dinamakan nilai perkiraan (estimate value). Nilai
perkiraan tentunya tidak akan sama betul dengan nilai sebenarnya, tentu ada
selisih. Selisih ini disebut kesalahan
perkiraan (error estimate) atau kesalahan
sampling (sampling error) dan jika nilainya kecil, cara pengumpulan data
dengan sampling masih dapat dipertanggung-jawabkan.
Agar data yang diperoleh dari sampling mempunyai
nilai kepercayaan yang tinggi (valid)
atau nilai kesalahan perkiraannya sekecil mungkin, dalam pengambilan sampel
kita harus mengikuti metode pengambilan sampel yang baik (termasuk jumlah
sampel yang harus diambil), sesuai dengan keadaan populasinya. Ada berbagai
macam teknik sampling namun tidak akan dibahas di sini.(Silakan lihat Modul
Metode Penelitian)
Alasan-alasan mengapa kita menggunakan sampling:
· Menghemat waktu, tenaga dan biaya.
· Secara teknis, tidak mungkin mengamati seluruh anggota populasi. Misalnya,
meneliti seluruh jumlah ikan yang terdapat di suatu sungai, meneliti seluruh
jumlah kelelawar di suatu hutan, jumlah seluruh kendaraan di suatu negara dan
sebagainya.
· Pengamatan terhadap seluruh anggota populasi dapat bersifat merusak.
Misalnya, pengaruh pemakaian narkoba terhadap kerusakan otak.
· Contoh lain-lain yang bergantung pada pertimbangan peneliti atau pengguna
data.
Secara teoritis atau logika, hasil analisa atau
pengolahan data yang dihasilkan oleh sensus (harusnya) memberikan data yang sebenarnya (true value).
Sebaliknya, karena sampling hanya mengambil sebagian elemen saja yang ada dalam
populasi, hasil analisa datanya hanya merupakan perkiraan (estimate value). Mengingat alasan-alasan dan
pertimbangan-pertimbangan tersebut, khususnya oleh karena sensus biasanya
memerlukan biaya, tenaga dan waktu yang lebih banyak dibandingkan dengan
sampling, maka pada umumnya penelitian dilakukan hanya dengan cara sampling
saja, dengan catatan pelaksanaan sampling tersebut dilakukan dengan baik. Baik
dalam hal ini artinya, baik metode sampling maupun pelaksanaan pengumpulan
datanya dilakukan dengan benar dan cermat, sehingga perkiraan yang diperoleh
tidak banyak berbeda dari keadaan populasi yang sebenarnya.
Sampling yang baik pun tidak akan sempurna betul,
selalu ada ketidaksempurnaan atau kesalahan (sampling error). Untuk dapat
mewakili seluruh elemen dalam populasi harus diusahakan agar sampling
dilaksanakan dengan sebaik-baiknya sehingga kesalahan yang terjadi dapat
sekecil mungkin. Jadi, seperti halnya dalam sensus, dalam melakukan sampling
pun, kesalahan selalu dapat terjadi. Jika nilai sampling ternyata sama betul
dengan nilai yang sebenarnya seperti yang dilakukan pada sensus, hal tersebut
hanya bersifat kebetulan.
Berapa besarnya sampel
agar didapat data yang baik sehingga dapat mewakili suatu populasi? Untuk
mengetahui berapa jumlah sampel, biasanya digunakan rumus-rumus sebagai berikut
-->
P = Estimasi atau perkiraan proporsi populasi
Z = Nilai Z yang sesuai dengan interval keyakinan yang ditentukan
E = Kesalahan (error) maksimum yang diizinkan
Kesalahan (error) yang diizinkan misalnya sebesar
5%, berarti ketelitian yang diinginkan dalam pendugaan parameter populasi
(interval keyakinan) adalah sebesar 95% (100%-5%), dan jika error yang
diizinkan sebesar 1%, berarti tingkat ketelitian (interval keyakinan) yang
ingin dicapai sebesar 99% (100%-1%). Dengan demikian, besarnya sampel
bergantung pada interval keyakinan yang digunakan (error maksimum yang
diizinkan) dan deviasi standar atau estimasi proporsi populasi (ukuran sampel
untuk proporsi). Jika deviasi standar atau proporsi populasi belum diketahui,
kita perlu mengadakan survey pendahuluan dengan ukuran sampel yang kecil untuk
menduga deviasi standar populasi. Deviasi standar populasi dapat juga dilakukan
berdasarkan pengetahuan tentang populasi.
Perhitungan deviasi standar distribusi sampling
harus dikoreksi dengan faktor koreksi sebesar
Jika ukuran sampel (n) dibagi ukuran populasi (N)
relatif cukup besar, akan tetapi jika ukuran populasi besar sekali apalagi tak
terhingga atau ukuran populasi terbatas tapi relatif
kecil, faktor koreksi tidak diperlukan.
Dari rumus tersebut di atas, semakin tinggi
interval keyakinan maka semakin besar ukuran sampel yang dibutuhkan. Untuk
lebih jelasnya, jika kita ingin yakin 100% interval duga akan sama dengan
parameter populasi jumlah sampel yang harus diambil adalah seluruh populasi,
ini berarti sama dengan sensus.
PARAMETER
DAN SAMPLING ERROR
Seperti telah diterangkan dimuka, baik dalam
melaksanakan sensus maupun cara pengambilan sampel (sampling), kesalahan dapat
saja terjadi (error sampling) baik disengaja maupun yang tidak disengaja. Jenis
kesalahan yang mungkin terjadi dimaksud adalah:
· Kesalahan secara umum (baik sensus maupun sampling):
· Kesalahan mencatat (recording’s error),
· Kesalahan mengukur (measurement’s
error),
· Kesalahan menjawab (response’s error),
· Kesalahan mengingat (recal’s error),
· Kesalahan mengamati (observation’s
error) dan sebagainya.
· Kesalahan lainnya khusus dalam sampling :
·
Kesalahan penentuan responden (misspecification
of sample subject).
· Kesalahan variasi acak (random
variation error).
· Kesalahan penarikan sampel (sampling
error).
· Kesalahan spesifikasi (specification
error).
· Kesalahan karena tidak lengkapnya respon (non response error).
· Kesalahan karena tidak lengkapnya cakupan elemen populasi (coverage error) dan sebagainya.
-->
No comments:
Post a Comment