Hidup kita tak akan lepas dari statistik. Mulai dari iklan produk perawatan kulit yang memberikan klaim bisa memutihkan kulit dalam waktu empat belas hari hingga klaim elektabilitas tokoh politik tertentu.
Mengapa kita membutuhkan angka-angka untuk memvalidasi? Karena angka-angka tersebut seolah menjadi klaim yang bermakna yang akan memengaruhi pengambilan keputusan.
Nah, sayangnya, orang dapat menggunakan statistik untuk keuntungan pribadi mereka. Buku “How to Lie with Statistics” merupakan buku yang ditulis pada tahun 1954 (ya, Anda tidak salah baca) oleh Darrel Huff yang masih relevan dengan kondisi terkini.
Buku ini akan memberikan pemahaman tentang bagaimana statistik dapat mengelabuhi kita sehingga diharapkan kita bisa waspada terhadap penyajian angka.
Ringkasan Buku How to Lie with Statistics
Buku “How to Lie With Statistics” memberikan beberapa pelajaran amat berharga tentang “statistikal thinking” yang memberikan kemampuan untuk memahami logika statistik. Berikut ringkasannya :
- Hati-Hati dengan Sampel yang Bias
Apa yang akan Anda lakukan untuk mengetahui berapa apel merah di tong yang ada di sebuah perkebunan? Kita bisa mengumpulkan seluruh apel dan kemudian menghitungnya tanpa kecuali. Namun, hal tersebut tentu membutuhkan waktu dan biaya yang besar.
Statistik memudahkan perhitungan kita. Untuk membuat estimasi statistik, kita membutuhkan sampel yang merupakan kumpulan data yang dipilih secara hati-hati untuk merepresentasikan keseluruhan dari apapun yang ingin kita analisis.
Mengingat sampel merupakan basis pengambilan kesimpulan, maka menciptakan sampel yang bagus merupakan hal yang sangat krusial. Syarat sampel bagus ada dua : jumlahnya cukup besar untuk signifikan secara statistik dan sampel tersebut harus bersifat random atau acak.
Contohnya jika kita ingin mewawancarai perempuan berusia 30 tahun tentang seberapa sering mereka berbelanja komestik secara online, kita harus memilih perempuan berusia 30 tahun secara acak dengan mengesampingkan penghasilan, status sosial, dan lain sebagainya.
Pada kenyataannya, memperoleh sampel yang benar-benar acak itu sulit dilakukan!
Kembali ke contoh apel merah tadi, sampel bagus akan diperoleh bila apel di tong tercampur acak, kita tinggal memasukkan tangan dan mengambil sampelnya. Namun bagaimana jika isi tong tidak tercampur dan kita hanya mengambil sampel dari bagian atas saja yang mana nggak ada apel merahnya dan hanya ada apel hijau?
Jika, kemudian kita mendasarkan sampel pada apel hijau yang kita peroleh tersebut dan mengambil kesimpulan bahwa tong apel tersebut penuh berisi apel hijau, kita akan terkena perangkap “sample bias”.
Ya, sampel yang tidak acak dapat membuat bias dalam sebuah percobaan atau penelitian.
- Hati-Hati dengan Bias Rata-Rata (Averages)
Apabila kita ingin mengetahui sebuah data, kerapkali kita mencari rata-rata dari data yang dituju. Misalnya, berapa rata-rata penghasilan dari alumni universitas X pada usia mereka yang ke-35? Berapa rata-rata biaya pendidikan di kota Jakarta untuk anak PAUD?
Namun, hati-hati. Rata-rata (average) dapat dipilih pembuat data sesuai kepentingannya. Ada tiga jenis rata-rata (average) dalam statistik : mean, median, dan mode.
Pertama, mean yang diperoleh dengan menjumlahkan seluruh variable dan kemudian membagi total tersebut dengan jumlah variabel. Misalnya, kita memiliki 100 responden alumni universitas X yang berusia 35 tahun. Kita jumlahkan keseluruhan penghasilan mereka lalu kita bagi 100 sesuai dengan jumlah responden untuk memperoleh nilai mean.
Kedua, median yang merupakan titik tengah dari sampel. Contohnya, kita memiliki urutkan data penghasilan 100 responden dari yang terkecil hingga terbesar. Karena sampel kita berjumlah 100, maka median kita penghasilan urutan ke-50 dan 51 lalu kita bagi 2. Apabila sampel kita berjumlah 99, maka median kita merupakan nominal penghasilan dengan urutan ke-50.
Ketiga, mode yang menunjukkan penghasilan yang paling umum untuk alumni universitas tersebut. Jika mayoritas alumni menghasilkan pendapatan tahunan sebesar Rp300 juta, maka Rp300 juta merupakan mode.
Jadi, dapat disimpulkan bahwa istilah “rata-rata” atau average tidak hanya sekadar mean sehingga perlu dipastikan metode perhitungan rata-rata mana yang digunakan.
- Pentingnya Sampel dalam Jumlah yang Cukup
Di atas sudah disebutkan tentang sampel yang bagus secara statistik yakni berjumlah cukup dan bersifat acak. Mengapa? Karena jika jumlah sampe terlalu sedikit maka tidak signifikan secara statistik.
Penjelasannya begini. Apabila kita punya koin, berapa persentasenya kita dapat sisi kepala? Yak, 50 persen. Yuk, kita lemparkan koinnya 10 kali, berapa banyak kita dapat sisi kepala? 5 kali? Mungkin, tapi kayaknya enggak juga.
Lalu, kenapa ya kita nggak dapat sisi kepala sebanyak 5 kali sesuai prediksi? Karena percobaannya nggak diulang dalam jumlah yang cukup sehingga menjadi bias kesempatan (biased by chance). Semakin sering kita mengulang lempar koin, semakin dekat kita dengan kemungkinan mendapatkan peluang 50% tersebut.
Oleh karena itu, penelitian yang dapat diandalkan menggunakan sampel dalam jumlah yang signifikan secara statistik untuk menjamin hasil percobaan tidak memiliki bias kesempatan seperti lemparan koin tadi.
Maka, apabila sebuah penelitian gagal memperoleh sampel yang cukup secara statistik, penelitian tersebut dapat menghasilkan bias signifikansi (significance bias). Konsekuensinya, penelitian menghasilkan hasil yang sensasional.
Jadi, misal sebuah produk pasta gigi baru memberi klaim, “Pengguna ini melaporkan karang gigi berkurang 23% dengan pasta gigi ini,” kita memiliki alasan untuk bersikap skeptis. Mungkin saja, mereka menggunakan sampel yang sedikit untuk memperoleh hasil yang bagus dengan memanfaatkan bias kesempatan.
Ingat kemungkinan hasil dari pasta gigi baru cuma tiga : karang gigi yang lebih sedikit, lebih banyak, atau sama saja.
Jika dalam periode waktu tertentu, orang-orang dalam penelitian pasta gigi tersebut tidak menunjukkan perubahan apa-apa tentang karang gigi mereka, peneliti tinggal mengabaikan hasilnya. Lalu, peneliti bisa melanjutkan eksperimennya hingga karang gigi itu sembuh sendiri (heal by chance) dan mencurangi percobaan untuk memperoleh hasil yang diinginkan.
Waspada dengan Data
Disraeli, mantan Perdana Menteri Inggris, pernah mengatakan, “There are three kinds of lies : lies, damned lies, and statistiks”. Jika kita tidak waspada dengan penyajian data, kita bisa tertipu oleh statistik.
Ingat, datanya riil alias bukan kebohongan tetapi orang-orang bisa memanfaatkan pengetahuan statistik untuk menciptakan berbagai bias yang menguntungkan mereka.
Maka, wajib bagi kita untuk waspada dengan klaim data yang bisa berpengaruh terhadap pengambilan keputusan. Buku “How to Lie with Statistics” merupakan buku yang bagus banget dipelajari untuk kamu yang mau berkenalan dengan statistik dan contoh nyatanya dalam kehidupan.