Ribut-Ribut Quick Count

Mumpung lagi rame-rame-nya bahas Quick Count (QC), saya akan mengulas sedikit mengenai QC dalam ilmu Statistik, sedikit mengelaborasi postingan teman saya yang saya share sebelumnya di Facebook.

Saya rasa kita semua yang pernah belajar Matematika, atau Statistik dan Probabilitas di mata kuliah dasar, akan mengerti betapa powerful-nya ilmu ini dalam urusan ramal-meramal. Saya beruntung pernah mendapatkan dosen yang selalu bercerita tentang anekdot-anekdot di balik setiap konsep Matematika. Misalnya waktu beliau mengajarkan konsep modulus (pembagian sisa angka), beliau bercerita tentang adegan di film Matrix, si Neo berjalan di stasiun subway ke kanan, mengilang di sisi kanan dan selalu muncul dari arah kiri. Itulah modulus, kata beliau sambil nyengir khas. Hal-hal “emosional” begini akan membuat materi jauh lebih dimengerti dan menempel hingga belasan tahun berikutnya. Seperti Matrix dan modulus ini.

Statistik adalah salah satu pondasi ilmu komputer. Jika tidak ada Statistik, Google tidak akan sehebat sekarang. Tidak akan ada Machine Learning dan Big Data. Dan tentu saja, mungkin hari ini tidak ada heboh-heboh orang mempersoalkan quick count. Hasil pemenang Pilpres baru akan diketahui berminggu-minggu setelah KPU selesai menghitung suara.

Ada yang bertanya kepada saya, kenapa saya yakin dengan hasil QC yang dirilis pollster yang memenangkan 01? Pertama, karena selain secara historis, mereka selalu akurat dalam QC. Dalam kasus Pilkada DKI, QC sempat memenangkan BTP karena data masih bergerak dan belum semua masuk. Ketika data QC masuk 100%, semua polster memenangkan Anies Baswedan. Sesuai. Kedua, karena QC berbasis Statistik yang pernah saya pelajari. Jadi basisnya ini ilmiah yang bisa di-cross-check kebenarannya.

Adalah ulama bernama Gauss dan Laplace yang berjasa dalam menemukan distribusi normal. Distribusi normal ini fungsinya adalah untuk menghitung probabilitas dalam sebuah populasi yang sedang diteliti. Kurang lebih begini: kondisi populasi dalam distribusi normal, cenderung mendekati nilai rata-ratanya. Sehingga, jika sebuah populasi terdistribusi normal, saya bisa menebak kondisi keseluruhan tanpa harus melihat keseluruhan populasi (hitung satu per satu). Saya cukup melakukan sampling beberapa secara acak.

Nah! Quick Count bersandar pada teori ini. Untuk mengetahui hasil Pilpres di seluruh Indonesia, saya tidak perlu menghitung keseluruhan populasi. Dengan asumsi populasi Pilpres terdistribusi normal, saya tinggal mengambil sampling secara acak, hasilnya kira-kira akan mendekati kondisi sesungguhnya.

Pertanyaannya, bagaimana bisa populasi Pilpres terdistribusi normal? Ada teori Statistik berikutnya yang bernama Central Limit Theorem, yang berkata bahwa sampel acak yang independen yang cukup banyak akan terdistribusi normal. Dan hebatnya, “cukup banyak” ini ndak banyak-banyak amat, guru Matematika saya dulu memberikan angka keramat 30 jumlah sampel acak sudah cukup membuat sampel akan terdistribusi normal.

Lha, jadi sebenarnya, hanya dengan 30 data TPS yang acak dari seluruh Indonesia, kita sebenarnya bisa membuat Quick Count kita sendiri. Monggo bereksperimen sendiri. Coba ambil secara acak data C1 dari KPU atau Kawal Pemilu (tunggu semua data tersedia ya), lalu hitung berapa perolehan suara 01 dan 02.

Ah, intermezo dulu, andai saya guru Matematika, tentu menyenangkan sekali bikin eksperimen Quick Count ini bareng sama murid-murid, hehehe….

Tapi yang namanya sampling, tetap saja tidak akan bisa mewakili populasi. Inilah yang namanya margin of error. Semakin sedikit sampel-nya, error rate-nya akan semakin besar. Kalau suatu polster bilang margin of error adalah 10%, dan dia klaim suara 01 adalah 53% vs 02 adalah 47%, maka sebenarnya klaim dia tidak bisa dipercaya. Karena bisa jadi 01 malah tinggal 43% vs 02 yang 57%. Dalam beberapa Pilkada, ada selisih yang sangat tipis yang masuk dalam margin of error sehingga Quick Count tidak dapat meramal siapa pemenangnya. Pada waktu itulah, tidak ada cara lain kecuali menunggu hasil resmi KPU.

Menariknya, untuk mendapatkan margin of error 5% saja, hanya diperlukan sekitar 400 sampel acak, dengan tingkat kepercayaan 95%. Dari mana angka ini, ada rumusnya, saya ndak mau terlalu teknis dan detail (terlalu teknis ini yang bikin saya dulu ndak dapet-dapet pacar wkwkwk…)

Kata kunci dalam QC adalah random. Acak. Ini hukumnya wajib. Sampel yang kecil namun acak jauh lebih baik daripada sampel besar yang tidak acak. 100 data TPS yang diambil secara acak akan jauh lebih baik daripada 2000 data TPS yang hanya diambil dari DKI Jakarta saja misalnya. 2000 data ini tidak memenuhi random sampling sehingga tidak akan terdistribusi normal.

Jadi kalau hasil acak memerintahkan untuk mengambil data di TPS di Kepulauan Sangihe di Talaud sana, ya Anda harus menerbangkan seorang surveyor ke sana. Tidak boleh diganti dengan TPS di Jagakarsa sini. Itulah kenapa biaya sebuah proyek survey tidak sedikit. Indonesia ini sangat luas mas bro…

Demikian, akhirul kalam, mudah-mudahan catatan saya ini sedikit membawa manfaat. Quick Count adalah kegiatan yang sangat ilmiah. Biasanya saya hanya menjawab bercanda saja kenapa saya percaya hasil QC, karena saya kaum beriman terhadap Statistik, tapi catatan ini adalah jawaban seriusnya.

Maturnuwun.

Leave a Reply

Your email address will not be published. Required fields are marked *