Urun Daya Polusi Jakarta

Latar Belakang

Sidang perdana gugatan polusi udara Jakarta yang dilayangkan terhadap Pemerintah, termasuk Menteri LHK, Menteri Kesehatan, Menteri Dalam Negeri, Gubernur DKI, Gubernur Jawa Barat, Gubernur Banten, hingga Presiden RI, digelar hari ini tanggal 1 Agustus 2019. Gugatan warga negara ini dilayangkan oleh LBH Jakarta, Greenpeace Indonesi dan Walhi Jakarta. Hal ini disebabkan buruknya kualitas udara di Jakarta. Buruknya kualitas udara ini mulai ramai di media sosial, dengan sumber dari laman web AirVisual.

(Baca berita: https://megapolitan.kompas.com/read/2019/07/25/19360191/sidang-perdana-gugatan-polusi-udara-jakarta-digelar-1-agustus)

AirVisual mengumpulkan beberapa pembacaan sensor kualitas udara yang umumnya membaca jumlah partikel PM10 maupun PM2.5. Data dari AirVisual diperoleh dari BMKG, US Embassy, dan Greenpeace. BMKG menyatakan bahwa ketiga sensor, dua dari US Embassy dan satu milik BMKG di Kemayoran merupakan sensor berstandar internasional. BMKG juga menyatakan bahwa indeks kualitas udara di Indonesia yaitu ISPU (Indeks Standar Pencemar Udara) masih berbasiskan konsentrasi debu partikel PM10, sedangkan standar internasional sudah berbasis PM2.5. BMKG juga menyatakan bahwa selain ketiga sensor tersebut, sensor yang digunakan pada stasiun lain adalah sensor rendah biaya (low cost sensor) yang memiliki akurasi yang lebih rendah dibandingkan ketiga sensor berstandar internasional tersebut.

(Baca berita: https://news.detik.com/berita/d-4644102/bmkg-3-lokasi-pantauan-airvisual-di-dki-berstandar-internasional)

Gubernur DKI Anies Baswedan menyatakan bahwa beliau berencana menambah sensor agar ukuran kualitas udara di Jakarta lebih akurat. Gubernur Anies menjelaskan bahwa data dari AirVisual dari kedutaan Amerika saja, sehingga hanya menggambarkan kualitas udara di sekitar Gambir saja. Sementara sudah ada 8 alat yang dimiliki pemerintah DKI, dengan data yang dikelola oleh Dinas Lingkungan Hidup dan Jakarta Smart City.

(Baca berita: https://kumparan.com/@kumparannews/anies-akan-tambah-sensor-kualitas-udara-di-jakarta-1rPOld0TR4m)

Permasalahan Polusi Udara

Polusi udara dengan dampaknya yang sudah banyak dibahas oleh jurnal medis yang menunjukkan adanya efek polutan PM2.5 terhadap kesehatan manusia, seperti kanker paru-paru dan masalah kardiovaskular. Selain itu, sudah ada deklarasi bahwa PM bersifat karsinogenik. Belum lama ini kita kehilangan tokoh dari BNPB akibat kanker paru-paru, apakah kita masih mau kehilangan tokoh-tokoh besar di masa depan akibat permasalahan yang sama?

(Baca jurnal: https://www.ncbi.nlm.nih.gov/pubmed/24694836)

Masalah polusi udara ini harus dianggap serius, baik oleh Pemerintah maupun masyarakat. Apapun pilihan politik Anda baik di kontestansi Pilkada maupun Pemilu tidak lagi relevan. Seyogyanya kita tidak melayangkan serangan terhadap Gubernur DKI ataupun Presiden RI, namun sama-sama memikirkan solusi terhadap permasalahan polusi udara ini. Gugatan warga negara yang dilayangkan terhadap pemerintah menurut saya adalah hal yang tepat untuk menaikkan kesadaran seluruh masyarakat tentang masalah ini. Namun, perlu dipastikan semua kritik ini tidak kembali menjadi perpecahan antara kedua kubu yang saling menyalahkan.

Kebijakan yang tepat sasaran di level pemerintahan provinsi maupun pemerintahan pusat harus cepat dikeluarkan, namun kita sama-sama perlu mengawasi bersama, apakah kebijakan tersebut tepat guna, apakah kadar polusi menurun? Keterbatasan sensor menjadi masalah lain yang perlu diatasi juga. Walaupun masalah utama adalah bagaimana kebijakan dapat cepat dilaksanakan untuk menekan polusi, masalah itu juga mengajak masalah lain, yaitu bagaimana kita dapat mengukur kemajuan yang dihasilkan oleh kebijakan tersebut? Menurut saya, untuk mengatasi masalah ini, pemantauan yang lebih detil perlu dilakukan.

Di era di mana semua kebijakan harus berdasarkan data, maka perlu juga kita memiliki data yang komprehensif tentang polusi udara. AirVisual menunjukkan kepada kita bahwa dengan kumpulan data (big data) dapat dilakukan analisis yang dapat memperbaiki kualitas pembacaan dari sensor rendah biaya. Selain itu, ada inisiatif Luftdaten.info, oleh OK Lab Stuttgart, Jerman, mereka mengumpulkan data PM untuk menjawab pertanyaan tentang polusi udara di daerah mereka. Inisiatif ini menarik dan sudah ada satu orang Jakarta yang memasang satu sensor dan mengirimkannya ke Luftdaten.info.

(Buka website: https://maps.luftdaten.info)

Solusi Penunjang Kebijakan

Penggunaan sensor biaya rendah yang masif dan data yang kontinu menjadi paradigma baru dalam pemantauan kualitas udara, sudah saatnya Indonesia yang sedang mengalami permasalah polusi udara ikut masuk dalam pengembangan baru. Pengembangan ini tentu perlu didukung oleh hukum yang sesuai, yakni indeks kualitas udara yang modern yang mulai mengikuti standar PM2.5 dan bukan PM10 saja. Selain itu, implementasi jaringan sensor rendah biaya dengan data kontinu juga perlu mulai dipasang di daerah urban. Paradigma baru ini sudah dibahas oleh salah satu makalah ilmiah yang sudah disitasi ratusan orang.

(Baca paper: https://pubs.acs.org/doi/10.1021/es4022602)

Menunggu pemerintah untuk melaksanakan hal ini, mungkin butuh waktu yang lama dengan birokrasi yang berkepanjangan. Data tentang polusi udara sangat kita butuhkan, dan kita butuhkan segera. Terinspirasi dari Luftdaten.info, rasanya Indonesia juga bisa membuat sistem serupa dengan berbagai solusi yang sudah tersedia di bidang Teknologi dan Elektronika. Jika kemarin kita sudah dapat berurun daya untuk mengurusi Pemilu dengan KawalPemilu, rasanya untuk hal genting seperti kesehatan masyarakat seperti ini, bukan tidak mungkin adanya urun daya serupa.

Akhirnya, artikel ini merupakan manifesto yang saya buat untuk mengajak kita bersama untuk urun daya dalam memecahkan permasalahan ini. Memang kebijakan pemerintah tetap solusi yang paling diperlukan untuk mengurangi polusi udara, namun kita tidak hanya bisa teriak-teriak saja, perlu juga adanya usaha dari masyarakat. Usaha masyarakt dapat dilaksanakan dengan mengurangi penggunaan kendaraan bermotor, namun selain itu dapat berupa fungsi pemantauan seperti yang sudah di bahas. Layaknya KawalPemilu yang ingin memantau Pemilu 2019, mari kita memantau polusi udara kota kita, Jakarta. Saya akan memulai dengan mengembangkan hardware dan sistem sederhana di waktu luang saya. Semua program akan saya pasang di GitHub saya. Progres harian akan saya tulis di blog ini.

Kualitas Udara Jakarta (PM2.5 dan PM10)

Hari ini saya melihat berita menunjukkan bahwa Jakarta adalah salah satu kota dengan udara terburuk di dunia. Data ini diambil dari situs AirVisual yang dapat memberikan nilai indeks kualitas udara. Nilai ini berkisar dari 0-500, dengan nilai 0-50 sebagai “Baik”, 51-100, sebagai “Sedang”, 101-150 sebagai “Tidak Sehat untuk Kelompok Sensitif”, 151-200 sebagai “Tidak Sehat”, 201-300 sebagai “Sangat Tidak Sehat”, dan 301-500 sebagai “Berbahaya”. Hari ini Jakarta sudah berada pada taraf “Tidak Sehat” dengan nilai indeks kualitas udara sebesar 158.

AQI.PNG

AirVisual adalah inisiatif yang ingin menyebarluaskan data kualitas udara, tim AirVisual menggunakan big data dan Artificial Intelligence untuk memberikan prediksi dan pemodelan data PM2.5 dan PM10. Penggunaan AI memastikan pembacaan yang lebih akurat dan terpercaya. Untuk mendapatkan datanya, AirVisual memiliki kontributor, untuk Jakarta, terdapat Greenpeace, US Embassy dan BMKG. Contoh pembacaan sensor dari BMKG dapat dilihat pada stasiun Kemayoran BMKG. Sensor BMKG yang diakses oleh AirVisual ini terdiri dari PM10 dan PM2.5, sementara Greenpeace dan US Embassy hanya menunjukkan sensor PM2.5.

Particulate Matter

Particulate Matter (PM) adalah polutan udara pada daerah urban yang paling besar dan paling berbahaya untuk kesehatan manusia. Efek PM terhadap kesehatan manusia telah dipelajari selama 20 tahun, asma, kanker paru-paru dan penyakit kardiovaskular adalah contohnya. Taraf efek kesehatan dari PM tergantung dari ukuran partikel tersebut, PM10 (10 mikrometer) dapat memasuki bronkus, PM 2.5 (2,5 mikrometer) dapat memasuki paru-paru, PM0.1 (0,1 mikrometer) dapat menembus jaringan paru-paru dan masuk ke dalam sirkulasi darah. Pada tahun 2013, International Agency for Research on Cancer menyimpulkan bahwa PM bersifat karsinogenik terhadap manusia. Bahayanya polutan PM perlu diperhatikan oleh masyarakat di kota-kota besar Indonesia seperti Jakarta, Bogor, Depok, Tangerang, Bekasi.

BMKG tidak menyediakan banyak sensor PM2.5 atau PM10, hal ini wajar karena sensor berstandar internasional untuk aplikasi pemantauan kualitas udara terbilang mahal. Dari stasiun pemantauan kualitas udara yang tersedia di daerah Jakarta, hanya 3 yang berstandar internasional (sumber). Namun pengembangan sensor rendah biaya untuk deteksi PM sudah cukup baik, contohnya sensor SDS011 dari Nova Sensor yang disebut mampu menjadi basis dari jaringan sistem pemantuan PM dengan resolusi spasial tinggi. Setelah membaca penelitian ini, saya tertarik untuk membuat sistem sederhana untuk memantau PM2.5/PM10 secara personal berdasarkan sensor Nova SDS011 ini.

Namun perlu digarisbawahi, bahwa terdapat kesepahaman bahwa sensor ini memiliki banyak batasan seperti kelembaban dan error pembacaan yang dapat mencapai 10% pada kondisi-kondisi tertentu. Uji coba sementara yang ingin saya lakukan adalah hanya untuk membuat sistem konsep dengan sensor SDS011 untuk membaca dan melaporkan nilai polutan PM2.5/PM10.

Referensi:

  1. https://www.ncbi.nlm.nih.gov/pubmed/24694836
  2. Nova Sensor: https://www.mdpi.com/2073-4433/10/2/41

 

Dioda PIN sebagai Saklar RF

Banyak aplikasi di dunia RF yang membutuhkan pensaklaran sinyal RF dan menghubungkannya ke antena berbeda, filter berbeda, maupun melalui penguat sinyal. Salah satu saklar yang umum dipakai adalah relay namun karena menggunakan prinsip mekanis, seiring dengan waktu dapat mengalami kerusakan. Sebagai alternatif dari relay, diperlukan saklar elektronik, salah satu saklar elektronik yang umum dipakai untuk sinyal RF adalah dioda PIN. Artikel kali ini akan membahas dasar-dasar dari dioda PIN.

Dioda PIN vs Dioda PN

Dioda PIN layaknya dioda pada umumnya dapat diberi tegangan positif (forward bias) untuk menyalakan dioda, dan tegangan negatif (reverse bias) atau tanpa tegangan (no bias) untuk mematikan dioda. Dioda pada umumnya terdiri dari semikonduktor tipe-P dan semikonduktor tipe-N, di tempat perpotongan kedua semikonduktor tersebut (junction) terdapat daerah deplesi yang mencegah aliran listrik. Pemberian tegangan positif (forward bias) yang membuat hilangnya daerah deplesi ini sehingga arus dapat mengalir. Untuk frekuensi rendah, yaitu frekuensi power (50Hz/60Hz) ataupun frekuensi audio, dioda PIN dan dioda PN berfungsi serupa.

PIN Diodes
Gambar 1. Struktur dioda PIN

Prinsip Kerja Dioda PIN

Struktur PIN berbeda dengan dioda pada umumnya yang terdiri dari struktur PN junction. Penambahan lapisan semikonduktor intrinsik antara PN junction membuat adanya penyimpanan muatan di lapisan intrinsik tersebut. Selain itu pada tegangan negatif (reverse bias), efek lapisan intrinsik memperbesar breakdown voltage. Karakteristik PIN diode menyebabkan PIN diode dapat berfungsi sebagai resistor variabel pada saat forward bias dan sebagai kapasitor bernilai rendah pada saat reverse bias untuk sinyal RF. Sinyal RF dan sinyal DC diberikan pada dioda pada saat bersamaan, sehingga saat sinyal RF dapat mengubah kondisi bias DC dari reverse bias ke forward bias dan sebaliknya, lapisan semikonduktor intrinsik sebagai penyimpan muatan dapat mempersulit sinyal RF untuk mematikan/menyalakan dioda.

Model of the PIN diode when forward biased (left) and reverse biased (right)
Gambar 2. Rangkaian ekuivalen dioda PIN saat forward bias dan reverse bias

Resistansi seri pada rangkaian ekuivalen forward bias dioda PIN tergantung oleh besarnya nilai arus DC yang mengalir pada dioda PIN tersebut, umumnya jika nilai arus maksimum dicapai, maka nilai resistansi minimum juga tercapai. Kapasitansi total pada rangkaian ekuivalen reverse bias dioda PIN tergantung oleh kapasitansi junction dan kapasitansi parasitik dari kemasan dioda. Nilai kapasitansi ini yang menunjukkan seberapa baik dioda PIN dapat menahan sinyal RF (isolation) pada kondisi mati.

Rangkaian Dioda PIN

Memadukan sinyal RF dan sinyal DC pada rangkaian dioda PIN dapat dilakukan dengan menggunakan RF choke dan DC blocking capacitor. Rangkaian minimum dari saklar RF dengan PIN dioda adalah seperti pada Gambar 3. DC blocking capacitor memastikan tegangan bias DC tidak mengganggu sinyal RF dan RF choke memastikan sinyal RF tidak mengganggu suplai bias DC. Umumnya dengan RF choke, ditambahkan kapasitor bypass setelah RF choke untuk memastikkan tidak ada sinyal RF yang sampai ke suplai bias DC.

Diagram of PIN diodes used in series mode for a) a basic SPST switch and b) an SPDT switch
Gambar 3. Contoh rangkaian saklar RF menggunakan dioda PIN

Rangkaian pada Gambar 3 sudah cukup untuk digunakan pada sinyal RF daya rendah, namun jika daya yang digunakan cukup tinggi, diperlukan isolasi pada kondisi off yang lebih baik dan juga kemampuan mengalirkan daya RF pada kondisi on yang lebih baik. Terdapat banyak cara untuk memperbaiki isolasi, yakni menambahkan tegangan negatif DC pada PIN diode untuk memperkecil kapasitansi atau dengan menambah dioda PIN secara seri. Selain itu, untuk mengalirkan daya RF yang lebih tinggi pada kondisi nyala, beberapa dioda dapat dikoneksikan secara paralel agar dapat melewatkan sinyal RF yang lebih besar, karena resistansi ekuivalen dioda PIN yang lebih rendah.

Sumber Gambar:

https://www.digikey.com/en/articles/techzone/2016/dec/how-and-why-to-use-pin-diodes-for-rf-switching

https://www.microwaves101.com/encyclopedias/pin-diodes

Referensi:

https://www.frostburg.edu/personal/latta/ee/qsk5/pindiodes/pindiodes.html

https://link.springer.com/chapter/10.1007/978-1-4615-5751-7_4

https://www.electronics-notes.com/articles/electronic_components/diode/pin-diode.php

Video Relevan:

 

Avalanche: Penggiringan Opini dan Hitung Cepat

Pada tahun pemilihan umum 2019, sejarah Indonesia terukir, partisipasi masyarakat dalam pemilihan umum melebihi ekspektasi dari penyelenggara pemilihan umum. Di tengah maraknya partisipasi masyarakat, ada hal negatif yang sangat memengaruhi masyarakat, yaitu terjadinya konflik horizontal akibat polarisasi pilihan politik. Polarisasi ini tidak kunjung usai, sejak pemungutan suara sudah dilakukan, bahkan sesudah diumumkan pemenangnya. Gerakan kampanye yang diserukan sejak tahun lalu, bahkan sampai sekarang, ibarat tidak ada hentinya. Banyak masalah politik yang muncul selama kontestasi pemilu 2019 ini. Masih disayangkan bahwa banyak sekali penggiringan opini yang dilakukan oleh elit dari kedua belah pihak dan adu kekuatan maupun kelantangan dari pendukung dua pihak. Penggiringan opini dari elit dan kekuatan pendukung menjadi sebuah akseleran yang sangat baik untuk memperparah terjadinya konflik horizontal.

Konflik horizontal ini berujung pada kekerasan yang menimbulkan korban jiwa sebanyak 6 orang, namun minim pemberitaan terhadap hal ini. Aktifitas warga sekitar maupun gedung perkantoran sekitar Bawaslu menjadi terhenti selama konflik terjadi. Aksi damai pada saat matahari tenggelam berubah menjadi aksi yang disusupi banyak perusuh. Apresiasi perlu diberikan kepada bapak Prabowo Subianto yang mengajak pendukung yang masih mau mendengarkan beliau untuk mengalah dan menghindari kontak fisik. Di saat yang berbeda, dalam acara Mata Najwa, elit politik bergandengan tangan dan menyerukan damai. Kita dapat bersyukur bahwa adanya inisiatif yang baik yang dapat meredamkan suasana perpolitikan Indonesia. Namun, kita tidak boleh memungkiri adanya struggle of power antara elit kedua kubu yang membantu menyulut konflik ini.

Penolakan Hitung Cepat

Hitung Cepat adalah salah satu metodologi estimasi hasil pemungutan suara yang dilakukan berdasarkan pengambilan sampel acak sesuai dengan kaidah statistika. Selama sepuluh tahun dilaksanakannya hitung cepat oleh beberapa lembaga survey, terbukti bahwa Hitung Cepat dapat menghasilkan estimasi yang cukup akurat. Namun tahun ini, pada tahun 2019, elit politik di salah satu kubu rupanya sepakat untuk menolak hasil Hitung Cepat yang dilakukan oleh berbagai lembaga survei yang memenangkan lawan politiknya. Kalimat-kalimat dari elit inipun berujung pada agitasi di kalangan simpatisan mereka, alhasil lontaran hinaan maupun serangan personal dilayangkan kepada bos lembaga-lembaga survei. Hitung Cepat yang dibuat untuk menjaga suara rakyat dengan mendapatkan data primer langsung dari tempat pencoblosan dan mencegah adanya upaya perubahan suara rakyat, menjadi kambing hitam dari penggiringan opini.

“Hitung Cepat adalah penggiringan opini. Juragan survei adalah tukang bohong.” Inilah yang dipercaya oleh pendukung salah satu kubu. Kedua kubu percaya bahwa adanya hasil dari Hitung Cepat dapat menjadi dasar deklarasi kemenangan dari salah satu kubu. Sebuah cuplikan pembicaraan antara TGB dengan Yusuf Martak menunjukkan bahwa adanya desakan deklarasi kemenangan oleh Joko Widodo setelah Hitung Cepat sudah menunjukkan kemenangan beliau. Yusuf Martak menjelaskan bahwa kabar deklarasi Joko Widodo membuat kubu Prabowo segera melaksanakan deklarasi. Yusuf Martak juga menyatakan bahwa jika ada deklarasi kemenangan dari kubu Joko Widodo, maka akan terjadi pembentukan opini bahwa kubu Prabowo sudah kalah. Terlihat bahwa kedua kubu tahu persis apa implikasi dari hasil Hitung Cepat dan bagaimana deklarasi pemenangan terhadap mental para pendukungnya.

https://tirto.id/jubir-bpn-bachtiar-nasir-sebut-quick-count-adalah-sihir-sains-dm3n

Sihir Sains, itulah istilah yang disebutkan oleh salah satu anggota BPN, Bachtiar Nasir. Ini adalah salah satu contoh serangan terhadap lembaga Hitung Cepat. Serangan ini rupanya efektif untuk membuat masyarakat simpatisan kubu Prabowo untuk tidak percaya dengan Hitung Cepat. Padahal, Perhimpunan Survei Opini Publik Indonesia (Persepi) telah membuka data masing-masing lembaga survei dan metodologi hitung cepatnya di depan publik. Data metodologi dan rumusan yang terbuka, di tambah oleh data terbuka dari KPU maupun dari inisatif KawalPemilu, siapapun dapat menghitung dan menarik kesimpulan berdasarkan hitungan yang dilakukan.

Darurat Matematika

Rakyat Indonesia sudah pintar, kata yang digaungkan oleh elit politik. Memang rakyat Indonesia sudah dapat mencari informasi sendiri, dan mampu berargumen berdasarkan informasi yang ditemukan. Namun, hal ini tidak dapat ditemukan saat Hitung Cepat dipertanyakan. Opini yang beredar di masyarakatpun terpecah dua, satu mempercayai Hitung Cepat dan satu menolak dengan keras Hitung Cepat dan menuduh lembaga survei sebagai tukang bohong. Kedua pandangan berseberangan ini adalah produk dari informasi yang tersedia di media sosial, yang disuplai oleh elit-elit politik pada masing-masing kubu tersebut. Namun, hanya sedikit masyarakat yang melihat laporan dari lembaga survei yang membuka dengan terang-benderang masalah metodologi hitung cepat.

\displaystyle \hat{p} = \frac{\displaystyle \sum_{h=1}^{H} \sum_{i=1}^{n_h} \frac{N_h}{n_h}y_{hi}}{\displaystyle \sum_{h=1}^{H} \sum_{i=1}^{n_h} \frac{N_h}{n_h}x_{hi}}

\displaystyle moe = 2 \times \sqrt{\frac{1}{\hat{X}^2} \sum_{h=1}^{H}\frac{N_h(N_h-n_h)}{n_h}\hat{var}_h} \times C

Persamaan di atas adalah persamaan yang dipakai dalam menghitung estimasi perolehan suara berdasarkan hitung cepat dan persentase akurasinya. Lembaga Hitung Cepat membuka juga tabel ringkasan pengambilan data yang dilakukan di 34 provinsi. Namun satu hal yang belum dilaporkan oleh lembaga survey, sumber pendanaannya. Di tengah ketidakpercayaan Hitung Cepat, muncullah seorang tokoh akademisi yang menantang juragan lembaga survey. Sebelumnya, hanya tokoh-tokoh nonakademisi yang melontarkan ketidakpuasan terhadap lembaga survei. Dr. Ronnie Rusli, dosen Universitas Indonesia melayangkan argumen berdasarkan pengambilan jumlah sampel untuk Hitung Cepat.

Dr. Ronnie Rusli membawa argumen kontra-Hitung Cepat melalui rumusan yang ditulisnya di Twitter. Belakangan ini saya baru sadar melihat video paparan Dr. Ronnie di depan Bawaslu, ternyata rumus yang salah ini juga yang menjadi acuan testimoni beliau di depan Bawaslu. Saya telah menulis tentang kesalahan persamaan yang dipaparkan di Twitter (baca: Deciphering the Tweet: Kesalahan Rumus dan Syarat Quick Count). Kesalahan ini rupanya tidak hanya luput dari ribuan masyarakat yang mencuit ulang persamaan ini, tetapi juga tidak disadari oleh mereka yang berperkara di hadapan Bawaslu. Ironis, masyarakat Indonesia yang sudah menerima pelajaran statistika sejak SMP, maupun aljabar sejak SMP, tidak dapat menyadari kesalahan rumus yang sangat mendasar yang berulang kembali dilakukan oleh Dr. Ronnie, bahkan di depan Bawaslu (lihat juga: Statistika 101: Ukuran Sampel untuk Data Proporsi). Kebenaran matematik dapat disepelekan demi kepentingan politik, Indonesia ada dalam darurat matematika.

Margin of Error disampaikan 0.02% sementara seharusnya dapat digunakan rumus ini:

\displaystyle MoE = \bigg(\frac{50\%}{\sqrt{n}}\bigg) 2.58

Substansi Ketidakpercayaan Kepada Hitung Cepat

Skeptisme terhadap Hitung Cepat bukannya tidak berdasar, berdasarkan teori statistika menggunakan Central Limit Theorem, seperti yang disampaikan oleh Dr. Ronnie, untuk mendapatkan sampel acak yang mencapai tingkat kesalahan tertentu, dapat digunakan rumus:

\displaystyle MoE = \frac{S_{\hat{p}}}{\sqrt{n}}Z_{99\%}

Rumus ini jika dimasukkan dengan nilai yang tepat akan menghasilkan 16ribu TPS untuk menghasilkan tingkat kesalahan 1 persen. Terlihat dari laporan lembaga survey, sepertinya pemilihan jumlah sampel tidak berdasarkan rumus di atas namun berdasarkan pengalaman Hitung Cepat sebelumnya. Untuk membuktikan kesahihan jumlah sampel lembaga survey dapat digunakan pendekatan empiris untuk mengambil kesimpulan.

Untuk menguji jumlah pengambilan sampel 2000 sampel, saya membuat program Stratified Random Sampling berdasarkan data dari KawalPemilu, persamaan estimasi proporsi dan variance berdasarkan laporan dari SMRC. Data mentah hasil sampel acak yang saya buat dapat dilihat pada GitHub, program tersedia pada GitHub kawal-pemilu-data. Program ini adalah usaha perbaikkan dari Penulis setelah masukan dari @RajaGuguk14. Sudah terdapat data mentah dari masing-masing TPS yang dapat dicek-ulang dan dibandingkan dengan berbagai sumber, tautan ke KawalPemilu juga diberikan. Berikut adalah tabel dengan jumlah sampel 2000.

01 SAMPLE 02 SAMPLE 01 KPU 02 KPU MOE (99%) PerbedaanSuara
55,36% 44,64% 55,50% 44,50% 1,20% -0,14%
54,88% 45,12% 55,50% 44,50% 1,34% -0,62%
54,86% 45,14% 55,50% 44,50% 1,40% -0,64%
55,01% 44,99% 55,50% 44,50% 1,43% -0,49%
54,86% 45,14% 55,50% 44,50% 1,45% -0,64%
54,87% 45,13% 55,50% 44,50% 1,47% -0,63%
54,98% 45,02% 55,50% 44,50% 1,48% -0,52%
55,12% 44,88% 55,50% 44,50% 1,48% -0,38%
55,23% 44,77% 55,50% 44,50% 1,49% -0,27%
55,23% 44,77% 55,50% 44,50% 1,49% -0,27%

Hasil ini tentu tidak sesuai dengan persamaan margin of error sebelumnya, di mana untuk mencapai tingkat kesalahan sebesar 1% dibutuhkan setidaknya 16000 TPS sampel. Seperti program saya sebelumnya, saya juga memasukkan sampel 1000 TPS dan menghasilkan tabulasi berdasarkan masukkan dari Dr. @saiful_mujani

01 SAMPLE 02 SAMPLE 01 KPU 02 KPU MOE (99%) Perbedaan Suara
54,68% 45,32% 55,50% 44,50% 1,80% -0,82%
54,52% 45,48% 55,50% 44,50% 1,89% -0,98%
54,64% 45,36% 55,50% 44,50% 1,97% -0,86%
54,79% 45,21% 55,50% 44,50% 2,02% -0,71%
54,74% 45,26% 55,50% 44,50% 2,05% -0,76%
54,83% 45,17% 55,50% 44,50% 2,07% -0,67%
54,95% 45,05% 55,50% 44,50% 2,08% -0,55%
55,16% 44,84% 55,50% 44,50% 2,09% -0,34%
55,25% 44,75% 55,50% 44,50% 2,10% -0,25%
55,24% 44,76% 55,50% 44,50% 2,11% -0,26%

Program ini belum sempurna dan masih ada kemungkinan kesalahan, namun bukti empiris berdasarkan hitungan dan dikonfirmasi oleh pengumuman KPU juga bahwa metodologi Hitung Cepat dengan Stratified Random Sampling dapat memprediksi hasil pemungutan suara dengan cukup akurat.

Kesimpulan

Kisruh berdasarkan Hitung Cepat ini seharusnya tidak perlu dibakar atau dijadikan bahan penggiringan opini dari kedua kubu. Deklarasi kemenangan berdasarkan Hitung Cepat maupun ketidakpercayaan penuh terhadap Hitung Cepat sangat rentan menghasilkan konflik horizontal. Di tengah kristalisasi, akademisi Dr. Ronnie Rusli menunjukkan rumus pengambilan sampel yang keliru, bahkan perhitungan margin of error yang keliru itu juga disebutkan di hadapan sidang Bawaslu (menit 10:35 – 11:12). Seharusnya seorang akademisi mampu memberikan informasi yang mencerahkan berdasarkan ilmunya. Berdasarkan uji coba simulasi Hitung Cepat dengan Stratified Random Sampling untuk menguji argumen Dr. Ronnie Rusli, hasil menunjukkan bahwa jumlah sampel sebesar 2000 TPS ataupun 1000 TPS sudah dapat mengestimasi hasil pemungutan suara dengan cukup akurat.

Google Cloud Platform Compute Engine

Google Cloud Platform memberikan 300$ credit untuk tahun pertama sebagai uji coba gratis. Artikel ini ditulis untuk membahas bagaimana cara deploy sebuah Compute Engine atau Virtual Machine yang bisa kita pasang di Google Cloud Platform.

Penulis bukan seorang Software Engineer dan tidak memiliki background di bidang IT, sehingga terminologi maupun penjelasan ini mungkin terdapat kekurangan, mohon sampaikan dalam komentar jika ada yang kurang tepat.

Google Cloud Platform adalah Infrastructure as a Service (IaaS)

Infrastruktur cloud juga dapat disebut Infrastructure as a Service (IaaS) adalah swalayan yang dapat memberikan akses komputasi tanpa membeli hardware. Infrasktruktur komputasi Cloud ini umumnya berdasarkan teknologi virtualisasi, pelanggan IaaS dapat mengakses melalui dashboard segala fungsi dari infrakstruktur yang diperlukan. Google Cloud Platform dan Amazon Web Services merupakan salah satu layanan IaaS yang tersedia dan memberikan uji coba gratis untuk tahun pertama.

Jika sebelumnya tren belajar Computer Science dan Linux dapat dilakukan dengan membeli perangkat keras Raspberry Pi atau perangkat Linux lainnya yang murah, sekarang tanpa membeli hardware kita dapat dengan mudah menggunakan IaaS untuk belajar komputasi.

Google Cloud Platform: Compute Engine

Menggunakan compute engine kita dapat membuat sebuah instance Virtual Machine dengan resource yang kita inginkan. Instance paling murah yang dapat kita deploy adalah 1vCPU dengan RAM 0.6GB (f1-micro). Untuk percobaan kali ini saya akan menggunakan small (1 shared vCPU dengan 1.7GB RAM). Saya akan memasang Ubuntu 18.04 dan menggunakan 10GB SSD.

GCP
Gambar 1. Setup Virtual Machine Instance di Google Compute Engine

SSH Key

Untuk mengakses instance dengan SSH, generate key SSH menggunakan PuTTY Key Generator untuk mendapatkan RSA key. RSA key ini kita masukkan pada bagian Security di menu setup Virtual Machine dan copy hasil RSA key ini di SSH key text box. Lalu simpan RSA key sebagai private key file (*.ppk) untuk dapat digunakan melalui PuTTY.

puttygen.PNG
Gambar 2. Key SSH untuk mengakses Virtual Machine instance

Akses SSH

Setelah memasukkan key pada PuTTY, buka koneksi SSH melalui IP address dari instance Google Compute Engine yang sudah dibuat. Masukkan username sesuai dengan comment dari SSH key. Jika sudah masuk melalui username, Anda sudah dapat mengakses Virtual Machine Ubuntu 18.04.2 LTS yang sudah terpasang di Google Cloud Platform.

putty.PNG

Selamat mencoba Google Cloud Platform untuk kepentingan komputasi Anda.

Prinsip Spread Spectrum dan Contoh Aplikasinya: LoRa

Pendahuluan

Spread Spectrum adalah prinsip yang mendasari banyak teknologi yang menjadi penting di dunia elektronika. Mungkin istilah Spread Spectrum terdengar asing, namun jika kita membahas Bluetooth (802.15.1) dan WiFi (IEEE 802.11) mungkin Anda lebih familiar. Saya ingin membawa Anda kembali ke sejarah penemuan Spread Spectrum. Spread Spectrum awalnya dikembangkan oleh seorang aktris Hedy Lamarr, ya, Anda tidak salah dengar, Hedy Lamarr adalah seorang aktris, seorang ikon yang menjadi lambang seksualitas di jamannya.

HedyLamarr
Gambar 1. Hedy Lamarr penemu Spread Spectrum

Spread Spectrum dipatenkan oleh Hedy Lamarr sebagai radio yang tidak dapat di-kacaukan atau dipasukan musuh, karena dikembangkan pada zaman perang. Memang ini adalah kelebihan dari Spread Spectrum, karena menggunakan bandwidth yang lebar dan sinyal ini terlihat sebagai noise dengan radio FM biasa, bahkan pengiriman sinyal ini umumnya lebih rendah dari sinyal noise floor. Sistem ini dipatenkan sebagai komunikasi untuk militer di mana diperlukan komunikasi radio yang tidak dapat diterima oleh musuh ataupun diganggu oleh musuh.

Cara Kerja Spread Spectrum

Spread Spectrum menggunakan level transmisi daya yang serupa dengan sebuah sinyal narrow-band. Namun, perbedaannya adalah sinyal spread spectrum akan memiliki power spectral density yang lebih rendah untuk masing-masing frekuensi sehingga sinyal Spread Spectrum dapat beroperasi bersama dengan Narrow Band pada frekuensi yang sama tanpa interferensi.

Pada Spread Spectrum, terdapat istilah Pseudo Noise code yang membungkus sebuah sinyal transmisi spread-spectrum sehingga sinyal tersebut terlihat wide-band dan seperti noise. Karakteristik ini yang menyebabkan Spread Spectrum memiliki probabilitas rendah untuk di intercept, akibat Spread Spectrum sulit dideteksi oleh peralatan narrow band dan hanya dapat dibaca oleh peralatan Spread Spectrum yang memiliki kode pseudo noise yang sama.

psd.gif
Gambar 2. Spread Spectrum Signal vs Narrow Band Signal

Gambar 2 di atas menunjukkan representasi sebuah sinyal Spread Spectrum dibandingkan sinyal Narrow Band. Kedua nya dapat memiliki daya yang sama, hal ini terlihat jika kita melakukan integral terhadap frequency (sesuai teorema Parseval, integral dari kuadrat sebuah fungsi dalam domain waktu sama dengan integral dari kuadrat sebuah fungsi dalam domain frekuensi).

LoRa Radio Berbasis Spread Spectrum

Mereferensikan kembali teorema Shannon-Hartley, yang mendefinisikan kapasitas kanal maksimum dari sebuah kanal komunikasi yang memiliki bandwidth tertentu yang terdapat noise. Sesuai dengan turunan persamaan Shannon-Hartley:

\displaystyle \frac{N}{S} \approx \frac{B}{C}

Dari persamaan di atas dapat diketahui bahwa untuk nilai perbandingan Noise-to-Signal yang tetap, untuk menaikkan kemampuan mengirim data kecepatan tinggi tanpa error, dibutuhkan bandwidth yang lebih besar. Teknologi LoRa yang menggunakan spread spectrum ini adalah teknologi wide band, sehingga memakan bandwidth yang cukup besar. Pemakaian bandwidth yang besar ini juga mempersulit izin frekuensi untuk keperluan LoRa di Indonesia.

Informasi teknis lebih lanjut tentang LoRa dapat melihat artikel saya yang lain: LoRa Modulation Basics

Referensi

  1. https://www.eetimes.com/document.asp?doc_id=1271899
  2. https://www.semtech.com/uploads/documents/an1200.22.pdf

Diskursus Statistika tentang Hitung Cepat

Akhirnya, ada diskursus yang berarti oleh proponent dan opponent dari hasil Hitung Cepat. Beberapa masukan saya terima baik dari proponent maupun opponent, saya rasa masukan ini sehat demi terungkapnya kebenaran. Salah satu diskusi pertama yaitu mengenai simulasi 1000 TPS:

Menggunakan program yang sama dengan sedikit modifikasi (dapat dilihat update di https://github.com/josefmtd/kpu-data), saya coba running dengan 1000 TPS dan mendapatkan 10 grafik ini:

Dari kesepuluh grafik tersebut, margin of error masih di bawah 1.5%, ini merupakan temuan yang menarik dan patut kembali dicerna dan dianalisis. Menjadi salah satu to-do list yang menarik untuk akhir pekan depan.

Selain dari kubu pendukung Hitung Cepat, ada juga masukkan yang berharga dari argumen kontra Hitung Cepat.

Program yang saya buat masih jauh dari sempurna, random seed masih menggunakan default dari library Python yang saya gunakan. Program saya hanya mengambil tabulasi data pasangan 01 dan 02 tanpa mengambil informasi lengkap TPS, hal ini tidak ada di tabulasi dari berbagai sumber, hanya KawalPemilu dan KPU yang menunjukkan data primer.

Masukan oleh @RajaGuguk14 masuk ke to-do list saya dalam pembuatan program selanjutnya. Karena keterbatasan kemampuan saya dalam pemrograman Python, mungkin butuh seharian, mari kita lihat apa mungkin saya menyelesaikan di akhir pekan.

Kurang lebih saya akan melakukan hal ini:

  1. Mengambil data dari API KawalPemilu (karena di API mereka terdapat indikator kejanggalan TPS, sehingga data janggal bisa saya skip)
  2. Membuat fungsi random dengan nilai seed statik agar bisa diikuti oleh orang lain
  3. Mengambil link foto C1 dari KawalPemilu untuk setiap data TPS.
  4. Menghasilkan tabulasi data raw dalam penyajian simulasi Hitung Cepat.

Sekali lagi artikel singkat ini saya tulis dengan harapan diskursus sehat mengenai statistika tetap berlanjut dan bisa terungkap kebenaran di tengah kemelut Pemilihan Presiden ini. Terima kasih untuk siapapun saja yang sudah mau bergabung dalam diskusi ini.

Deciphering the Tweet: Kesalahan Rumus dan Syarat Quick Count

Tidak bosan saya menulis artikel tentang tweet ini, karena sepertinya belum ada jawaban dan klarifikasi. Mari kita bedah kembali tweet dari Dr. Ronnie Higuchi Rusli, dosen program pascasarjana Universitas Indonesia. Pembedahan ini dilakukan untuk menguji pernyataan Dr. Ronnie Rusli tentang kesahihan Quick Count.

twit2

Dr. Ronnie Higuchi Rusli juga menuliskan syarat Quick Count sebagai berikut:

SyaratQuickCount

Pembahasan Tujuh Statement Dr. Ronnie

Ada delapan hal yang disampaikan pada link Tweet di atas yaitu terdiri dari:

  1. Dua buah persamaan, satu persamaan untuk Margin of Error dan satu lagi persamaan jumlah sampel TPS
  2. Lima pernyataan tentang masing-masing variabel untuk mencapai syarat Quick Count yang benar
  3. Satu grafik perpotongan 2 kurva distribusi normal

Saya akan mengupas ketujuh hal di atas, kecuali grafik, di mana grafik kurang jelas sumbu X dan Y nya menyebabkan grafik tersebut menjadi sulit dimengerti.

Persamaan Jumlah Sampel TPS

Persamaan jumlah sampel TPS ini sudah saya bahas sebelumnya di Statistika 101: Ukuran Sampel untuk Data Proporsi, di mana saya membahas kesalahan dari persamaan ini. Namun sekali lagi kita anggap persamaan Dr. Ronnie benar sehingga kita dapat menggunakan persamaan:

\displaystyle n_{tps} = \frac{p(1-p)}{MoE/(Z_{99\%})^2} + \frac{p(p-1)}{N}

Persamaan Margin of Error

Persamaan Margin of Error yang disampaikan adalah persamaan dasar untuk menghitung Margin of Error berdasarkan Confidence Level dan Standard Deviation:

\displaystyle MoE = \bigg[\frac{S_D}{\sqrt{n_{tps}}}\bigg]Z_{99\%}

Kelima Pernyataan Syarat Quick Count

Standard Deviasi wajib 1 persen
Margin of Error (MoE) 0,02-0,03%
Nilai Koefisien Z_{99\%} harus terpenuhi
Probabilitas masing-masing sama 50%
Jumlah sampel TPS yang dipakai tepat

Mari kita uji persamaan kedua (Margin of Error) dengan kalimat pertama dan kedua di pernyataan syarat Quick Count yang dijabarkan oleh Dr. Ronnie:

\displaystyle MoE = \bigg[\frac{S_D}{\sqrt{n_{sd}}}\bigg]Z_{99\%}

Masukkan margin of error 0.02%, standard deviasi 1% dan Z_{99\%} = 2.58 harus terpenuhi.

\displaystyle 0.02\% = \bigg[\frac{1\%}{\sqrt{n_{sd}}}\bigg]2.58

\displaystyle n_{tps} = \bigg(\frac{1\%}{0.02\%}*2.58\bigg)^2 = 16641

Mari kita uji persamaan pertama dengan variabel yang sama, seharusnya kedua persamaan menghasilkan nilai yang sama

\displaystyle n_{tps} = \frac{p(1-p)}{MoE/(Z_{99\%})^2} + \frac{p(p-1)}{N}

\displaystyle n_{tps} = \frac{0.25}{0.0002/(2.58)^2} + \frac{(-0.25)}{809497} = 8320.5

Terlihat jelas hasil jumlah TPS di persamaan pertama dan persamaan kedua berbeda. Hal ini patut dipertanyakan, seharusnya persamaan pertama dan kedua menghasilkan nilai yang sama. Untuk pembanding dapat dilihat penggunaan persamaan yang saya turunkan di Statistika 101: Ukuran Sampel untuk Data Proporsi:

\displaystyle n_{tps} = \frac{z^2\hat{p}(1-\hat{p})}{e^2}

Persamaan ini dapat disebut juga persamaan Cochran.

\displaystyle n_{tps} = \frac{2.58^2(0.5)(0.5)}{0.01^2} = 16641

Mengetahui bahwa standard deviasi dari sebuah data proporsi sebagai berikut:

\displaystyle \sigma = \sqrt{pq} = \sqrt{0.5(0.5)} = 0.5

Maka dapat kembali dimasukkan kepada persamaan MOE:

\displaystyle 0.01\% = \bigg(\frac{50\%}{n_{tps}}\bigg)Z_{99\%}

\displaystyle n_{tps} = \bigg(\frac{50\%}{1\%}*2.58\bigg)^2 = 16641

Jelas terlihat bahwa persamaan dari Dr. Ronnie salah, karena kedua persamaan tersebut tidak menghasilkan nilai yang sama.

Kesalahan Perlu Diklarifikasi

Kesalahan pertama yang sudah saya bahas adalah kesalahan rumus, di mana harusnya hasil penurunan rumus jumlah sampel TPS adalah

\displaystyle n_{tps} = \frac{z^2\hat{p}(1-\hat{p})}{e^2}

Kesalahan kedua yang nampak pada pernyataan Dr. Ronnie adalah standard deviasi wajib 1% dan probabilitas masing-masing adalah 50%. Keduanya tidak kompatibel di mana jika kita memasukkan nilai probabilitas 50%, nilai standard deviasi adalah:

\sigma = \sqrt{\hat{p}\hat{q}} = \sqrt{(50\%)(1-50\%)} = 50\%

Dengan artikel ini, sekali lagi saya mohon kepada Dr. Ronnie Rusli untuk mengklarifikasi persamaan dan syarat yang dituliskan di depan khalayak umum agar tidak ada misinformasi.

Bagi Anda yang membaca artikel ini, mohon sampaikan dan mention Dr. Ronnie mengenai masalah ini, semoga beliau berkenan untuk memperbaiki dan memberikan penjelasan kepada masyarakat tentang syarat Quick Count yang benar.

Lagi, Salah Rumus

Kelanjutan dari beberapa artikel belakang yang sudah saya buat mengenai statistika, terutama tentang pengambilan jumlah sampel dan uji coba Stratified Random Sampling dengan menggunakan bahasa pemrograman Python. Saya berharap ada salah satu yang dapat sampai ke Dr. Ronnie Rusli agar beliau dapat memperbaiki kesalahan di rumus nya. Kembali beliau memposting rumus ini:

twit2
Gambar 1. Tweet Dr. Ronnie Rusli mengenai pengambilan jumlah sampel Quick Count

Penggunaan Rumus Dr. Ronnie

Melihat sekilas rumus Dr. Ronnie, terlihat janggal, saya akan menjabarkan, jika saya memasukkan masing-masing variabel sesuai dengan kondisi kenyataan jumlah TPS di Indonesia dan Margin of Error yang diclaim telah dicapai oleh salah satu lembaga survey, yakni 1%.

n_{tps} adalah jumlah sampel yang dibutuhkan
p adalah estimasi persentase pasangan presiden wakil presiden
MoE adalah margin of error yang diinginkan
N adalah jumlah populasi TPS

Penjelasan ini juga dielaborasi sebelumnya oleh tweet Dr. Ronnie Rusli pada Gambar 2.

Capture
Gambar 2. Tweet Dr. Ronnie tentang jumlah sampel Quick Count dan penjelasan variabelnya

Memasukkan rumus di atas dengan nilai-nilai yang kita ketahui maka kita dapat menghitung sendiri jumlah TPS yang diperlukan berdasarkan Margin of Error (1%) dan jumlah TPS populasi (809.497). Asumsi sebelum dilakukan pemilihan adalah peluang masing-masing pasangan adalah sama, yakni 50%.

Rumus yang digunakan oleh Dr. Ronnie Rusli adalah n = [p(1-p)]/[(MoE)/(z99)^2)] + [p(p-1)/N]

Atau jika saya tuliskan dengan LaTeX agar lebih mudah terlihat dalam bentuk pecahan:

\displaystyle n_{tps} = \frac{p(1-p)}{\displaystyle \frac{MoE}{(z_{99\%})^2}} + \frac{p(p-1)}{N}

Masukkan variabel-variabel di atas, maka hasilnya akan menjadi

\displaystyle n_{tps} = \frac{0.5(1-0.5)}{\displaystyle \frac{0.01}{2.58^2}} + \frac{0.5(0.5-1)}{809497} = 166.41 + (-3.08*10^{-7}) \approx 166

Jika Anda tidak percaya dengan hitungan saya, sila coba dengan kalkulator Google, langsung masukkan nilai p, MoE, z, dan N pada rumus langsung dari Dr. Ronnie:

[0.5(1-0.5)]/[(0.01)/(2.58)^2)] + [0.5(0.5-1)/809497]
calculator
Gambar 3. Hasil perhitungan dengan kalkulator sesuai dengan rumus Dr. Ronnie

Rumus Jumlah Sampel Berdasarkan Penurunan Rumus

Semenjak SMP, SMA, maupun memasuki bangku kuliah, saya sangat senang dalam menurunkan rumus. Penurunan rumus memerlukan ketelitian, dan dalam matematika, ketelitian sangat penting. Hobby penurunan rumus ini membuat saya menjadi tertarik untuk menurunkan rumus berdasarkan nilai standard error proporsi dan nilai MoE berdasarkan tabel Z. Penurunan rumus saya dapat dilihat pada artikel sebelumnya Statistika 101: Ukuran Sampel untuk Data Proporsi.

\displaystyle n_{tps} = \frac{N}{\displaystyle 1 + \frac{MOE^2(N-1)}{z^2(\hat{p}(1-\hat{p})}}

Persamaan di atas adalah hasil akhir yang saya temukan, jika memasukkan nilai pada persamaan di atas:

\displaystyle n_{tps} = \frac{809497}{\displaystyle 1 + \frac{(0.01)^2(809497-1)}{(2.58)^2(0.5(1-0.5)}} \approx 16306

Addendum dan Opini

Melihat kesalahan sederhana pada rumus Dr. Ronnie Rusli, dapat terlihat bahwa ribuan warganet tidak kritis dan masih mempercayai semua hal yang dikatakan ahli. Hampir tidak ada yang berhenti untuk berpikir, apakah ini benar? Padahal aljabar sudah dipelajari sejak SD ataupun SMP, dan Indonesia menerapkan wajib belajar sampai SMA. Ribuan cuitan ulang (re-tweet) maupun like namun mereka tidak melihat persamaan dan mengujinya langsung.

Namun perlu diperhatikan bahwa walaupun rumus yang di sampaikan oleh Dr. Ronnie salah, namun menurut persamaan yang saya turunkan berdasarkan random sampling dan nilai proporsi, saya dapatkan jumlah TPS sampel sebesar 16rb, jauh di atas nilai 3000 maupun 5000 yang dipakai oleh lembaga survey.

Statistika 101: Ukuran Sampel untuk Data Proporsi

Background

Saya menulis artikel singkat ini tentang ukuran sampel dan data proporsi karena melihat rumus yang beredar oleh Dr. Ronnie Rusli tentang rumus Quick Count, menurut saya rumus ini memiliki permasalahan, seperti yang saya jabarkan di artikel sebelumnya: https://josefmtd.com/2019/05/04/statistika-101-memberikan-pengertian-hasil-quick-count-pilpres-2019/

Rumus yang disampaikan Dr. Ronnie di-retweet oleh 2778 akun dan diberi like oleh 4808 akun. Menurut saya keanehan ini perlu dijawab dengan sebuah artikel dan klarifikasi, maka saya menulis kembali artikel ini.

Artikel ini juga bertujuan untuk merapihkan catatan statistik dari mata kuliah Probabilitas dan Stokastik yang saya terima pada tanggal 25 Maret 2015, diampu oleh Bapak M. Firdaus S. Lubis, S.T., M.T., sekaligus memberikan contoh kasus pada sebuah data proporsi yakni dalam aplikasi Quick Count.

Central Limit Theorem dan Distribusi Normal

Dasar dari Random Sampling adalah Central Limit Theorem. Central Limit Theorem adalah sebuah teori statistik di mana jika diambil banyak sampel dari sebuah populasi dengan variansi data yang berhingga (finite), mean dari sampel yang diambil pada populasi yang sama akan sesuai dengan mean dari populasi. Central Limit Theorem menunjukkan bahwa semakin bertambahnya jumlah sampel yang diambil secara acak, maka distribusi kemungkinan letak nilai mean dari sampel tersebut akan mengikuti distribusi normal.

normaldistribution
Gambar 1. Persebaran mean dengan distribusi normal

Asumsi distribusi normal dapat kita pakai ketika jumlah sampel yang kita ambil sudah mencapai batas nilai tertentu. Jika distribusi normal dapat dicapai dengan sampel yang kita ambil, maka persamaan-persamaan ini menjadi valid:

\displaystyle S_x = \frac{\sigma_x}{\sqrt{n}}

S_x adalah standard error dari mean
\sigma_x adalah standard deviasi
n adalah jumlah sampel (tps)

\displaystyle moe = z(S_x)

moe adalah margin of error
z adalah nilai dari tabel distribusi normal sesuai dengan Confidence Level
S_x adalah standard error dari mean

Data Proporsi

Data proporsi menunjukkan perbandingan atau persentase dari sebuah populasi dengan karakteristik tertentu. Data proporsi ini memiliki kemungkinan binomial, antara ya atau tidak. Hal ini dapat diaplikasikan juga pada polling maupun quick count karena data yang diambil merepresentasikan persentase dipilihnya suatu kandidat atau partai politik. Nilai p (proportion of interest dari populasi) ini yang ingin dihitung dengan cepat dengan sampel untuk mendapatkan estimasi nilai p: \hat{p}. Untuk mendapatkan simpangan baku (standard deviasi) dari data hasil proporsi ini, kita perlu mengetahui proporsi populasi sesungguhnya, hal ini tidak memungkinkan pada aplikasi Quick Count, umumnya rumus standard error dari proporsi yang dipakai:

\displaystyle S_{\hat{p}} = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

S_{\hat{p}} adalah standard error dari estimasi proporsi hasil sampel
\hat{p} adalah estimasi proporsi hasil sampel

Proporsi adalah data dengan distribusi binomial, namun seiring dengan bertambahnya sampel acak yang diambil pada populasi yang sama, maka distribusi kemungkinan nilai \hat{p} akan menuju distribusi normal, sehingga rumus sebelumnya kembali dapat dipakai.

\displaystyle moe_{\hat{p}} = z(S_{\hat{p}})

moe_{\hat{p}} adalah margin of error dari estimasi proporsi hasil sampel

Untuk memastikan bahwa sampel yang kita ambil sudah cukup untuk mendekati distribusi normal terdapat beberapa rule of thumb sebagai berikut:

\displaystyle np > 5
\displaystyle nq > 5

Mengambil Jumlah Sampel

Mengetahui syarat-syarat untuk mencapai jumlah sampel yang tepat, yaitu data proporsi (data binomial) harus merupakan sampel acak dengan jumlah yang dapat memenuhi syarat np > 5 dan nq > 5. Setelah itu dapat digunakan persamaan yang merupakan substitusi nilai S_{\hat{p}} pada persamaan moe_{\hat{p}} dan mengubah fungsi untuk mendapatkan nilai n maka didapatkan rumus:

\displaystyle n = \frac{\displaystyle z^2 [\hat{p}(1-\hat{p})]}{\displaystyle moe_{\hat{p}}^2}

Menggunakan persamaan ini dapat dihasilkan jumlah sampel yang sesuai dengan dasar Central Limit Theorem bahwa sampel memiliki distribusi normal untuk random sampling, dan kaidah binomial dan pendekatannya menuju distribusi normal jika sampel memadai.

Efek Populasi Berhingga terhadap Jumlah Sampel

Rumus di atas adalah rumus yang didefinisikan untuk sebuah populasi yang tak berhingga (infinite), namun pada kondisi riil, atau dalam konteks Pemilu, jumlah populasi TPS adalah berhingga, sehingga terdapat faktor pengali koreksi terhadap populasi yang berhingga pada standard deviasi. Hal ini disebabkan oleh pilihan sampel TPS tidak boleh overlap dari keseluruhan TPS populasi, (sampling without replacement). Hal ini menyebabkan nilai proporsi yang diambil menjadi dependen terhadap jumlah sampel dan populasi, sehingga standard error dari sampling perlu dikalikan dengan faktor koreksi populasi:

\displaystyle S_{\hat{p} finite N} = S_{\hat{p}} \sqrt{\frac{N_{tps}-n_{tps}}{N_{tps}-1}}

S_{\hat{p} finite N} adalah standard error sampling pada populasi berhingga
N_{tps} adalah jumlah populasi
n_{tps} adalah jumlah sampel

Perlu digarisbawahi bahwa rumus ini hanya berlaku jika sampel yang diambil sudah melebihi 5% dari populasi, jika tidak, nilai faktor koreksi ini akan mendekati 1, sehingga pengaruhnya tidak lagi besar.

Menurunkan rumus untuk mencari jumlah TPS (n_{tps} dengan pengaruh jumlah populasi ini didapatkan:

\displaystyle MOE = z \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\sqrt{\frac{N-n}{N-1}}

Kuadratkan kedua sisi menjadi:

\displaystyle MOE^2 = z^2 \frac{\hat{p}(1-\hat{p})}{n} \frac{N-n}{N-1}

Lalu tukar posisi masing-masing variabel sehingga berbentuk:

\displaystyle \frac{N-n}{n} = \frac{(N-1)(MOE)^2}{\hat{p}(1-\hat{p})z^2}

Lalu ubah persamaan di atas sehingga dapat menghasilkan fungsi n_{tps}

\displaystyle n_{tps} = \frac{N}{\displaystyle 1 + \frac{MOE^2(N-1)}{z^2 \big( \hat{p}(1-\hat{p} \big)}}

Persamaan di atas adalah persamaan yang mungkin harusnya di unggah dan di cuit oleh Dr. Ronnie Higuchi Rusli.

EDIT: Penambahan penurunan rumus pencarian jumlah sampel TPS

Appendix: Postingan Dr. Ronnie Rusli

capture.png