Ahok Membangun, Agus Sulit Hidupnya, dan Anies Berpendidikan

Oleh: Aqwam Fiazmi Hanifan - 27 Januari 2017
Dibaca Normal 5 menit
Mengukur kata kunci yang diucapkan para kandidat gubernur dan wakil gubernur DKI dengan metode algoritma TF-IDF.
tirto.id - Seperti dijelaskan pada tulisan pertama, selama dua jam debat perdana Pilgub DKI Jakarta ada 11.241 kata diucapkan oleh pembawa acara dan tiga pasangan calon.

Dari 11.241 kata itu terdapat 2.166 entri berbeda yang bentuknya entah kata benda, numeralia, preposisi, pronomina, kata kerja, konjungsi, adverbia, dan lain-lain.

Data debat ini diolah dengan proses information retrieval. Dengan proses ini, informasi dipilah dengan cara menarik dokumen-dokumen yang relevan. Demi mempermudah pengerjaan, metode pemrosesan bahasa alami alias NLP bisa digunakan. Langkah pertama yang mesti dilakukan adalah tokenization, sebuah proses memilah teks transkrip jadi token-token yang berurutan. Pemilahan token ini biasanya didasari spasi di antara dua kata.

Masalah muncul pada pengolahan frasa, gabungan dua kata atau lebih, yang bersifat non predikatif. Misalnya, "kerja keras", "rumah sakit", "lapangan kerja", dan sebagainya. Agar tak bias, penting untuk menyisir entri-entri yang sudah ditoken agar sesuai dengan konteks penuturan. Dalam kasus ini, ketika menemukan frasa-frasa seperti di atas, diambil opsi menggabungkannya: "rumah sakit" menjadi "rumahsakit" atau "lapangan kerja" menjadi "lapangankerja".

Setelah penokenan, langkah selanjutnya adalah stopword removal alias penyingkiran kata-kata umum yang biasanya muncul dalam jumlah besar dan dianggap tidak memiliki makna, seperti "yang", ‘di’, "ke", "dan", dan lain-lain. Kata-kata itu akan terbuang secara otomatis. Demikian pula kata ganti ("saya", "kami", "kita") dan numeria seperti "banyak", "beberapa", "sebagian", dan sebagainya.

Penyingkiran itu mutlak memerlukan penyesuaian agar tidak terjadi salah interpretasi data. Misal: dalam standar stopword list bahasa Indonesia, kata "Jakarta", "program" dan "pemerintah" masuk daftar kata yang mesti dicoret. Namun, berhubung analisis kali ini berkaitan dengan Pilkada DKI Jakarta, dan dua kata itu memiliki makna besar, maka kata "Jakarta" dan "program" tetap dimunculkan dalam analisis teks.

Setelah membuang stopword, yang tersisa ialah 4.777 kata, dengan 1.949 kata yang berbeda. Setelah dipilah, lima kata terbanyak muncul adalah "Jakarta" sebanyak 166 kali, "warga" 36 kali, "pendidikan" 31 kali, "masyarakat" 29 kali, dan "membangun" 26 kali.

Munculnya kata-kata di atas tentu saja identik dengan jargon-jargon para calon saat berkampanye. Tapi tentu setiap calon memiliki kata-kata yang khas.

Ahok Menyerang dengan Kata "Membangun" dan "Sungai"

Ahok mengucapkan kata "Jakarta" 17 kali, "membangun" 10 kali, "sungai" 8 kali, "manusia" 7 kali, "bank" 7 kali dan "kartu" 6 kali.

Menarik mengkaji kata "membangun" dan "sungai" yang sering diucapkan Ahok. Dua kata ini seakan jadi kendaraan Ahok untuk membanggakan dirinya sekaligus menyerang lawan.

Kata "membangun" muncul saat Ahok mengungkapkan visi-misinya. “Ya bagi kami membangun Jakarta itu visi terutama adalah membangun manusianya. Membangun manusia dengan indikator terukur,"

“Karena itulah kami membangun fisik. Sitpel, danau, membuat sungai yang rapi, jadi ini bukan melihat benda mati,” ucap Ahok.

Kata "membangun" juga dipakai Ahok untuk menyerang Anies Baswedan. Seperti diketahui umum, Anies gigih mengkampanyekan program pembangunan Jakarta yang holistik, kota sekaligus manusia.

“Nah, di sinilah perbedaannya. Pasangan ini (Anies-Sandiaga) ngomong kami hanya membangun fisik, jembatan segala macam. Bukan. Harus ada pembangunan fisik supaya pembangunan manusia ini tercapai. Nah, saya kira pasangan nomor 3 gayanya memang dosen kali ya," kata Ahok.

“Kalau kita hanya mengatakan membangun manusia, membangun manusia, tidak ada membangun benda itu namanya apa, tahu nggak? Itu namanya teori. Ngajar di dosen, di kampus, itu ya teori.”

Demikian pula untuk kata "sungai". Sebagai petahana, ia menjadikan "sungai" kata kunci kesuksesannya selama ini.

“Tapi saya juga bersyukur, sebagian orang Jakarta melihat hasil nyata. Sungai lebih bersih. Semua kelihatan. Pelayanan lebih baik," kata Ahok.

Pasangan nomer urut satu, Agus Yudhoyono dan Sylviana Murni, menyerang program relokasi bantaran sungai yang dilakukan Ahok. Dan oleh Ahok, kata sungai ini dijadikan serangan balik pada Agus-Sylvi. Dalam pernyataan berikut, misalnya:

“Saya nggak ngerti bagaimana lebar sungai yang tadinya 30 meter sekarang tinggal 5 meter, bagaimana mau dibalikin jadi 30 meter tanpa merobohkan bangunan yang tidak layak itu? Tapi ya sudahlah namanya juga pengen jadi gubernur kan kita juga maklum."

Atau: “Saya bingung kiri-kanan saya mengatakan orang-orang itu tinggal lama di bantaran sungai. Kok malah di pinggir sungai. Walaupun puluhan tahun ya tetap saja salah ... Saya kira jauh lebih tidak manusiawi mengajari rakyat yang salah dengan membenarkan mereka, hanya untuk memenangkan sebuah pilkada. Ini sangat bahaya, sangat bahaya,” sindir ahok secara keras.

Infografik 13 kata yang sering digunakan

Agus yang Mengeluhkan "Sulit hidupnya"

Lalu bagaimana dengan Agus Yudhoyono? Setelah membuang stopword, lima kata yang paling sering diucapkan Agus adalah "Jakarta" (43 kali), "masyarakat" (13 kali), "warga" (13 kali), "rakyat" (9 kali) dan "bantuan" (9 kali). Ia kerap menggunakan kata-kata yang bersifat jamak (masyarakat, warga, rakyat) seolah ingin memberi kesan bahwa dirinya mempedulikan orang banyak.

Seringnya muncul kata "bantuan" pun tidak lepas dari program unggulan Agus yang berjanji akan memberikan Bantuan Langsung Tunai, mulai dari bantuan 5 juta rupiah kepada keluarga miskin per tahun, bantuan 1 RW 1 miliar, hingga bantuan 50 juta per UKM.

Tetapi hal menarik yang bisa diperbincangkan soal ucapan Agus adalah munculnya kata "sulit" dan "hidupnya". Kata "sulit" diucapkan 8 kali dan "hidupnya" 7 kali.

Pada beberapa kalimat, kata "sulit" dan "hidupnya" sebenarnya merupakan satu frasa. Dalam debat perdana lalu, kata "sulit hidupnya" begitu melekat dengan Agus.

"Saya pikir itu tidak punya hati. Karena konstitusi kita mengatakan bantulah mereka yang sulit hidupnya,” kata Agus menanggapi pertanyaan Ahok terkait BLT.

Contoh lainnya: “Apapun namanya tetap ada intervensi oleh pemerintah terhadap mereka yang hidupnya sangat sulit ... Ketika pergi ke lapangan. Ke daerah-daerah yang sangat sulit hidupnya. Maka kami benar-benar ingin menghadirkan jawaban untuk mereka semua.”

Dalam bentuk pertanyaan pun, frasa hidupnya sulit juga disampaikan Agus. Dalam pertanyaan kerasnya kepada Ahok, misalnya: “Bagaimana perasaan bapak sebagai pemimpin sekaligus pengambil kebijakan melihat warga yang hidupnya semakin sulit begitu jadi semakin sulit, dan akhirnya kehilangan segalanya?”

Anies dan Kata-Kata Soal Pendidikan

Sebagai akademisi, mantan Menteri Pendidikan dan Kebudayaan, serta penggagas gerakan Indonesia Mengajar, maka wajar bila Anies kerap mengeluarkan kata-kata yang berkaitan dengan pendidikan.

Dari lima kata yang paling sering diucapkan Anies, tiga di antaranya bertemakan pendidikan seperti "pendidikan", "karakter" dan "sekolah". Perinciannya: "Jakarta" ia ucapkan 30 kali, "pendidikan" 15 kali, "karakter" 10 kali, "warga" 8 kali, dan "sekolah" 6 kali.

Jika Ahok memakai kata "membangun" dan "sungai" sebagai perkakas kampanye sekaligus menyerang lawan, maka Anies melakukannya dengan kata "pendidikan".

Saat menjelaskan visi-misinya, Anies memasukkan program "pendidikan" sebagai acuan kedua setelah isu kesejahteraan dan keadilan.

“Berikutnya, askes pada pendidikan berkualitas dan tuntas. Kita ingin para orangtua bisa mengantarkan anaknya ke sekolah, bisa mengantarkan anaknya ke madrasah, dengan perasaan tenang, dengan perasaan yakin, dengan penuh cinta kasih,” katanya.

Begitu pun saat memberikan pernyataan penutup saat debat diakhiri.

“Justru yang mau kita bangun adalah iman, taqwa, akhlak, karena yang dibutuhkan bagi masyarakat Indonesia adalah pendidikan yang menumbuhkan karakter moral dan karakter kinerja ... Pendidikan bukan sekedar penyiapan ke pekerjaan. Pendidikan bukan sekedar angka partisipasi. Pendidikan adalah soal menumbuhkan akhlak, menumbuhkan karakter.”

Pada saat menyerang Ahok, Anies pun lebih memanfaatkan topik yang digelutinya ini.

“Pertanyaan untuk pasangan calon nomor 2, apa strategi untuk meningkatkan mutu manusia di Jakarta? apa strategi untuk meningkatkan mutu pendidikan di Jakarta? Silakan,” tanya Anies kepada pasangan Ahok-Djarot.

Memakai Metode Tf-IdF untuk Analisis yang Lebih Terukur

Setelah membahas entri kandidat satu per satu, pertanyaannya adalah apakah jumlah kemunculan kata berbanding lurus dengan nilai kata itu bagi kampanye mereka? Belum tentu.

Untuk menemukan kata kunci yang terukur dan bisa ditakar menggunakan angka, kita bisa memakai algoritma metode TF-IDF. Dengan metode ini, kita bisa menghitung secara detail bobot setiap kata. Sekaligus scoring kata-kata tersebut berdasarkan berdasarkan berapa kali sebuah kata itu muncul dalam suatu teks dalam sebuah corpus atau beberapa dokumen.

Dengan TF-IDF kita akan menghitung Term Frequency (TF) atau nilai frekuensi kemunculan token dalam sebuah dokumen serta Inverse Document Frequency (IDF) alias ketersebaran kata dalam corpus.

Untuk mengananalisis data debat maka, transkrip dipecah jadi banyak dokumen berdasarkan si penutur, segmen waktu saat si penutur berbicara, serta kalimat yang didasari jeda tarikan nafas si penutur.

Skor ada pada rentang 0 sampai 1. Semakin besar skor sebuah kata, berarti semakin besar bobot kata itu bagi pelontarnya. Hasilnya didapati seperti ini.

Kata dengan pembobotan terbesar yang diucapkan Ahok adalah "bank" dengan skor 0.013. Di urutan kedua ada entri "kartu" yang skornya 0.0073, lalu kemudian entri "fisik", "jaminan" dan "mendidik" dengan skor sama yakni 0.0072.

Di urutan keempat muncul entri "rasio", "nontunai" dan dua kalimat aktif "kerjakan" dan "pindahkan". Bobot skor keempat kata ini sama yakni 0.0054.

Sedangkan bagi Djarot, kata dengan skor pembobotan terbesar adalah "gratis" yang angkanya mencapai 0.015. Setelah itu disusul kata "motor", "mobil", "sakit", "ibukota" dan "jamin" yang skornya 0.012.

Pada urutan ketiga muncul entri "biaya" yang pembobotan angkanya mencapai 0.0086, sedang kata "pemerintah" dan "membutuhkan" skornya 0.0078.

Sama seperti pembahasan di awal, pendidikan memang jadi hal yang ditekankan Anies. Secara angka pun membuktikan hal seperti itu. Entri "karakter" jadi pembobotan terbesar dengan skor 0.010. Lalu disusul "menumbuhkan" dan "memperhatikan" yang skornya sama "0.0077, dan "sekolah", "tegas", "soal" yang skornya 0.0062.

Berbeda dengan Anies, entri diucap Sandiaga bukan ke arah pendidikan. Skor terbesar dari kata yang diucapkan Sandiaga adalah "pendampingan" yang mencapai 0.021. Mesin membaca bahwa program "pendampingan" UKM jadi inti obrolan debat Sandiaga. Di bawahnya ada kata "kendaraan" dengan skor 0.018, lalu "menengah" 0.011 dan kejar "0.010". Tiga ata kunci ini berkaitan dengan upaya pengentasan kemacetan saat Sandiaga berbincang di segmen akhir.

Bagaimana dengan Agus? Mesin membaca ucapan yang dilontarkan Agus, kata-kata tegas yang identik dengan militer begitu melekat padanya. Kata "menjaga" mendapatkan entri penekanan terbesar dengan skor 0.0085, di bawahnya ada kata "meyakinkan" dengan skor 0.0072.

Ada sesuatu hal menarik dari Agus dibandingkan calon lain. Dan lagi-lagi seperti dijelaskan di awal tulisan, Agus cenderung memaparkan kata-kata yang negatif. Misalnya, dengan muncul kata "sulit", "kehilangan" dan "pengangguran". Bobot tiga kata ini mencapai skor 0.0068.

Bagaimana dengan Sylvi? Sebagai seorang birokrat, entri-entri yang identik dengan program detail terlihat betul dia perlihatkan. Entri "kependudukan" muncul dengan skor terbesar 0.017, lalu "kartu" 0.015, "dokumen" 0.0089 serta kata kunci "melaunching" 0.0084. Bisa ditangkap kesimpulan dari kata-kata kunci yang diucapkan Sylvi adalah dia memang ingin mengkampanyekan program Bantuan Langsung Tunai.

Baca juga artikel terkait DEBAT CAGUB DKI 2017 atau tulisan menarik lainnya Aqwam Fiazmi Hanifan
(tirto.id - Politik)

Reporter: Aqwam Fiazmi Hanifan
Penulis: Aqwam Fiazmi Hanifan
Editor: Dea Anugrah
DarkLight