Kolom

Memahami Manusia dari "Big Data"

Grady Nagara - detikNews
Jumat, 28 Feb 2020 14:00 WIB
analisis big data
Jakarta -

Setiap dari kita yang bersentuhan dengan internet hampir pasti aktif sebagai pengguna media sosial. Apa yang kita lakukan di media sosial? Bisa jadi stalking akun teman atau gebetan. Tapi yang sudah pasti adalah mengirimkan teks dan gambar, entah untuk update status atau mengirim direct message kepada seseorang. Lalu pertanyaan pentingnya, ke mana teks dan gambar itu pergi? Apakah ia sekadar muncul sebagai tampilan di layar monitor kemudian lenyap?

Dalam Indonesian Digital Report yang dikeluarkan We Are Social dan Hootsuite pada 2019, pengguna aktif media sosial di Indonesia mencapai 150 juta orang atau lebih dari separuh populasi penduduk. Lebih dari 80 persen di antaranya adalah pengguna YouTube, WhatsApp, Facebook, dan Instagram. Sedangkan separuhnya adalah pengguna Twitter dan Line.

Platform tersebut memiliki fungsi yang berbeda-beda. Ada yang sebagai messenger seperti WhatsApp, microblogging seperti Twitter, maupun yang berbasis gambar seperti Instagram. Terlepas dari perbedaan fungsi masing-masing, yang menyatukan semua platform tersebut adalah teks dan gambar. Intinya, teks dan gambar tersebut adalah "bahasa" yang digunakan untuk berkomunikasi antarpengguna. Bedanya di dunia nyata, bahasa yang keluar dari lisan kita akan menguap di udara, sedangkan di media sosial, bahasa itu tersimpan.

Kini ada jutaan teks dan gambar yang berasal dari bisingnya interaksi antarmanusia di media sosial. Jumlahnya terus bertambah dengan cepat. Menariknya, gunungan teks dan gambar itu bukanlah sampah digital yang tidak memiliki arti apapun. Lebih dari itu, ia memiliki arti penting bahkan menjadi cara termutakhir untuk memahami perilaku manusia. Dari sinilah perbincangan kita tentang Big Data dimulai: himpunan data bervolume sangat besar, bergerak sangat cepat, dan sangat kompleks.

Kedahsyatan Big Data baru saya sadari --dengan sangat menyesal saya terlambat-- ketika saya bersama Next Policy, lembaga kajian kebijakan publik tempat saya bekerja, melakukan analisis sentimen publik di Twitter terhadap pelantikan kabinet baru Jokowi pada Oktober 2019 silam. Cuitan di Twitter, betapapun terlihat aneh, menjadi sangat penting ketika kita mampu menganalisis teksnya melalui, katakanlah, teknologi pembelajaran mesin (machine learning).

Saya bisa mengetahui bahwa anak-anak muda di Twitter dalam konteks kabinet Jokowi ternyata menaruh perhatian paling besar terhadap Nadiem Makarim, mantan bos Gojek yang kini menjabat Menteri Pendidikan dan Kebudayaan. Kenapa saya katakan anak muda? Pengguna Twitter paling besar memiliki usia 16 – 23 tahun, disusul 23 – 35 tahun dan hanya sebagian kecil yang berusia di atas 40 tahun. Tidak hanya itu, saya juga akhirnya tahu bahwa anak-anak muda yang dengan entengnya kita sebut generasi milenial itu sangat optimis --atau setidaknya menanti gebrakan-- dari sosok Nadiem.

Dari mana saya dapat mengetahuinya? Jawabannya dari Big Data. Teks di media sosial adalah himpunan data yang sangat berharga. Di era media baru, kita akhirnya dapat melakukan analisis secara lebih sistematis terhadap emosi manusia. Curhatan anak SMP di Facebook tentang betapa menyebalkannya belajar di sekolah memang tidak penting. Namun, jika ada ribuan teks dengan nada yang sama muncul dari Big Data, jelas ini menjadi masalah yang serius. Kita bisa menunjukkan ada gejala di mana sekolah bukan tempat yang menyenangkan bagi anak-anak. Gejala sosial yang tertangkap dari Big Data ini dapat diteruskan kepada para pemangku kebijakan terkait.

Dari contoh sederhana di atas menyadarkan kita bahwa apa yang dahulu tersembunyi di belakang pikiran manusia justru kini berada dalam himpunan data yang maha dahsyat. Apakah Big Data dapat "menembus" isi hati manusia?

Tiga dekade yang lalu, membicarakan masalah pribadi di ruang publik adalah aib. Kita berupaya menutupnya rapat-rapat, dan kalau bisa jangan ada orang lain yang tahu. Setelah revolusi digital ditandai kemunculan ragam media baru, banyak orang menceritakan hal-hal yang sangat privat secara blak-blakan.

Salah satu contoh yang membuat saya harus mengernyit adalah berdoa di media sosial. Manusia beragama sepakat bahwa berdoa adalah komunikasi yang sangat privat antara dirinya dengan Tuhan. Sekarang, aktivitas berdoa menjadi konsumsi umum. Seolah semua orang harus tahu isi doa yang kita panjatkan dengan tidak lupa mengetik "amin" di kolom komentar.

Semua orang dapat mendramatisasi privasi sebagai hasrat subliminal dengan adanya media sosial. Ketika seseorang mengungkapkan isi doanya di halaman Facebook misalnya, sesungguhnya ia sedang berharap dirinya menjadi pusat perhatian dalam drama yang sedang ia perankan. Dengan kata lain, ia tidak bermaksud agar orang-orang ikut mengaminkan doanya, melainkan yang lebih penting adalah bagaimana orang memandang dirinya sebagai persona tertentu setelah ia menyampaikan isi doanya.

Hal ini serupa dengan, misalnya, seseorang yang mengutip perkataan dari tokoh tertentu di media sosial sejatinya bukan karena isi kutipan itu penting bagi publik, melainkan persona apa yang ingin dibentuk setelah orang lain melihat kita yang mengutip tokoh tersebut. Kita mengutip satu larik dari pidato Bung Karno di media sosial agar orang lain memandang kita nasionalis. Dan barangkali, hal ini juga berlaku untuk dramatisasi publik yang kita lakukan atas penderitaan yang sedang kita alami sekarang. Di dunia nyata kita memang menderita, namun kita bisa menikmatinya dengan menjadikannya sebagai bait drama di media sosial.

Apa yang ingin saya katakan bahwa perubahan radikal ini justru terekam baik dalam Big Data. Ketika dahulu kita sangat sulit untuk menganalisis emosi manusia, justru hari ini isi hati manusia tumpah ruah dalam Big Data. Tesis 'sublimasi' yang saya jelaskan pada paragraf sebelumnya adalah teori psikoanalisis yang dibangun Jacques Lacan puluhan tahun lalu. Kini, tesis Lacan dapat kita buktikan secara lebih sistematis dengan adanya Big Data.

Pada 2009, para ahli data dari Facebook berupaya menganalisis jutaan status penggunanya untuk mengukur Gross National Happiness Index suatu negara. Bayangkan, Facebook dapat menghimpun dan menganalisis dengan mudahnya isi hati manusia yang sepuluh tahun lalu para peneliti harus bersusah payah melakukannya. Facebook dapat menunjukkan bahwa himpunan status penggunanya yang sangat tidak penting dan kadang terdengar menjengkelkan ternyata adalah tambang emas.

Lihat hasilnya yang dirilis Facebook tahun 2010: puncak kebahagiaan orang Kanada dalam satu tahun terjadi saat perayaan natal, malam tahun baru, dan Hari Valentine. Sedangkan Facebook menemukan bahwa orang Kanada cenderung lebih bahagia pada hari Jumat, Sabtu, dan Minggu. Mungkin kita akan menganggap temuan itu wajar karena siapa yang tidak akan menunjukkan kebahagiaan di hari-hari penting seperti natal dan libur akhir pekan? Bedanya kita dengan Facebook, kita hanya menduga tanpa data, sedangkan Facebook mampu membuktikannya dengan data yang berlimpah.

Dari mana Facebook melakukannya? Jawabannya lagi-lagi: Big Data. Fenomena ajaib yang membuat kita dapat memahami manusia lebih dalam. Big Data telah menembus isi hati manusia. Oleh sebab itu, sangat wajar jika kita ingin mengetahui laku manusia yang jujur justru dari Big Data.

Di Indonesia, sebagai contoh, membicarakan seks di depan umum adalah hal yang tabu. Kita akan tersipu malu ketika mendiskusikan di depan umum, misalnya, fungsi kondom dan bahkan cenderung menutupinya dengan tidak menyebut nama alatnya secara langsung. Hal ini tidaklah aneh terutama di negara dengan kultur agama yang kuat. Shereen El Feki, mantan jurnalis yang sangat serius melakukan riset ihwal gairah seksualitas dan intimasi di Timur Tengah saja mengaku kesulitan sebagaimana diakui dalam bukunya yang berjudul Sex and the Citadel (2013). Kesulitan terbesar yang dialami Shereen adalah pada saat menggali pengalaman seksual dari para responden secara jujur.

Sekarang mari kita buka Google Trends, platform yang disediakan Google untuk melihat popularitas tren pencarian dalam kurun waktu tertentu. Diskusi tentang seks di Indonesia justru banyak dicari, dan kita bisa tahu daerah mana saja yang paling banyak mencarinya. Ketika saya membandingkan --tentu saja secara iseng-- pencarian mengenai "masturbasi" dengan "neraka" dalam lima tahun terakhir, justru kata "masturbasi" paling banyak dicari dibanding kata "neraka".

Satu hal yang cukup mengejutkan adalah ketika saya mengetik kata "shalat' di Google Trends, kata kunci yang berkaitan yang muncul dan banyak dicari orang Indonesia adalah "bercinta setelah shalat shubuh". Dalam kurun waktu satu tahun ke belakang, kata kunci yang ajaib itu cukup popular terutama di Jawa Tengah. Motivasi apa yang membuat banyak orang di Jawa Tengah mencarinya? Saya belum tahu. Yang jelas, topik-topik seperti seksualitas yang tabu dibicarakan di khalayak umum justru sangat popular di pencarian Google. Bukankah ini membuktikan bahwa Big Data dapat menampilkan laku manusia secara jujur?

Apa yang ingin saya sorot dari sini adalah kejujuran manusia di hadapan mesin pencari yang bernama Google karena faktor anonimitas. Di hadapan benda mati seperti Google, kita tidak sungkan mengungkapkan apa yang sedang kita pikirkan tanpa takut terawasi. Meski sebetulnya kitalah yang justru tidak sadar bahwa setiap teks yang kita ketik di mesin pencari dapat terekam. Sekali lagi ini soal anonimitas yang Google sendiri tidak akan mengungkap ke publik soal "siapa" sedang mencari "apa". Meskipun sejatinya Google telah mengawasi perilaku kita.

Seth Stephens-Davidowitz dalam bukunya Everybody Lies menyebut bahwa berkembang pesatnya Big Data telah membuktikan bahwa banyak orang telah berbohong selama ini. Seth mengambil contoh sebuah survei di Amerika Serikat yang membuktikan bahwa rasisme di negara tersebut kini hampir punah, terlebih sejak Barack Obama terpilih sebagai presiden. Kontras, Seth justru menemukan bahwa pencarian kata "nigger" (ungkapan rasis terhadap orang berkulit hitam) masih cukup popular di Google di Amerika Serikat. Bahkan Seth membuktikan bahwa di daerah dengan pencarian kata "nigger" paling banyak adalah lokasi di mana Obama meraih suara yang sedikit.

Data yang diungkap dalam survei-survei konvensional berpotensi salah karena banyak orang yang berbohong saat mengisi kuesioner. Para responden tidak benar-benar jujur saat diwawancara. Pembuktiannya adalah apa yang terungkap dalam Big Data sangatlah berbeda. Karena bagi Seth, manusia lebih nyaman jujur di depan benda mati dibanding para enumerator lapangan sekalipun sama-sama merahasiakan identitas.

Saya tidak sepenuhnya setuju dengan pendapat Seth ihwal data konvensional dari hasil survei tidak valid. Namun, cara kita memahami manusia melalui Big Data adalah sebuah terobosan yang revolusioner. Metode ini sukses mendisrupsi cara kita dalam memperoleh pengetahuan. Sudah saatnya bagi kita, terutama kalangan ilmuwan sosial, mempertimbangkan metode yang mutakhir ini untuk memahami laku manusia dalam kehidupan kesehariannya.

Grady Nagara Manajer Program Next Policy

(mmu/mmu)