Hari ini, Facebook mengumumkan perluasan kemampuan fact-checking foto dan video dari third-party fact-checker kami. Product Manager Tessa Lyons akan menjelaskan bagaimana Facebook menggunakan teknologi, serta orang-orang yang bekerja sebagai peninjau konten, untuk menemukan dan mengambil tindakan atas misinformasi dalam format visual.
Selain itu, ia juga akan membahas investasi seperti apa yang perlu terus dilakukan Facebook dalam menjalankan upaya ini.
Facebook sejauh ini telah menangani misinformasi berbasis artikel dengan baik. Namun, penanganan misinformasi untuk foto dan video masih relatif baru bagi Facebook. Apa perbedaan di antara kedua tipe misinformasi ini?
Kami mengawali upaya kami untuk menangani misinformasi dalam bentuk artikel karena berita palsu seperti inilah yang paling sering dilihat publik di Amerika.
Selain itu, kebanyakan pelaku kejahatan dengan motivasi ekonomi juga mendapatkan keuntungannya melalui penyebaran misinformasi dalam bentuk artikel. Mereka melakukannya dengan membagikan artikel yang mengandung misinformasi — untuk membuat orang terkejut karena judul beritanya salah.
Mereka pun akan mengklik artikel-artikel ini dan mengunjungi situs web dimana artikel ini ditayangkan sehingga si pelaku kejahatan pun bisa melakukan monetisasi tayangan tersebut melalui iklan.
Konten seperti ini tergolong spam, atau konten “gotcha”
Mereka ini disebut sebagai spammer dengan motivasi ekonomi. Karena itu, kami pun merespon keluhan publik di Amerika Serikat ini dengan fokus pada upaya pencegahan misinformasi pada artikel.
Caranya dengan mengejar serta menghentikan insentif keuangan mereka. Tetapi berdasarkan penelitian kami, penyebaran informasi yang salah di berbagai negara tidak terbatas pada artikel saja. Informasi yang salah bisa terkandung dalam sebuah artikel maupun bentuk lainnya seperti teks di atas foto atau sebagai audio di latar belakang video. Untuk melawan misinformasi, kita harus bisa memeriksa fakta di semua jenis konten yang berbeda ini.
Anda menyebutkan bahwa masyarakat di Amerika Serikat melihat lebih banyak misinformasi pada artikel, dibandingkan format lainnya. Bagaimana dengan orang di belahan dunia lainnya?
Tingkat kesalahan informasi dalam sebuah artikel, foto, atau video bervariasi antara satu negara dengan lainnya — sebagian karena jumlah postingan dalam bentuk artikel jika dibandingkan dengan foto atau video di Kabar Beranda berbeda di setiap negara.
Untuk sejumlah negara, artikel lebih banyak muncul di Kabar Beranda dibandingkan negara lain. Di beberapa negara, konten visual berupa foto justru lebih banyak muncul dibanding video atau sebaliknya.
Mengapa demikian?
Pertama-tama, Kabar Beranda sifatnya sangat personal. Jadi, apa yang Anda lihat di Kabar Beranda mencerminkan preferensi konten personal Anda.
Banyaknya artikel, foto, atau video yang Anda lihat akan dipengaruhi oleh teman-teman Anda, Halaman yang Anda ikuti, dan cara Anda berinteraksi dengan konten Kabar Beranda Anda. Tapi kami melihat ada beberapa hal yang bisa memicu pengalaman serupa dalam menggunakan Kabar Beranda bagi pengguna di berbagai negara.
Misalnya, untuk negara dengan pengguna yang lebih berhati-hati dalam konsumsi paket datanya kecenderungan untuk mengklik video mungkin lebih rendah. Sehingga, pengguna di negara tersebut mungkin akan melihat lebih sedikit video di Kabar Beranda mereka secara keseluruhan - yang berarti jumlah misinformasi berbasis videonya lebih sedikit.
Perbedaan lainnya adalah lanskap media serta tingkat literasi yang memengaruhi bagaimana misinformasi foto dan video juga ditafsirkan. Di negara-negara dengan ekosistem media yang kurang berkembang atau tingkat literasi rendah, pengguna mungkin lebih mudah percaya saat melihat headline yang salah pada sebuah foto, atau melihat foto yang dimanipulasi, dan menganggap apa yang mereka lihat sebagai berita.
Sedangkan untuk negara-negara yang ekosistem beritanya lebih kuat, konten yang diyakini sebagai sebuah “berita” akan berbentuk artikel.
Dapatkah Anda menggunakan teknologi yang sama untuk menemukan berbagai tipe misinformasi yang berbeda?
Jawabannya bisa iya, bisa juga tidak. Saat kami menangani misinformasi, kami menggabungkan kemampuan teknologi dan tinjauan manusia bekerja sama dengan third-party-fact-checker.
Untuk penanganan misinformasi pada sebuah artikel, langkah pertama adalah memprediksi artikel mana yang mungkin mengandung misinformasi menggunakan teknologi yang kami miliki dan memprioritaskan artikel tersebut agar bisa ditinjau fact-checker. Langkah kedua, setelah mendapatkan penilaian dari fact-checker, kami kembali menggunakan teknologi untuk menemukan duplikasi konten.
Misalnya ketika seorang fact checker dari Prancis berhasil membongkar klaim bahwa orang yang terkena serangan jantung bisa diselamatkan dengan menusukkan jarum ke jari penderita untuk mengeluarkan darahnya.
Setelah klaim ini terbukti salah, maka kami pun dengan mudah mengidentifikasi lebih dari 20 domain dan 1.400 link yang menyebarkan klaim tersebut. Kami pun mengaplikasikan teknologi yang sama untuk mengidentifikasi duplikat dari foto dan video yang telah terbongkar kesalahannya oleh fact-checker sehingga hasil penilaian mitra fact-checker kami ini bisa dioptimalkan lebih jauh.
Meskipun ada beberapa kesamaan dalam hal penggunaan teknologi, kami menggunakan pendekatan yang berbeda ketika kami mengidentifikasi artikel dibandingkan foto dan video.
Saatnya membahas fase pertama: menggunakan teknologi untuk memprediksi konten yang mungkin salah
Saat kami memprediksi artikel yang mungkin mengandung misinformasi, kami menggunakan beberapa sinyal seperti masukan dari komunitas kami tentang tautan berita palsu yang mereka lihat.
Kami lalu melihat apakah komentar pada postingan menyertakan frasa yang menunjukkan pembaca meragukan kebenaran isi kontennya. Kami juga melihat apakah Halaman yang memposting konten tersebut memiliki riwayat pernah membagikan informasi yang dinilai keliru oleh fact-checker. Sinyal seperti ini berlaku untuk artikel, foto, dan video.
Semua kegiatan yang telah kami lakukan untuk memprediksi tautan berita yang mengandung misinformasi juga membantu dalam proses peninjauan foto dan video. Namun, tetap ada beberapa perbedaan.
Ketika kami membicarakan tentang misinformasi dalam sebuah foto dan video, kami membagi hal tersebut menjadi tiga kategori: foto manipulasi, konten yang tidak sesuai konteks peristiwa sebenarnya, atau audio dan teks palsu.
Mari kita bahas satu per satu. Manipulasi: Anda mungkin memiliki sebuah foto yang telah dimanipulasi dimana foto tersebut menampilkan seseorang yang sebenarnya tidak pernah ada di foto tersebut. Atau pada foto tersebut seseorang yang sedang memegang sesuatu bisa dimanipulasi agar terlihat seakan sedang memegang benda lainnya.
Pernah lihat foto manipulasi seekor ikan hiu berenang di jalan raya?
Ini merupakan contoh bagus dari manipulasi foto. Untuk video yang dimanipulasi, istilah "deepfakes" atau “teknik pengeditan video” adalah hal yang sering dibicarakan orang seputar misinformasi. Anda bisa mengedit video seorang figur publik agar terlihat seakan-akan mulutnya bergerak menyampaikan hal yang sebenarnya tidak pernah mereka ucapkan dengan suara yang mirip suara mereka. Inilah yang kami klasifikasi sebagai konten media yang dimanipulasi.
Kategori kedua adalah konten yang tidak sesuai konteks peristiwa sebenarnya. Misalnya sebuah foto konflik yang dibagikan dengan cara tertentu untuk menunjukkan seakan-akan konflik tersebut terjadi di waktu dan tempat yang berbeda. Sama halnya dengan video.
Kategori ketiga adalah audio atau teks palsu. Seperti halnya judul atau teks palsu bisa disematkan ke dalam artikel, hal yang sama juga bisa dilakukan dengan menyematkan teks palsu ke sebuah foto atau dengan menambahkan audio palsu ke video. Sehingga orang pun bisa dengan mudah membuat klaim palsu dengan menambahkan caption ke sebuah foto dan menambahkan audio palsu ke video.
Itulah ketiga kategori dari konten media palsu. Kami dapat menggunakan teknologi untuk memprediksi setiap kategori tersebut dengan cara yang berbeda, dan kami masih terus mengembangkan kemampuan kami untuk melakukan hal tersebut.
Apakah teknologi untuk memprediksi misinformasi sesuai kategori di atas akan ada dalam waktu dekat?
Sejauh ini, sudah ada kemajuan dalam upaya kami meningkatkan kemampuan mengidentifikasi elemen apa saja yang telah dimanipulasi. Tetapi untuk menentukan apakah foto atau video hasil manipulasi merupakan bagian dari misinformasi lebih sulit dilakukan karena hasil manipulasi tidak selamanya buruk.
Lagi pula, kami juga menawarkan filter di Facebook Stories dan dalam beberapa hal ini juga bisa dianggap sebagai bentuk manipulasi. Tentu ini bukanlah sasaran utama dari upaya pemeriksaan fakta kami. Beruntung kami telah mampu mengidentifikasi jenis manipulasi dalam foto yang bisa digunakan untuk memberikan sinyal kepada fact-checker bahwa foto tersebut perlu diperiksa lebih jauh.
Terkait dengan pemahaman tentang konteks, kami telah berinvestasi untuk bisa mendeteksi misinformasi yang mengandung kesalahan konteks tapi masih banyak yang harus kami lakukan. Karena untuk bisa mendeteksi kesalahan konteks, beberapa hal perlu menjadi bahan pertimbangan yaitu konteks asli dari media tersebut, konteks yang ingin ditampilkan dari konten palsu tersebut dan perbedaan dari kedua konteks ini.
Untuk meninjau sebuah foto perang misalnya, kami harus mencari tahu sumber fotonya, dan kemudian menilai apakah konteks tersebut sudah ditampilkan secara akurat melalui status yang kini tersebar bersama dengan foto tersebut. Untuk melakukan ini, kami masih membutuhkan tenaga manusia. Karena itulah kami mengandalkan keahlian jurnalistik dan kemampuan memahami situasi dari fact-checkers.
Untuk foto maupun video yang mengandung klaim palsu terkait teks atau audionya, kami bisa mengekstrak bagian teksnya dengan menggunakan optical character recognition (OCR) atau transkrip audio, dan melihat apakah teks tersebut sama dengan klaim palsu yang telah ditemukan fact-checker sebelumnbya.
Jika sama, kami akan mengirimkan foto atau video tersebut kepada fact-checker untuk diverifikasi lebih jauh. Sejauh ini, kemampuan OCR kami untuk meneliti foto lebih canggih dibanding kemampuan kami meneliti video menggunakan transkrip audio.
Lalu bagaimana dengan menemukan duplikat dari klaim palsu?
Anda bisa dengan mudah menemukan duplikat dari sebuah artikel melalui teknik pengolahan bahasa alami atau natural language processing, yang merupakan sebuah teknik machine learning yang dapat digunakan untuk menemukan duplikat teks dengan sedikit variasi.
Untuk foto, kami cukup mampu menemukan duplikat yang sama persis. Tapi seringkali ada bagian dari foto yang ditambahkan sedikit untuk membuatnya jadi lebih kompleks dari sebelumnya. Semakin berbeda sebuah foto dari aslinya, semakin sulit bagi kami untuk mendeteksi dan mengambil tindakan lebih lanjut atas foto duplikat tersebut. Karena itu, penting bagi kami untuk terus berinvestasi dalam teknologi yang akan membantu kita mengidentifikasi duplikat yang telah mengalami perubahan-perubahan kecil.(*)