Perbandingan Metode Support Vector Machine dan Logistic Regression untuk Klasifikasi Bencana Alam
DOI:
https://doi.org/10.52958/iftk.v19i2.6355Kata Kunci:
Klasifikasi, Twitter, Bencana, Support Vector Machine, Logistic RegressionAbstrak
Media sosial, terutama Twitter, telah menjadi sumber penting untuk memantau dan merespons bencana alam. Klasifikasi teks dapat membantu mengidentifikasi pesan yang terkait dengan bencana alam di twitter. Penelitian ini membandingkan kinerja dari dua metode klasifikasi: Support Vector Machine, dan Logistic Regression. Dataset yang digunakan berisi sejumlah tweet yang dikategorikan secara manual menjadi tiga kelas, yaitu darurat, non darurat dan tidak relevan. Pra-pemrosesan data dilakukan untuk membersihkan teks, menghapus tautan dan karakter tertentu, tokenisasi dan normalisasi. Selanjutnya, representasi vektor Word2vec digunakan untuk mengekstraksi fitur yang terkait. Guna mengatasi ketidakseimbangan kelas pada dataset dilakukan teknik untuk mensintesis sampel baru menggunakan metode Synthetic Minority Over-sampling Technique (SMOTE). Model klasifikasi dilatih menggunakan dataset yang telah diolah dengan menggunakan Support Vector Machine, dan Logistic Regression. Kinerja kedua metode dievaluasi menggunakan metrik seperti akurasi, presisi, recall, dan F1-score. Hasil eksperimen menunjukkan bahwa SVM memiliki akurasi 80,41% dengan atau tanpa menggunakan metode SMOTE. Sedangkan metode Logistic Regression memiliki akurasi 63,36% tanpa SMOTE dan 70,74% dengan menggunakan SMOTE. Sehingga didapatkan bahwa metode Support Vector Machine memberikan hasil terbaik yaitu akurasi sebesar 80.41%. Penggunaan metode SMOTE tidak terlalu berpengaruh ketika menggunakan metode SVM, sedangkan dalam Logistic Regression pengguanaan SMOTE cukup berpengaruh, dengan memberikan kenaikan akurasi sebesar 28,26%. Penelitian ini dapat membantu dalam pengambilan keputusan darurat dan pemantauan bencana alam di media sosial.
Referensi
E. Nofiyanti and E. M. Oki Nur Haryanto, “Analisis Sentimen terhadap Penanggulangan Bencana di Indonesia,” Jurnal Ilmiah SINUS, vol. 19, no. 2, p. 17, Jul. 2021, doi: 10.30646/sinus.v19i2.563.
A. Layalia Safara Az-Zahra Gunawan and K. Muslim Lhaksamana, “Analisis Sentimen pada Media Sosial Twitter terhadap Penanganan Bencana Banjir di Jawa Barat dengan Metode Jaringan Saraf Tiruan Sentiment Analysis On Twitter Social Media On Flood Disaster Management In West Java With Neural Network Method.”
A. M. Maksun, Y. A. Sari, and B. Rahayudi, “Analisis Sentimen pada Twitter Bencana Alam di Kalimantan Selatan menggunakan Metode Naïve Bayes,” 2021. [Online]. Available: http://j-ptiik.ub.ac.id
E. Ananda Tasya, R. E. Saputra, and C. Setianingsih, “Sistem Informasi Monitoring Bencana Alam Menggunakan Data Media Sosial Dengan Algoritma Naïve Bayes Natural Disaster Monitoring Information System From Social Media Data Using Naïve Bayes Algorithm.” [Online]. Available: https://t.co/GhZJxNUUmT
F. W. Budhi and M. Y. G. Prasidana, “Sistem Peringatan Real-Time Berbasis Twitter Untuk Bencana Kebakaran Di Kota Jakarta,” Jurnal Riset Jakarta, vol. 13, no. 2, Dec. 2020, doi: 10.37439/jurnaldrd.v13i2.41.
K. W. Gusti dan R. Mandala, "Generating of Automatic Disaster Hashtag Based on Ocha Standard," dalam ICID Proceedings 2018, hal. C1 04, Informatics Departemen, UIN Sunan Kalijaga Yogyakarta, 10-12 November 2018, ISBN 978-602-53524-0-9.
M. Kartika Delimayanti, R. Sari, M. Laya, M. Reza Faisal, and dan Pahrul, “Edu Komputika Journal Pemanfaatan Metode Multiclass-SVM pada Model Klasifikasi Pesan Bencana Banjir di Twitter,” 2021. [Online]. Available: http://journal.unnes.ac.id/sju/index.php/edukom
F. N. Yudianto, “Klasifikasi Hashtag Buzzer/Bot Menggunakan Algoritma Random Forest dengan Atribut Komunitas untuk Mengurangi Disinformasi Pada Twitter.” [Online]. Available: www.trends24.in/indonesia/.
Y. Imanuela Claudy, R. S. Perdana, dan M. A. Fauzi, "Klasifikasi Dokumen Twitter Untuk Mengetahui Karakter Calon Karyawan Menggunakan Algoritme K-Nearest Neighbor (KNN)," Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 8, hlm. 2761-2765, Agustus 2018. [Online]. Tersedia: http://j-ptiik.ub.ac.id
N. Chamidah and R. Sahawaly, “Comparison Support Vector Machine and Naive Bayes Methods for Classifying Cyberbullying in Twitter,” Jurnal Ilmiah Teknik Elektro Komputer dan Informatika, vol. 7, no. 2, p. 338, Sep. 2021, doi: 10.26555/jiteki.v7i2.21175.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2023 Kharisma Wiati Gusti
Artikel ini berlisensi Creative Commons Attribution 4.0 International License.
KEBIJAKAN YANG DIAJUKAN UNTUK JURNAL YANG MENAWARKAN AKSES TERBUKA
Syarat yang harus dipenuhi oleh Penulis sebagai berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Commons Attribution License yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).