Perbandingan Metode Support Vector Machine dan Logistic Regression untuk Klasifikasi Bencana Alam

Penulis

  • Kharisma Wiati Gusti FIK

DOI:

https://doi.org/10.52958/iftk.v19i2.6355

Kata Kunci:

Klasifikasi, Twitter, Bencana, Support Vector Machine, Logistic Regression

Abstrak

Media sosial, terutama Twitter, telah menjadi sumber penting untuk memantau dan merespons bencana alam. Klasifikasi teks dapat membantu mengidentifikasi pesan yang terkait dengan bencana alam di twitter. Penelitian ini membandingkan kinerja dari dua metode klasifikasi: Support Vector Machine, dan Logistic Regression. Dataset yang digunakan berisi sejumlah tweet yang dikategorikan secara manual menjadi tiga kelas, yaitu darurat, non darurat dan tidak relevan. Pra-pemrosesan data dilakukan untuk membersihkan teks, menghapus tautan dan karakter tertentu, tokenisasi dan normalisasi. Selanjutnya, representasi vektor Word2vec digunakan untuk mengekstraksi fitur yang terkait. Guna mengatasi ketidakseimbangan kelas pada dataset dilakukan teknik untuk mensintesis sampel baru menggunakan metode Synthetic Minority Over-sampling Technique (SMOTE). Model klasifikasi dilatih menggunakan dataset yang telah diolah dengan menggunakan Support Vector Machine, dan Logistic Regression. Kinerja kedua metode dievaluasi menggunakan metrik seperti akurasi, presisi, recall, dan F1-score. Hasil eksperimen menunjukkan bahwa SVM memiliki akurasi 80,41% dengan atau tanpa menggunakan metode SMOTE. Sedangkan metode Logistic Regression memiliki akurasi 63,36% tanpa SMOTE dan 70,74% dengan menggunakan SMOTE. Sehingga didapatkan bahwa metode Support Vector Machine memberikan hasil terbaik yaitu akurasi sebesar 80.41%. Penggunaan metode SMOTE tidak terlalu berpengaruh ketika menggunakan metode SVM, sedangkan dalam Logistic Regression pengguanaan SMOTE cukup berpengaruh, dengan memberikan kenaikan akurasi sebesar 28,26%. Penelitian ini dapat membantu dalam pengambilan keputusan darurat dan pemantauan bencana alam di media sosial.

Referensi

E. Nofiyanti and E. M. Oki Nur Haryanto, “Analisis Sentimen terhadap Penanggulangan Bencana di Indonesia,” Jurnal Ilmiah SINUS, vol. 19, no. 2, p. 17, Jul. 2021, doi: 10.30646/sinus.v19i2.563.

A. Layalia Safara Az-Zahra Gunawan and K. Muslim Lhaksamana, “Analisis Sentimen pada Media Sosial Twitter terhadap Penanganan Bencana Banjir di Jawa Barat dengan Metode Jaringan Saraf Tiruan Sentiment Analysis On Twitter Social Media On Flood Disaster Management In West Java With Neural Network Method.”

A. M. Maksun, Y. A. Sari, and B. Rahayudi, “Analisis Sentimen pada Twitter Bencana Alam di Kalimantan Selatan menggunakan Metode Naïve Bayes,” 2021. [Online]. Available: http://j-ptiik.ub.ac.id

E. Ananda Tasya, R. E. Saputra, and C. Setianingsih, “Sistem Informasi Monitoring Bencana Alam Menggunakan Data Media Sosial Dengan Algoritma Naïve Bayes Natural Disaster Monitoring Information System From Social Media Data Using Naïve Bayes Algorithm.” [Online]. Available: https://t.co/GhZJxNUUmT

F. W. Budhi and M. Y. G. Prasidana, “Sistem Peringatan Real-Time Berbasis Twitter Untuk Bencana Kebakaran Di Kota Jakarta,” Jurnal Riset Jakarta, vol. 13, no. 2, Dec. 2020, doi: 10.37439/jurnaldrd.v13i2.41.

K. W. Gusti dan R. Mandala, "Generating of Automatic Disaster Hashtag Based on Ocha Standard," dalam ICID Proceedings 2018, hal. C1 04, Informatics Departemen, UIN Sunan Kalijaga Yogyakarta, 10-12 November 2018, ISBN 978-602-53524-0-9.

M. Kartika Delimayanti, R. Sari, M. Laya, M. Reza Faisal, and dan Pahrul, “Edu Komputika Journal Pemanfaatan Metode Multiclass-SVM pada Model Klasifikasi Pesan Bencana Banjir di Twitter,” 2021. [Online]. Available: http://journal.unnes.ac.id/sju/index.php/edukom

F. N. Yudianto, “Klasifikasi Hashtag Buzzer/Bot Menggunakan Algoritma Random Forest dengan Atribut Komunitas untuk Mengurangi Disinformasi Pada Twitter.” [Online]. Available: www.trends24.in/indonesia/.

Y. Imanuela Claudy, R. S. Perdana, dan M. A. Fauzi, "Klasifikasi Dokumen Twitter Untuk Mengetahui Karakter Calon Karyawan Menggunakan Algoritme K-Nearest Neighbor (KNN)," Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 8, hlm. 2761-2765, Agustus 2018. [Online]. Tersedia: http://j-ptiik.ub.ac.id

N. Chamidah and R. Sahawaly, “Comparison Support Vector Machine and Naive Bayes Methods for Classifying Cyberbullying in Twitter,” Jurnal Ilmiah Teknik Elektro Komputer dan Informatika, vol. 7, no. 2, p. 338, Sep. 2021, doi: 10.26555/jiteki.v7i2.21175.

Unduhan

Diterbitkan

2023-09-01

Terbitan

Bagian

Article