DETEKSI EMAIL SPAM DENGAN CONTINUOUS BAG-OF-WORDS DAN RANDOM FOREST

Authors

  • Michiavelly Rustam President University
  • Agung Brotokuncoro President University
  • Rusdianto Roestam President University

DOI:

https://doi.org/10.572349/scientica.v2i4.1260

Abstract

Email Spam merupakan ancaman dunia maya yang signifikan, karena penipu menggunakan berbagai taktik untuk mengelabuhi individu agar membocorkan informasi sensitif atau mengunduh konten berbahaya. Misalnya, pada bulan Juni 2023, Indonesia menghadapi sekitar 6,51 ribu serangan Spam, yang menunjukkan luasnya permasalahan ini. Serangan-serangan ini sering kali melibatkan strategi penipuan, seperti peniruan identitas atau janji hadiah palsu, untuk menjerat korban yang tidak menaruh curiga. Mengalah pada Spam dapat mengakibatkan kerugian finansial dan dampak buruk lainnya. Untuk mengatasi masalah ini, Penelitian ini mengatasi masalah mendesak ini dengan berfokus pada klasifikasi konten email untuk mendeteksi upaya Phishing. Solusi yang diusulkan memanfaatkan platform runtime seperti Google Colab dan menggunakan analisis Continuous Bag of Words (CBOW) dan metode Random Forest. CBOW dipilih karena efektivitasnya dalam menangkap hubungan semantik antar kata, sehingga memungkinkan model mengekstrak fitur bermakna dari konten email. Random Forest, di sisi lain, dipilih karena kemampuannya menangani kumpulan data tidak seimbang yang biasa ditemui dalam tugas klasifikasi email, memastikan representasi yang adil dari email Spam dan Ham selama pelatihan model. Dengan menggabungkan kedua teknik ini, kami bertujuan untuk mengembangkan model klasifikasi yang kuat yang mampu membedakan secara akurat antara email Phishing (Spam) dan email sah (Ham), sehingga meningkatkan langkah keamanan email. Melalui pendekatan kami, kami bertujuan untuk mengklasifikasikan kumpulan data SpamAssassin ke dalam kategori Ham atau Spam, dengan tingkat presisi yang diharapkan sebesar 0,98, yang menunjukkan efektivitas model dalam mengidentifikasi email Phishing secara akurat.

Downloads

Published

2024-03-29

How to Cite

Michiavelly Rustam, Agung Brotokuncoro, & Rusdianto Roestam. (2024). DETEKSI EMAIL SPAM DENGAN CONTINUOUS BAG-OF-WORDS DAN RANDOM FOREST. Scientica: Jurnal Ilmiah Sains Dan Teknologi, 2(4), 339–347. https://doi.org/10.572349/scientica.v2i4.1260