Photo Photo Photo Photo Photo Photo

Print
E-mail
Computer Science: Spam Filtering based on Naïve Bayesian with Information Gain and Ant Colony System

 

Spam Filtering based on Naïve Bayesian with Information Gain and Ant Colony System

Huda Adil Abd Algafore*, Soukaena Hassan Hashem

Department of Computer Science, University of Technology, Baghdad, Iraq

Abstract

This research introduces a proposed hybrid Spam Filtering System (SFS) which consists of Ant Colony System (ACS), information gain (IG) and Naïve Bayesian (NB). The aim of the proposed hybrid spam filtering is to classify the e-mails with high accuracy. The hybrid spam filtering consists of three consequence stages. In the first stage, the information gain (IG) for each attributes (i.e. weight for each feature) is computed. Then, the Ant Colony System algorithm selects the best features that the most intrinsic correlated attributes in classification. Finally, the third stage is dedicated to classify the e-mail using Naïve Bayesian (NB) algorithm. The experiment is conducted on spambase dataset. The result shows that the accuracy of NB with IG-ACS is better than NB with IG only.

Keywords: Ant Colony System, Feature Selection, Information Gain, Naïve Bayesian and Spam Filtering System.

 

نظام تصفية الرسائل الالكترونية الغير مرغوب فيها بتهجين طريقة اختيار الخواص بأستخدام كسب المعلومات ونظام مستعمرة النمل

هدى عادل عبد الغفور*, سكينة حسن هاشم

قسم علوم الحاسبات, الجامعة التكنولوجية, بغداد, العراق

الخلاصة

يقدم هذا البحث نظام مقترح هجين لتصفية الرسائل الالكترونية غير المرغوب بها والذي يتالف من نظام مستعمرة النمل مع نظام الافتراضية البسيط. هدف النظام المقترح تصنيف الرسائل الالكترونية الغير مرغوب بها بدقة عالية .النظام الهجين المقترح يتكون من ثلاث مراحل متعاقبة. في المرحلة الاولى يتم احتساب كسب المعلومات ((IG لكل خاصية . ثم تقوم خوارزمية نظام مستعمرة النمل باختيار افضل الخواص التي تكون مترابطة ترابطا جوهريا في عملية التصنيف الرسائل الالكترونية. اخيرا ,الخطوة الثالثة يتم بها تصنيف الرسائل الالكترونية باستخدام خوارزمية نظام النظرية الافتراضيه البسيط. التجارب اجريت على بيانات spambase. النتائج اظهرت دقة التصنيف الرسائل الالكترونية لنظام الافتراضية البسيط مع نظام مستعمرة النمل افضل من نظام الافتراضية البسيط مع كسب المعلومات.




alt

 

S5 Box

Login



Register

*
*
*
*
*

Fields marked with an asterisk (*) are required.