اكتشاف محددات الموارد الموحدة الضارة باستخدام خوارزميات التصنيف في التعلم الآلي والتعلم العميق
##plugins.themes.academic_pro.article.main##
الملخص
بسبب الحاجة اليومية لاستخدام الروابط ومواقع الويب، وانتشار عناوين URL الضارة، تنشأ العديد من التهديدات الأمنية لمستخدمي الإنترنت والمؤسسات. يمكن أن تؤدي هذه التهديدات إلى خروقات للبيانات وسرقة الهوية، وقد تتسبب في انهيار النظام بالكامل. غالبًا ما تكون الطرق التقليدية للكشف عن عناوين URL الضارة غير كافية وتتطلب تقنيات متقدمة. تقدم هذه الدراسة تحسنًا في دقة وسرعة اكتشاف العناوين الضارة من خلال استخدام تقنيات التعلم التجميعي، وتحديدًا تقنيتي التعبئة والتكديس أظهرت التجارب المكثفة التي أجريت على مجموعة بيانات كبيرة ومتوازنة تحتوي على 491,530 عنوان، موزعة بالتساوي بين الحميدة والضارة، أن نماذج التعلم التجميعي تتفوق بشكل كبير على الخوارزميات الأخرى. حقق مصنف التعبئة الذي يستخدم أشجار القرار كمصنف أساسي دقة بنسبة 99.01٪، ووقت تدريب قدره 23.84 ثانية، ووقت تنبؤ قدره 0.86 ثانية. كما حقق مُصنِّف التكديس الذي يضم مصنف التعزيز التكيفي (AdaBoost) ومصنف الغابة العشوائية (Random Forest) ومصنف التعزيز التدرجي الفائق (XGBoost) كمُصنِّفات أساسية نتائج مماثلة، على الرغم من زيادة وقت التدريب إلى 4.61 ثانية نظرًا لتعقيد هذا النموذج. بالإضافة إلى النتائج التي حصلنا عليها، والتي أظهرت تفوق نماذج التجميع والتكديس، أجرينا مقارنة شاملة مع نماذج شائعة أخرى، بدءًا من نماذج التعلم الآلي الفردية مثل نموذج أقرب الجيران (k-Nearest Neighbors) ووصولًا إلى نماذج التعلم العميق مثل الشبكات العصبية ذات التغذية الأمامية (feedforward neural networks)، ووصولًا إلى نماذج التعلم التجميعي باستخدام تقنيات متنوعة مثل التعزيز (Boosting). تُسلِّط هذه النتائج الضوء على الإمكانات الواعدة للتعلم التجميعي في تعزيز تدابير الأمن السيبراني وحماية المستخدمين والشركات من هجمات العناوين الضارة.
##plugins.themes.academic_pro.article.details##

هذا العمل مرخص بموجب Creative Commons Attribution 4.0 International License.