تشخیص نفوذ در شبکه‌های کامپیوتری (تحقیقاتی)

تغییرات پروژه از تاریخ 1394/01/29 تا تاریخ 1394/02/27

شناسایی حملات در شبکه‌های کامپیوتری از جنبهٔ اطّلاعات مورد استفاده در مرحلهٔ یادگیری، به دو دستهٔ تشخیص نفوذ و تشخیص ناهنجاری تقسیم می شود.

در تشخیص نفوذ، هم از ترافیک معمول و هم از ترافیک حمله استفاده می‌شود. برای انجام این مهم، روش‌های متنوّعی مورد استفاده قرار گرفته‌اند که در این پژوهش باید به اختصار مرور شده و در نهایت یکی از این روش‌ها برای تشخیص حملات مورد استفاده قرار گیرند.


![توضیح تصویر](https://boute.s3.amazonaws.com/168-intrusion-detection.jpg) 
# **1. مقدمه**
<br></br>
# 1.1 نفوذ چیست و چگونه انجام می شود؟


نفوذ<sup class="footnote-ref" id="fnref-1"><a href="#fn-1" rel="footnote">1</a></sup> به مجموعه ی اقدامات غیرقانونی که صحت و محرمانگی و یا دسترسی به یک منبع را به خطر می اندازد،[1] اطلاق می گردد. نفوذ ها می توانند به دو دسته ی داخلی و خارجی تقسیم شوند. نفوذهای خارجی به آن دسته نفوذهایی گفته می شود که توسط افراد مجاز و یا غیرمجاز از خارج شبکه به درون شبکه ی داخلی صورت می گیرد و نفوذهای داخلی توسط افراد مجاز در سیستم و شبکه ی داخلی، از درون خود شبکه انجام می پذیرد. نفوذگرها عموماً از عیوب نرم افزاری، شکستن کلمات رمز، استراق سمع ترافیک شبکه و نقاط ضعف طراحی در شبکه، سرویس ها و یا کامپیوترهای شبکه برای نفوذ به سیستم ها و شبکه های کامپیوتری بهره می برند. 

<br></br> 
# 1.2 سیستم تشخیص نفوذ چیست؟

یک سیستم تشخیص نفوذ  را می توان مجموعه ای از ابزارها،روش ها و مدارکی در نظر گرفت که به شناسایی،تعیین و گزارش فعالیت های غیرمجاز یا تائید نشده تحت شبکه،کمک می کند.عنوان تشخیص نفوذ،عنوان مناسبی برای سیستم های تشخیص نفوذ نیست،[2] زیرا این سیستمها حقیقتا نفوذ را تشخیص نمی دهند،بلکه فعالیتی در شبکه را به عنوان نفوذ تشخیص می دهند،که ممکن است اساسا نفوذ نباشد.در واقع ،سیستم تشخیص نفوذ بخش کوچکی از سیستم حفاظتی نصب شده در سیستم است و به عنوان یک سیستم خودکفا و مستقل در نظر گرفته نمی شود.

ابزار های امنیتی دیجیتال را می توان به گونه ای معادل ابزار های امنیتی فیزیکی دانست.به عنوان مثال دیوار آتش<sup class="footnote-ref" id="fnref-2"><a href="#fn-2" rel="footnote">2</a></sup> را می توان معادل درهای قفل شده،سیستم تشخیص نفوذ را معادل سیستم اعلام خطر و سیستم جلوگیری از نفوذ را معادل سگ های نگهبان دانست.فرض کنید که شما مخزنی از اسناد محرمانه دارید،که می خواهید با استفاده از حصاری در اطراف محوطه ،سیستم اعلام خطر،درهای قفل شده،سگ های نگهبان و دوربین ،از آن محافظت کنید.درهای قفل شده،از ورود غیر  مجاز افراد به درون مخزن جلوگیری می کنند،ولی در صورت نفوذ مهاجم ،هشداری به شما نمی دهد.سیستم اعلام خطر ،درصورتی که مهاجمی قصد ورود به مخزن را داشته باشد،به شما هشدار می دهند، ولی از نفوذ جلوگیری نمی کند .سگ های نگهبان ،نمونه ای از اقداماتی است که می تواند از ورودمهاجم ،جلوگیری کند.

همانطور که دیدیم،درهای قفل شده،سیستم اعلام خطر و سگ های نگهبان،نقش های مجزا ولی مکمل برای حفاظت مخزن اسناد محرمانه برعهدا داشتند.این موضوع در مورد دیوار آتش ،سیستم تشخیص نفوذ و سیستم جلوگیری از نفوذ نیز درست است.این سیستم ها فناوری های متفاوتی هستند که با کار در کنار یکدیگر،می توانند هشدار داده و از نفوذ جلوگیری کنند .محل قرار گیری و چیدمان این ابزار ها ،می تواند یک شبکه ناامن را به شبکه ای امن تبدیل کند.

سیستم های تشخیص نفوذ <sup class="footnote-ref" id="fnref-3"><a href="#fn-3" rel="footnote">3</a></sup>(IDS) وظیفه ی شناسایی و تشخیص هر گونه استفاده ی غیرمجاز به سیستم، سوء استفاده و یا آسیب رسانی توسط هر دو دسته ی کاربران داخلی و خارجی را بر عهده دارند. سیستم های تشخیص نفوذ به صورت سیستم های نرم افزاری و سخت افزاری ایجاد شده و هر کدام مزایا و معایب خاص خود را دارند. سرعت و دقت از مزایای سیستم های سخت افزاری است و عدم شکست امنیتی آن ها توسط نفوذگران، قابلیت دیگر این گونه سیستم ها می باشد. اما استفاده ی آسان از نرم افزار، قابلیت انطباق پذیری در شرایط نرم افزاری و تفاوت سیستم های عامل مختلف، عمومیت بیشتری را به سیستم های نرم افزاری می دهد و عمومأ این گونه سیستم ها انتخاب مناسب تری هستند.

به طور کلی سه عملکرد اصلی عبارتند از:
1) نظارت و ارزیابی
2) کشف   
 3) واکنش



![توضیح تصویر](https://boute.s3.amazonaws.com/168-intrusion.png)

<br></br> 
# 1.3 لزوم استفاده از سیستم های تشخیص نفوذ

در دنیای امروز، کامپیوتر و شبکه های کامپیوتری متصل به اینترنت نقش عمده ای در ارتباطات و انتقال اطلاعات ایفا می کنند. در این بین افراد سودجو با دسترسی به اطلاعات مهم مراکز خاص یا اطلاعات افراد دیگر و با قصد اعمال نفوذ یا اعمال فشار و یا حتی به هم ریختن نظم سیستم ها، عمل تجاوز به سیستم های کامپیوتری را در پیش گرفته اند Intruder و Cracker ،Hacker کلماتی هستند که امروزه کم و بیش در محافل کامپیوتری مطرح می باشند و اقدام به نفوذ به سیستمهای دیگر کرده و امنیت آن ها را به خطر می اندازد.[1,4] بنابراین لزوم حفظ امنیت اطلاعاتی و حفظ کارآیی در شبکه های کامپیوتری که با دنیای خارج ارتباط دارند، کاملأ محسوس است.
از آنجا که از نظر تکنیکی ایجاد سیستم های کامپیوتری( سخت افزار و نرم افزار) بدون نقاط ضعف و شکست امنیتی عملأ غیرممکن است، تشخیص نفوذ در تحقیقات سیستمهای کامپیوتری با اهمیت خاصی دنبال می شود.سیستم های تشخیص نفوذ برای کمک به مدیران امنیتی سیستم در جهت کشف نفوذ و حمله به کار گرفته شده اند. هدف یک سیستم تشخیص نفوذ جلوگیری از حمله نیست و تنها کشف و احتمالأ شناسایی حملات و تشخیص اشکالات امنیتی در سیستم یا شبکه های کامپیوتری و اعلام آن به مدیر سیستم است. عمومأ سیستم های تشخیص نفوذ در کنار دیواره های آتش و به صورت مکمل امنیتی برای آن ها مورد استفاده قرار می گیرند.
سیستم های تشخیص نفوذ برای بسیاری از سازمان ها ،از دفاتر کوچک تا شرکت های چند ملیتی ،ضرورتی هستند .برخی ازفواید این سیستم ها عبارتند از:
 اطلاق می گردد. نفوذ ها می توانند به دو دسته ی داخلی و خارجی تقسیم شوند. نفوذهای خارجی به آن دسته نفوذهایی گفته می شود که توسط افراد مجاز و یا غیرمجاز از خارج شبکه به درون شبکه ی داخلی صورت می گیرد و نفوذهای داخلی توسط افراد مجاز در سیستم و شبکه ی داخلی، از درون خود شبکه انجام می پذیرد. نفوذگرها عموماً از عیوب نرم افزاری، شکستن کلمات رمز، استراق سمع ترافیک شبکه و نقاط ضعف طراحی در شبکه، سرویس ها و یا کامپیوترهای شبکه برای نفوذ به سیستم ها و شبکه های کامپیوتری بهره می برند[1] . 

<br></br> 
# 1.2 سیستم تشخیص نفوذ چیست؟

"یک سیستم تشخیص نفوذ  را می توان مجموعه ای از ابزارها،روش ها و مدارکی در نظر گرفت که به شناسایی،تعیین و گزارش فعالیت های غیرمجاز یا تائید نشده تحت شبکه،کمک می کند[2]. اما در حقیقت سیستم های تشخیص نفوذ به صورت مستقیم نفوذ را تشخیص نمی دهند. در واقع این سیستم ها با بررسی فعالیت های در حال انجام در شبکه ، به کمک الگوریتم ها و یا الگوهایی که در خود دارند فعالیت های مشکوک را شناسایی کرده و به عنوان نفوذ معرفی می کنند. طبیعی است که امکان دارد بعضی از این فعالیت ها در واقع نفوذ نبوده و صرفا فعالیتی غیرعادی اما بی خطر باشند و سیستم در تشخیص نفوذ دچار اشتباه شده باشد.

ابزار های امنیتی دیجیتال را می توان به گونه ای معادل ابزار های امنیتی فیزیکی دانست[2]. به عنوان مثال اگر اطلاعاتی را که در شبکه ی خود داریم به عنوان اسنادی محرمانه در یک خانه تصور کنیم ، دیوار آتش<sup class="footnote-ref" id="fnref-2"><a href="#fn-2" rel="footnote">2</a></sup> نقش درهای قفل شده را دارند. در واقع درهای قفل شده نقش بازدارندگی و جلوگیری از نفوذ را دارند ، اما در صورت وقوع نفوذ هشدار دهنده نیستند! اما نقش سیستم های تشخیص نفوذ مثل سیستم های هشدار دهنده ی نصب شده در خانه است که در صورت وقوع نفوذ از وقوع آن جلوگیری نمی کنند اما به سیستم هشدار می دهند که نفوذی در حال انجام است. در واقع این سیستم ها نقش بازدارندگی ندارند!

در واقع یک شبکه ی امن مجموعه ای از سیستم ها است که مکمل یکدیگرند و با کار در کنار یکدیگر یک شبکه را امن می کنند. همان طور که دیدیم جلوگیری از نفوذ به عهده ی دیوار آتش بود اما وظیفه ی هشدار دادن به سیستم را سیستم های تشخیص نفوذ به عهده داشتند. بنابراین وظایف این اعضا مکمل و هماهنگ با یکدیگر است.

به طور کلی سه عملکرد اصلی عبارتند از[1] :
1) نظارت و ارزیابی
2) کشف   
 3) واکنش



![توضیح تصویر](https://boute.s3.amazonaws.com/168-intrusion.png)

<br></br> 
# 1.3 لزوم استفاده از سیستم های تشخیص نفوذ

در دنیای امروز، کامپیوتر و شبکه های کامپیوتری متصل به اینترنت نقش عمده ای در ارتباطات و انتقال اطلاعات ایفا می کنند. در این بین افراد سودجو با دسترسی به اطلاعات مهم مراکز خاص یا اطلاعات افراد دیگر و با قصد اعمال نفوذ یا اعمال فشار و یا حتی به هم ریختن نظم سیستم ها، عمل تجاوز به سیستم های کامپیوتری را در پیش گرفته اند Intruder و Cracker ،Hacker کلماتی هستند که امروزه کم و بیش در محافل کامپیوتری مطرح می باشند و اقدام به نفوذ به سیستمهای دیگر کرده و امنیت آن ها را به خطر می اندازد. بنابراین لزوم حفظ امنیت اطلاعاتی و حفظ کارآیی در شبکه های کامپیوتری که با دنیای خارج ارتباط دارند، کاملأ محسوس است[1].
اما هدف سیستم ها تشخیص نفوذ جلوگیری از آن نیست بلکه تشخیص نفوذ و البته ضعف های سیستم کلی و گزارش آن به مدیر سیستم است. در واقع کار اجزایی مثل دیوار آتش و سیستم تشخیص نفوذ مکمل یکدیگر برای حفظ امنیت و مقابله با نفوذ به یک سیستم است. اما در واقع سیستم های تشخیص نفوذ نخستین خط دفاعی در مقابل نفوذ های احتمالی می باشند[4] .

سیستم های تشخیص نفوذ برای بسیاری از سازمان ها ،از دفاتر کوچک تا شرکت های چند ملیتی ،ضرورتی هستند .برخی ازفواید این سیستم ها عبارتند از[2]:
·         کارایی بیشتر در تشخیص نفوذ،در مقایسه با سیستم های دستی

·         منبع دانش کاملی از حملات

·         توانایی رسیدگی به حجم زیادی از اطلاعات

·         توانایی هشدار نسبتا بلادرنگ که باعث کاهش خسارت می شود

·         دادن پاسخ های خودکار،مانند قطع ارتباط کاربر،غیر فعال سازی حساب کاربر،اعمال مجموعه دستورهای خودکار وغیره

·         افزایش میزان بازدارندگی

·         توانایی گزارش دهی


<br></br> 
# 1.4 روش های تشخیص نفوذ

"روش های تشخیص مورد استفاده در سیستم های تشخیص نفوذ به دو دسته تقسیم می شوند[53]:"
الف- روش تشخیص رفتار غیر عادی<sup class="footnote-ref" id="fnref-4"><a href="#fn-4" rel="footnote">4</a></sup>
ب-  روش تشخیص سوءاستفاده<sup class="footnote-ref" id="fnref-5"><a href="#fn-5" rel="footnote">5</a></sup> یا تشخیص مبتنی بر امضاء<sup class="footnote-ref" id="fnref-6"><a href="#fn-6" rel="footnote">6</a></sup>
<br></br> 
## 1.4.1 تشخیص رفتار غیر عادی

برای تشخیص رفتار غیرعادی، باید رفتارهای عادی را شناسایی کرده و الگوها و قواعد خاصی برای آن ها پیدا کرد. رفتارهایی که از این الگوها پیروی می کنند، عادی بوده و رویدادهایی که انحرافی بیش از حد معمول آماری از این الگوها دارند، به عنوان رفتار غیرعادی تشخیص داده می شود. نفوذهای غیرعادی برای تشخیص بسیار سخت هستند، چون هیچگونه الگوی ثابتی برای نظارت وجود ندارد. معمولاً رویدادی که بسیار بیشتر یا کمتر از دو استاندارد انحراف از آمار عادی به وقوع می پیوندد، غیرعادی فرض می شود. به عنوان مثال اگر کاربری به جای یک یا دو بار ورود و خروج عادی به سیستم در طول روز، بیست بار این کار را انجام دهد، و یا کامپیوتری که در ساعت ۲:۰۰ بعد از نیمه شب مورد استفاده قرار گرفته در حالی که قرار نبوده کامپیوتر فوق پس از ساعت اداری روشن باشد. هر یک از این موارد می تواند به عنوان یک رفتار غیر عادی در نظر گرفته شود.تکنیک ها و معیارهایی که در تشخیص رفتار غیرعادی به کارمی روند، عبارتند از:

۱)تشخیص سطح استانه"برای تشخیص رفتار غیرعادی، باید رفتارهای عادی را شناسایی کرده و الگوها و قواعد خاصی برای آن ها پیدا کرد. رفتارهایی که از این الگوها پیروی می کنند، عادی بوده و رویدادهایی که انحرافی بیش از حد معمول آماری از این الگوها دارند، به عنوان رفتار غیرعادی تشخیص داده می شود.نفوذهای غیرعادی برای تشخیص بسیار سخت هستند، چون هیچگونه الگوی ثابتی برای نظارت وجود ندارد[3]. یکی از حالات غیر عادی بودن استفاده بیش از حد معمول از یک سیستم است. مثلا اگر شخصی که یک یا دو بار در روز وارد سیستم می شده امروز چندین برابر گذشته وارد سیستم شده است این یک فعالیت غیر عادی است. یا مثلا زمان استفاده از یک سیستم نیز می تواند عاملی برای تشخیص مشکوک بودن فعالیت باشد. مثلا اگر شخصی خارج از ساعت اداری وارد سیستم شود نیز یک فعالیت مشکوک انجام داده که می تواند برای تشخیص نفوذ آن وارد عمل شد.

تکنیک ها و معیارهایی که در تشخیص رفتار غیرعادی به کارمی روند، عبارتند از[1] :

۱)تشخیص سطح استانه <sup class="footnote-ref" id="fnref-7"><a href="#fn-7" rel="footnote">7</a></sup>
تعداد ورود و خروج به / از سیستم و یا زمان استفاده از سیستم، از مشخصه های رفتار سیستم و یا استفاده کننده است که می توان با شمارش آن به رفتار غیرعادی سیستم پی برد و آن را ناشی از یک نفوذ دانست. این سطح کاملاً ایستا و اکتشافی<sup class="footnote-ref" id="fnref-8"><a href="#fn-8" rel="footnote">8</a></sup> است.

۲)معیارهای اماری<sup class="footnote-ref" id="fnref-9"><a href="#fn-9" rel="footnote">9</a></sup>
در نوع پارامتریک، مشخصات جمع شده براساس یک الگوی خاص در نظر گرفته می شود و در حالت غیر پارامتریک بر اساس مقادیری که به تجربه حاصل شده است مقایسه صورت می گیرد. از IDS های معروف که از اندازه گیری آماری برای تشخیص نفوذ رفتار غیرعادی استفاده می کنند، می توان <sup class="footnote-ref" id="fnref-10"><a href="#fn-10" rel="footnote">10</a></sup>NIDS را نام برد.

۳)معیارهای قانونگرا<sup class="footnote-ref" id="fnref-11"><a href="#fn-11" rel="footnote">11</a></sup>
شبیه به معیارهای آماری غیرپارامتریک است، به طوری که داده ی مشاهده شده براساس الگوهای استفاده شده ی مشخصی به طور قابل قبول تعریف می شود. اما با الگوهایی که به عنوان قانون مشخص شده فرق دارد و به صورت شمارشی نیست.

۴)سایر معیارها

دو معیار اول یعنی تشخیص سطح آستانه و معیار های آماری در IDS های تجاری استفاده می شوند. متاسفانه تشخیص دهندگان نفوذ های غیرعادی و IDS هایی از این نوع، باعث ایجاد تعداد زیادی هشدار نادرست می شوند و آن هم به خاطر این است که الگوهای رفتاری از جانب استفاده کنندگان و سیستم بسیار متفاوت است. در عوض محققان ادعا می کنند برخلاف روش های تشخیص مبتنی بر امضاء (که حتماً باید با الگوهای حملات قبلی منطبق باشند)، روشهای تشخیص رفتار غیرعادی قادر به کشف انواع حملات جدید هستند.
با این وجود ایجاد یک سیستم تشخیص نفوذ براساس روش تشخیص رفتارهای غیرعادی همیشه کار آسانی نیست، همچنین این روش ها از دقت روشهای تشخیص مبتنی بر امضاء برخوردار نیستند.


## *1.4.2تشخیص مبتنی بر امضا*

در این تکنیک الگوهای نفوذ از پیش ساخته شده (امضاء) به صورت قانون نگهداری می شوند. به طوری که هر الگو انواع متفاوتی از یک نفوذ خاص را در بر گرفته و در صورت بروز چنین الگویی در سیستم، وقوع نفوذ اعلام می شود. در این روش ها، معمولاً تشخیص دهنده دارای پایگاه داده ای از امضاء ها یا الگوهای حمله است و سعی می کند با بررسی ترافیک شبکه الگوهای مشابه با آن چه را که در پایگاه داده ی خود نگهداری می کند بیابد. این دسته از روش ها تنها قادر به تشخیص نفوذهای شناخته شده می باشند و در صورت بروز حملات جدید در سطح شبکه، نمی توانند آن ها را شناسایی کنند و مدیر شبکه باید همواره الگوی حملات جدید را به سیستم تشخیص نفوذ اضافه کند. از مزایای این روش دقت در تشخیص نفو ذهایی است که الگوی آن ها عیناً به سیستم داده شده است.

# 1.5 انواع معماری سیستم های تشخیص نفوذ

•  سیستم تشخیص نفوذ مبتنی بر میزبان <sup class="footnote-ref" id="fnref-12"><a href="#fn-12" rel="footnote">12</a></sup>(HIDS)  
•  سیستم تشخیص نفوذ مبتنی بر شبکه (NIDS)  <sup class="footnote-ref" id="fnref-10"><a href="#fn-10" rel="footnote">10</a></sup>
•  سیستم تشخیص نفوذ توزیع شده (DIDS)  <sup class="footnote-ref" id="fnref-13"><a href="#fn-13" rel="footnote">13</a></sup> 

<br></br> 
# **2.کارهای مرتبط**
<br></br> 
# 2.1 معرفی راه های مختلف تشخیص نفوذ در روش تشخیص رفتار غیرعادی

روش های تشخیص نابهنجاری ،سعی در مدل کردن رفتار عادی سیستم دارد و هر اتفاقی که از این مدل تخلف کند،رفتاری مشکوک در نظر گرفته می شود.برای مثال ،در صورتی که وب سروری که به صورت معمول منفعل است،تلاش کند تا به آدرس های زیادی دسترسی پیدا کند ،به احتمال زیاد به کرم آلوده شده است.
**در قسمت آزمایش ها در مورد نتایج آزمایش های مربوط به روش های مهم مطرح شده و مقایسه ی بین آن ها توضیحات کامل ارائه خواهد شد.**
روش های تشخیص نابهنجاری که در اینجا مورد بحث قرار می گیرد،عبارتند از [6]:

·         مدل های آماری

·         رویکرد سیستم امن

·         بازبینی پروتکل

·         بررسی فایل ها

·       ایجاد لیست سفید

·         شبکه های عصبی

·         الگوریتم ژنتیک

·         ماشین های بردار پشتیبان

·         درخت تصمیم
<br></br> 

## **مدل های آماری**

مدل های آماری جزو اولین روش های استفاده شده برای تشخیص نفوذ است.در این روش فرض بر این است که رفتار مهاجم نسبت به کاربر عادی،مناسب هستند .از همین شیوه برای سایر موضوع ها،مانند گروه ها و برنامه ها استفاه می شود.

برخی از خصوصیات آماری رخدادها که برای تشخیص استفاده می شوند،عبارتند از:

·         **اندازه آستانه:**این روش مقادیری تنظیم شده و یا ابتکاری،برای روی دادن رخدادها و یا تعداد دفعات روی دادن آنها طی یک دوره زمانی ،نسبت می دهد.بعضی از نمونه های معمول عباتند از ،ورود کاربر و غیر فعال شدن کاربر پس از تعداد مشخصی شکست در ورود

·         **میانه و انحراف معیار:** با مقایسه رخدادها با پروفایل میانه و انحراف معیار ،فاصله اطمینانی برای نابهنجاری قابل تخمین است.پروفایل ها ،بر اساس داده های تاریخی و یا مقادیری از پیش تنظیم شده می آیند.

·         **مدل های چند متغیره:**محاسبه همبسگی بین مقیاس های رخداد های مختلف،با توجه به انتظارات پروفایل

·         **مدل فرایند مارکوف** :این مدل انواع حملات را به عنوان متغیرهای حالت،در یک ماتریس حالت/گذر در نظر می گیرد.در این سیستم یک رخداد نابهنجار در نظر گرفته می شود،هرگاه احتمال وقوع آن رخداد برای حالت قبلی با مقدار وابسته اش،بسیار کم باشد.

**·**         **تحلیل دسته بندی:**این روش غیر پارامتری،بر مبنای نمایش جریان رخدادها به صورت برداری عمل می کند،که با استفاده از الگوریتم های دسته بندی در کلاس های مختلفی از رفتارها،گروه بندی می شوند.دسته بندی ها شامل فعالیت های مشابه یا الگوهای کاربر است،به نحوی که رفتار عادی از نابهنجار قابل تمایز است.
<br></br> 
## **رویکرد سیستم امن**

به طور ذاتی پیاده سازی برنامه ها ،مدلی از رفتار عادی برنامه به وسیله روند اجرای کد فراهم می کنند.در رویکرد سیستم امن برنامه ها بر حسب دنباله ای از فراخوانی های سیستمی برای شرایط مختلف ،مدل سازی می شوند(شامل رفتار عادی، حالت خطا و تلاش برای سوء استفاده) مقایسه این مدل با آثار رخدادهای مشاهده شده امکان دسته بندی رفتار عادی و نابهنجار را فراهم می کند.برای مثال ،رفتار نابهنجار یک فراخوانی سیستمی اجرایی در یک وب سرور ،می تواند نمایانگر حمله سرریز پشته باشد. این روش ،توانایی تشخیص بسیاری از حملات معمول را دارد،ولی از تشخیص حملاتی که برا اساس شرایط مسابقه،تخلف در سیاست ها و یا جعل هویت هستند،عاجز است.
<br></br> 
## **بازبینی پروتکل**

بسیاری از شیوه های حمله،بر اساس استفاده غیر معمول یا نابهنجار از فیلدهای پروتکل ها است.روش های بازبینی پروتکل،با دقت فیلدها و رفتار پروتکل را بر اساس استانداردها و انتظارات بررسی می کنند. داده هایی که از این محدوده تخطی کنند،به عنوان داده های مشکوک در نظر گرفته می شوند.

این رویکرد بسیاری از حملات معمول را شناسایی می کند ، ولی مشکل اساسی آن،رعایت ناچیز استانداردها در پیاده سازی بسیاری از پروتکل ها است.همچنین استفاده از این شیوه برای پروتکل های اختصاصی و یا نا آشنا،می تواند باعث ایجاد هشدارهای اشتباه شود.
<br></br> 

## **بررسی فایل ها**

این روش،از مجموع مقابله ای رمز شده داده های حساس سیستمی،برای شناسایی تغییراتی مانند نصب برنامه بصورت غیر مجاز،درهای پشتی به جای مانده از تروژانهای موفق قبلی و تخریب سیستم،استفاده می کنند.(این شیوه در برنامه های ضد ویروس،برای شناسایی تغییر در فایل های اجرایی استفاده می شود)این شیوه در بازیابی سیستم و بررسی های قانونی ،بسیار مفید است.مشکل این روش این است که ،تشخیص بعد از انجام تغییرات صورت می گیرد،همچنین در صورتی که مجموع مقابله ای اصلاح شود و یا فرایند تشخیص به خطر بیفتد،تشخیص انجام نخواهد شد.
<br></br> 

 

# **ایجاد لیست سفید**

 ایده این روش این است که ،جریانی از رخدادها را از میان تعدادی فیلتر،که هر کدام مجموعه ای از رخدادهای بی خطر را می شناسند عبور دهیم.رخدادهای باقی مانده در پایان کار،رخدادهای جدید یا مشکوک خواهند بود.در حقیقت این روش از شیوه داده کاهی استفاده می کند،که بررسی دستی جریان رخدادها را امکان پذیر می سازد.

<br></br>
## **شبکه عصبی**

  شبکه های عصبی <sup class="footnote-ref" id="fnref-14"><a href="#fn-14" rel="footnote">14</a></sup> را می توان با اغماض زیاد، مدل های الکترونیکی از ساختار عصبی مغز انسان نامیده و پایه مدل های تحلیلی عصبی بر شبیه سازی فعالیتهای یک سلول عصبی (نرون) استوار است،[9] مغز به عنوان سیستم پردازش اطلاعات از تعداد زیادی نرون (نرون ساده ترین واحد ساختاری سیستم های عصبی) تشکیل شده است .  شبکه عصبی یک برنامه نرم افزاری است که می تواند همانند مغز انسان عمل کند، به گونه ای که به مرور  2 زمان و تعامل بیشتر با محیط کارآزموده تر گردد؛ علاوه بر انجام محاسبات قادر به نتیجه گیری منطقی است؛ در شرایط جدید راهکار مناسب را ارائه نماید (قابلیت تعمیم ).  شبکه های عصبی به طور گسترده ای به عنوان روش موثر تطابق طبقه بندی الگوها مورد استفاده قرار می گیرد، اما حجم محاسبات بالا و سیکل های یادگیری طولانی آنها را از خیلی برنامه های کاربردی عقب انداخته است.  
در تشخیص نفوذ ناهنجاری (حملات شناخته نشده) از شبکه عصبی مصنوعی استفاده می شود، [8] شبکه عصبی مصنوعی برای شناسایی حملات ناشناخته شده و اجتناب از نفوذهای پنهانی مخرب دارای مزایای بیشتر از دیگر روش ها (مبتنی بر آمار و مبتنی بر قوانین) می باشد  

سیستم تشخیص نفوذ بر اساس شبکه های عصبی برای سیستم کامپیوتری ویژه شامل مراحل سه گانه زیر است : 
1. مجموعه داده های آموزشی : بدست آوردن لاگهایی برای هر کاربر در دوره های زمانی چند روزه  برای هر کاربر  از طریق یک بردار نشان می دهیم که یک کاربر چه دستوارتی را اجرا می کند.
2. آموزش : شبکه عصبی را برای شناسایی کاربر بر اساس دستوراتی که در بردار می باشد .
3. کارایی : شبکه ، کاربر را برای هر دستور جدید شناسایی میکند ،یعنی اینکه اگر کاربری دستور جدیدی که در بردار مربوط به وی وجود ندارد را اجرا کند سیستم قادر به شناسایی آن کاربر خواهد بود .

 <br></br> 


## **الگوریتم ژنتیک**
در اینجا دو فاز داریم . فاز اول آموزش است که اطلاعات اولیه مورد نیاز سیستم را به آن آموزش می دهیم. فاز دوم تشخیص است که سیستم، نفوذ را بر اساس آموزش های فاز اول نفوذها را تشخیص می دهد. در سیستم های تشخیص نفوذی که از الگوریتم ژنتیک برای آموزش استفاده می نمایند، یک سری قوانین اولیه دسته بندی شده در پایگاه داده قرار می دهیم و با بکارگیری الگوریتم ژنتیک <sup class="footnote-ref" id="fnref-15"><a href="#fn-15" rel="footnote">15</a></sup> قوانین جدیدی تولید شده و به قواعد قبل اضافه می شوند. در شکل زیر ساختار یک الگوریتم ژنتیک ساده نشان داده شده است.
![توضیح تصویر](https://boute.s3.amazonaws.com/168-genetic.jpg)
الگوریتم های ژنتیک، از تکامل ژنتیکی به عنوان یک الگوی حل مسئله استفاده می کند. راه حل ها طبق یک الگو کد گذاری می شوند که تابع هر راه حل کاندید را ارزیابی می کند که اکثر آن نام دارد و برازندگی می شوند.
تکامل از یک مجموعه کاملا تصادفی از جامعه اولیه شروع می شود و در نسل های بعدی تکرار می شود. این فرآیند تکرار می شود تا این که به آخرین مرحله برسیم. شرایط خاتمه الگوریتم ژنتیک می تواند به صورت زیر باشد [11]:

+ به تعداد ثابتی از نسل ها برسیم.
+ بودجه اختصاص داده شده تمام شود 􀀁
+ بیشترین درجه برازش فرزندان حاصل شود یا دیگر نتایج
+ بهتری حاصل نشود
+ بازرسی دستی 􀀁
+ ترکیب های موارد ذکر شده در بالا.
<br></br>
   
   
## **ماشین های بردار پشتیبان**
ماشین های بردار پشتیبان خصیصه های ورودی با مقادیر حقیقی را با نگاشت غیرخطی به فضایی با ابعاد بالاتر می برد و با قرار دادن یک مرز خطی، داده ها را جدا می کند. پیدا کردن یک مرز تفکیک برای جدا سازی داده ها به مسئله بهینه سازی درجه دوم تبدیل می شود و از مرز خطی برای تقسیم بندی استفاده می شود. اما همه مسائل به از ویژگی به نام توابع پایه SVM صورت خطی قابل تفکیک نیستند و برای حل این مشکل استفاده می کند. این توابع الگوریتم های خطی را به غیرخطی تبدیل می کند و با بردن داده ها به فضایی با ابعاد بالاتر، تفکیک خطی را در آن فضا ممکن می سازند.
**این الگوریتم شامل مراحلی با عملیات های ریاضی است  لذا با توضیحات ارائه شده شاید کمی گنگ به نظر بیاید. اما نگران نباشید در بخش آزمایش ها به جزئیات پیاده سازی و انجام مرحله به مرحله آن خواهیم پرداخت و عملیات آن را به صورت کامل و با مثال توضیح خواهیم داد.**


<br></br> 



## **درخت تصمیم**

درخت تصمیم <sup class="footnote-ref" id="fnref-16"><a href="#fn-16" rel="footnote">16</a></sup> یکی از روش های دسته بندی در حوزه داده کاوی است. در این بخش الگوریتمی ارائه می شود که با ساختن یک درخت تصمیم روی مجموعه ای از الگوها یا امضاهای شناخته شده از حملات، تعداد مقایسه های لازم برای شناسایی یک فعالیت مخرب را به نحو چشمگیری کاهش دهد [12] فرض می کنیم الگوی یک حمله که از روی تعدادی ویژگی بسته های اطلاعاتی بدست آمده است، به شکل یک قانون در پایگاه داده ذخیره شود. هر کدام از این ویژگی ها دارای نوع داده خاصی هستند (مثل در نظر n عدد صحیح، رشته و ...). اگر تعداد آنها را ثابت و برابر با n بگیریم هر زمان یک داده ورودی پردازش می شود. مقادیر این n ویژگی با ویژگی های موجود در قوانین مقایسه می شود. اگر داده ورودی کلیه محدودیت های قانون را برآورده کرد گفته می شود که الگوی متناظر با قانون با داده ورودی منطبق است. مجموعه ای که در ابتدا شامل تمامی قوانین است به عنوان ریشه درخت در نظر گرفته می شود. یک ویژگی انتخاب می شود و بر مبنای مقدار آن در قوانین مختلف، قوانین به زیرمجموعه هایی تقسیم می شوند که در حکم فرزندان ریشه هستند. مسئله اصلی در ساخت درخت تصمیم، انتخاب ویژگی یا صفتی است که به نحو مناسب داده ها را در کلاسهای مربوطه دسته بندی نماید. این عملیات روی همه زیرمجموعه ها تکرار می شود تا زمانی که همه داده هایی که در یک مجموعه قرار می گیرند متعلق به یک کلاس باشند. هر درخت تصمیم شامل نود، یال و برگ است. نودهای درخت معادل صفاتی است عملیات دسته بندی داده را بر اساس مقادیر آن صفات انجام می دهیم. یال ها با مقادیری که هر صفت برای یک زیرمجموعه خاص از داده ها دارد برچسب می خورد و برگ ها معادل.کلاسی است که بخشی از داده ها در آن قرار می گیرند
درختهای تصمیم روشی برای نمایش یک سری از قوانین هستند که منتهی به یک رده یا مقدار میشوند.درختهای تصمیمی که برای پیش بینی متغیرهای دسته ای استفاده میشوند، درختهای classification نامیده میشوند زیرا نمونه ها را در دسته ها یا رده ها قرار میدهند. درختهای تصمیمی که برای پیش بینی متغیرهای یپیوسته استفاده میشوند درختهای regression نامیده میشوند.[13]

از دیگر مزایای درخت تصمیم عبارتند از  :[10]

## *1.4.2تشخیص مبتنی بر امضا*

این روش به این ترتیب است که روش های مختلف نفوذی که از قبل استفاده شده و مقابله با آن ها تجربه شده است به صورت الگوهایی در سیستم قرار داده شده است. سیستم نیز فعالیت های انجام شده را با این الگوها مطابقت می دهد و طبیعی است که در صورت مطابقت یک فعالیت با یکی از این الگوها باید هشدار لازم را بدهد. در این روش ها، معمولاً تشخیص دهنده دارای پایگاه داده ای از امضاء ها یا الگوهای حمله است و سعی می کند با بررسی ترافیک شبکه الگوهای مشابه با آن چه را که در پایگاه داده ی خود نگهداری می کند بیابد.[3]
طبیعی است که چنین سیستم هایی توان تشخیص نفوذ هایی که با روش های جدید انجام شده و الگوی آن ها در سیستم موجود نیست را ندارند. در واقع این وظیفه ی مدیر سیستم است که با تحقیق و البته تجربه! الگوهای جدید و به روز نفوذ را در سیستم تشخیص نفوذ قرار دهد. در مقابل این سیستم ها در مقابل روش های نفوذی که شناخته شده بوده و الگوی آن ها در سیستم موجود است بسیار کارا هستند.

# 1.5 انواع معماری سیستم های تشخیص نفوذ [1]

•  سیستم تشخیص نفوذ مبتنی بر میزبان <sup class="footnote-ref" id="fnref-12"><a href="#fn-12" rel="footnote">12</a></sup>(HIDS)  
•  سیستم تشخیص نفوذ مبتنی بر شبکه (NIDS)  <sup class="footnote-ref" id="fnref-10"><a href="#fn-10" rel="footnote">10</a></sup>
•  سیستم تشخیص نفوذ توزیع شده (DIDS)  <sup class="footnote-ref" id="fnref-13"><a href="#fn-13" rel="footnote">13</a></sup> 

<br></br> 
# **2.کارهای مرتبط**
<br></br> 
# 2.1 معرفی راه های مختلف تشخیص نفوذ در روش تشخیص رفتار غیرعادی

روش های تشخیص نابهنجاری ،سعی در مدل کردن رفتار عادی سیستم دارد و هر اتفاقی که از این مدل تخلف کند،
**در قسمت آزمایش ها در مورد نتایج آزمایش های مربوط به روش های مهم مطرح شده و مقایسه ی بین آن ها توضیحات کامل ارائه خواهد شد.**
در واقع این تقسیم بندی ترکیبی از دسته بندی [2] و روش های دیگر به دست آمده از [5] و [6] و [7] است و در برخی نیز برداشت و توضیح من جایگزین متن اصلی شده است. (با ذکر منبع!)
روش های تشخیص نابهنجاری که در اینجا مورد بحث قرار می گیرد  (که در فازهای بعدی امکان اضافه شدن و تکمیل آن ها وجود دارد)،عبارتند از:

·         مدل های آماری

·         رویکرد سیستم امن

·         بازبینی پروتکل

·         بررسی فایل ها

·       ایجاد لیست سفید

·         شبکه های عصبی

·         الگوریتم ژنتیک

·         ماشین های بردار پشتیبان

·         درخت تصمیم
<br></br> 

## **مدل های آماری**

مدل های آماری [2] جزو اولین روش های استفاده شده برای تشخیص نفوذ است.در این روش بررسی می شود که فعالیت در حال بررسی تا چه میزان با فعالیت عادی و معمول یک کاربر مشابهت دارد. در واقع وجود تفاوت زیاد میان این رفتار با رفتار عادی می تواند معیار خوبی برای تشخیص نفوذ باشد. این میزان مشابهت با روش های مختلف آماری رخدادها می تواند بررسی شود که به اختصار در اینجا ذکر می شود :


·         **اندازه آستانه:**این روش مقادیری تنظیم شده و یا ابتکاری،برای روی دادن رخدادها و یا تعداد دفعات روی دادن آنها طی یک دوره زمانی ،نسبت می دهد.بعضی از نمونه های معمول عباتند از ،ورود کاربر و غیر فعال شدن کاربر پس از تعداد مشخصی شکست در ورود[2] .

·         **میانه و انحراف معیار:** با مقایسه رخدادها با پروفایل میانه و انحراف معیار ،فاصله اطمینانی برای نابهنجاری قابل تخمین است.پروفایل ها ،بر اساس داده های تاریخی و یا مقادیری از پیش تنظیم شده می آیند[2] . در واقع انتخاب یک پروفایل به عنوان پروفایل عادی و معیار تفاوت فعالیت انجام شده با فعالیت این پروفایل تعیین کننده است.

·         **مدل های چند متغیره:**محاسبه همبستگی بین مقیاس های رخداد های مختلف،با توجه به انتظارات پروفایل[2]

·         **مدل فرایند مارکوف** :این مدل انواع حملات را به عنوان متغیرهای حالت،در یک ماتریس حالت/گذر در نظر می گیرد.در این سیستم یک رخداد نابهنجار در نظر گرفته می شود،هرگاه احتمال وقوع آن رخداد برای حالت قبلی با مقدار وابسته اش،بسیار کم باشد [2].

**·**         **تحلیل دسته بندی:**این روش غیر پارامتری،بر مبنای نمایش جریان رخدادها به صورت برداری عمل می کند،که با استفاده از الگوریتم های دسته بندی در کلاس های مختلفی از رفتارها،گروه بندی می شوند.دسته بندی ها شامل فعالیت های مشابه یا الگوهای کاربر است،به نحوی که رفتار عادی از نابهنجار قابل تمایز است[2] .
<br></br> 
## **رویکرد سیستم امن**

اجرای کدها در یک برنامه دارای روندی شناسایی شده و معمول است. در واقع فراخوانی های سیستمی دارای روندی هستند که می توان به کمک آن برنامه ها را برای حالت عادی یا خطا یا نفوذ مدل سازی کرد و به کمک آن رفتارهای نا به هنجار را شناسایی نمود. برای مثال ،رفتار نابهنجار یک فراخوانی سیستمی اجرایی در یک وب سرور ،می تواند نمایانگر حمله سرریز پشته باشد. این روش ،توانایی تشخیص بسیاری از حملات معمول را دارد،ولی از تشخیص حملاتی که برا اساس شرایط مسابقه،تخلف در سیاست ها و یا جعل هویت هستند،عاجز است [2].
<br></br> 
## **بازبینی پروتکل**

بسیاری از شیوه های حمله،بر اساس استفاده غیر معمول یا نابهنجار از فیلدهای پروتکل ها است.روش های بازبینی پروتکل،با دقت فیلدها و رفتار پروتکل را بر اساس استانداردها و انتظارات بررسی می کنند. داده هایی که از این محدوده تخطی کنند،به عنوان داده های مشکوک در نظر گرفته می شوند [2] .

این رویکرد بسیاری از حملات معمول را شناسایی می کند ، ولی مشکل اساسی آن،رعایت ناچیز استانداردها در پیاده سازی بسیاری از پروتکل ها است.همچنین استفاده از این شیوه برای پروتکل های اختصاصی و یا نا آشنا،می تواند باعث ایجاد هشدارهای اشتباه شود[2].
<br></br> 

## **بررسی فایل ها**

این روش،از مجموع مقابله ای رمز شده داده های حساس سیستمی،برای شناسایی تغییراتی مانند نصب برنامه بصورت غیر مجاز،درهای پشتی به جای مانده از تروژانهای موفق قبلی و تخریب سیستم،استفاده می کنند.(این شیوه در برنامه های ضد ویروس،برای شناسایی تغییر در فایل های اجرایی استفاده می شود)این شیوه در بازیابی سیستم و بررسی های قانونی ،بسیار مفید است.مشکل این روش این است که ،تشخیص بعد از انجام تغییرات صورت می گیرد،همچنین در صورتی که مجموع مقابله ای اصلاح شود و یا فرایند تشخیص به خطر بیفتد،تشخیص انجام نخواهد شد[2].
<br></br> 

 

# **ایجاد لیست سفید**

این روش مانند یک فیلتر انجام می شود. به طور کلی این روش به این ترتیب است که فعالیت های مختلف از این فیلترهای تعیین شده که هر کدام مجموعه ی خاصی از فعالیت های بی خطر را می شناسند عبور می کنند. به طور طبیعی بعضی از فعالیت ها باقی مانده و نمی توانند از این فیلترها عبور کنند. بنابراین فعالیت های باقیمانده به عنوان فعالیت های جدیدی که البته ممکن است فعالیتی در راستای نفوذ باشند شناسایی می شوند.

<br></br>
## **شبکه عصبی**

  "شبکه های عصبی <sup class="footnote-ref" id="fnref-14"><a href="#fn-14" rel="footnote">14</a></sup> را می توان با اغماض زیاد، مدل های الکترونیکی از ساختار عصبی مغز انسان نامید، مغز به عنوان سیستم پردازش اطلاعات از تعداد زیادی نرون (نرون ساده ترین واحد ساختاری سیستم های عصبی) تشکیل شده است [5]. در واقع شبیه سازی یک شبکه عصبی مانند مغز انسان این قابلیت را دارد که مانند مغز انسان با گذشت زمان تجربه هایی را به دست آورده و ثبت کند. این تجربه ها به طور طبیعی در تعامل با محیط به دست می آید. در واقع یک سیستم مبتنی بر شبکه عصبی در تعامل با رخدادهای مختلف اعم از نفوذ یا غیر از آن می تواند الگوهایی را به دست آورده و ثبت کند.
  با توجه به این توضیحات قطعا پیاده سازی شبکه های عصبی احتیاج به محاسبات بالا دارد که این خود یک نقطه ضعف برای شبکه های عصبی در مقابل سایر روش های تشخیص نفوذ محسوب می شود. ضمن این که همانند مغز انسان این مدل شبکه ها نیز زمانی را برای یادگیری صرف می کنند! طولانی شدن این زمان نیز می تواند یک ضعف در این سیستم ها محسوب شود. 

سیستم تشخیص نفوذ بر اساس شبکه های عصبی برای سیستم کامپیوتری ویژه شامل مراحل سه گانه زیر است [6]:
1. مجموعه داده های آموزشی : بدست آوردن لاگهایی برای هر کاربر در دوره های زمانی چند روزه  برای هر کاربر  از طریق یک بردار نشان می دهیم که یک کاربر چه دستوارتی را اجرا می کند.
2. آموزش : شبکه عصبی را برای شناسایی کاربر بر اساس دستوراتی که در بردار می باشد .
3. کارایی : شبکه ، کاربر را برای هر دستور جدید شناسایی میکند ،یعنی اینکه اگر کاربری دستور جدیدی که در بردار مربوط به وی وجود ندارد را اجرا کند سیستم قادر به شناسایی آن کاربر خواهد بود .

 <br></br> 


## **الگوریتم ژنتیک**
در این الگوریتم 2 فاز کلی وجود دارد. در فاز اول ما آموزش هایی را به سیستم می دهیم و اطلاعاتی را در آن قرار می دهیم تا بتواند با الگو قرار دادن این آموزش ها و داده ها تشخیص نفوذ را انجام دهد. در فاز دوم به کمک این اطلاعات تشخیص نفوذ انجام می شود. در سیستم های تشخیص نفوذی که از الگوریتم ژنتیک برای آموزش استفاده می نمایند، یک سری قوانین اولیه دسته بندی شده در پایگاه داده قرار می دهیم و با بکارگیری الگوریتم ژنتیک <sup class="footnote-ref" id="fnref-15"><a href="#fn-15" rel="footnote">15</a></sup> قوانین جدیدی تولید شده و به قواعد قبل اضافه می شوند[7]. در شکل زیر ساختار یک الگوریتم ژنتیک ساده نشان داده شده است.
![توضیح تصویر](https://boute.s3.amazonaws.com/168-genetic.jpg)
الگوریتم های ژنتیک، از تکامل ژنتیکی به عنوان یک الگوی حل مسئله استفاده می کند. راه حل ها طبق یک الگو کد گذاری می شوند که تابع هر راه حل کاندید را ارزیابی می کند که اکثر آن نام دارد و برازندگی می شوند[7].
تکامل از یک مجموعه کاملا تصادفی از جامعه اولیه شروع می شود و در نسل های بعدی تکرار می شود. این فرآیند تکرار می شود تا این که به آخرین مرحله برسیم. شرایط خاتمه الگوریتم ژنتیک می تواند به صورت زیر باشد [7]:

+ به تعداد ثابتی از نسل ها برسیم.
+ بودجه اختصاص داده شده تمام شود 􀀁
+ بیشترین درجه برازش فرزندان حاصل شود یا دیگر نتایج
+ بهتری حاصل نشود
+ بازرسی دستی 􀀁
+ ترکیب های موارد ذکر شده در بالا.
<br></br>
   
   
## **ماشین های بردار پشتیبان**
ماشین های بردار پشتیبان خصیصه های ورودی با مقادیر حقیقی را با نگاشت غیرخطی به فضایی با ابعاد بالاتر می برد و با قرار دادن یک مرز خطی، داده ها را جدا می کند. پیدا کردن یک مرز تفکیک برای جدا سازی داده ها به مسئله بهینه سازی درجه دوم تبدیل می شود و از مرز خطی برای تقسیم بندی استفاده می شود. اما همه مسائل به از ویژگی به نام توابع پایه SVM صورت خطی قابل تفکیک نیستند و برای حل این مشکل استفاده می کند. این توابع الگوریتم های خطی را به غیرخطی تبدیل می کند و با بردن داده ها به فضایی با ابعاد بالاتر، تفکیک خطی را در آن فضا ممکن می سازند [7].
**این الگوریتم شامل مراحلی با عملیات های ریاضی است  لذا با توضیحات ارائه شده شاید کمی گنگ به نظر بیاید. اما نگران نباشید در بخش آزمایش ها به جزئیات پیاده سازی و انجام مرحله به مرحله آن خواهیم پرداخت و عملیات آن را به صورت کامل و با مثال توضیح خواهیم داد.**


<br></br> 



## **درخت تصمیم**

"درخت تصمیم <sup class="footnote-ref" id="fnref-16"><a href="#fn-16" rel="footnote">16</a></sup> یکی از روش های دسته بندی در حوزه داده کاوی است. در این بخش الگوریتمی ارائه می شود که با ساختن یک درخت تصمیم روی مجموعه ای از الگوها یا امضاهای شناخته شده از حملات، تعداد مقایسه های لازم برای شناسایی یک فعالیت مخرب را به نحو چشمگیری کاهش دهد [7] اگر ما یک الگوی نفوذ را در پایگاه داده های خود ذخیره کرده باشیم ، مجموعه خصوصیات این الگو می تواند معیاری برای بررسی سایر فعالیت ها باشد. حالا اگر داده های ورودی را بررسی کنیم و آن را با قانون های موجود و خصوصیات که در پایگاه داده موجود است مقایسه کنیم و این داده های ورودی با تمام آن خصوصیات مطابقت داشته باشند داده ورودی با الگوی متناظر با قانون منطبق است. مجموعه این خصوصیات گره ریشه درخت را تشکیل می دهند. حال اگر یک ویژگی را انتخاب کرده و مقدار آن را در قانونی تعیین کنیم می توان زیر مجموعه های مختلفی از قوانین تشکیل داد که گره های دیگر درخت را تشکیل می دهند.
  مسئله اصلی در ساخت درخت تصمیم، انتخاب ویژگی یا صفتی است که به نحو مناسب داده ها را در کلاسهای مربوطه دسته بندی نماید. هر درخت تصمیم شامل نود، یال و برگ است. نودهای درخت معادل صفاتی است عملیات دسته بندی داده را بر اساس مقادیر آن صفات انجام می دهیم. یال ها با مقادیری که هر صفت برای یک زیرمجموعه خاص از داده ها دارد برچسب می خورد و برگ ها معادل.کلاسی است که بخشی از داده ها در آن قرار می گیرند [7] .
درختهای تصمیم روشی برای نمایش یک سری از قوانین هستند که منتهی به یک رده یا مقدار میشوند.درختهای تصمیمی که برای پیش بینی متغیرهای دسته ای استفاده میشوند، درختهای classification نامیده میشوند زیرا نمونه ها را در دسته ها یا رده ها قرار میدهند. درختهای تصمیمی که برای پیش بینی متغیرهای یپیوسته استفاده میشوند درختهای regression نامیده میشوند[8] .

از دیگر مزایای درخت تصمیم عبارتند از [9] :

·          درخت تصمیم از نواحی تصمیم گیری ساده استفاده میکند.


·         مقایسه های غیر ضروری در این ساختار حذف میشوند.
 
·          آمادهسازی دادهها برای یک درخت تصمیم ساده یا غیر ضروری است.

·          درختهای تصمیم قادر به شناسایی تفاوتهای زیرگروه ها میباشد.

 
اغلب الگوریتم های یادگیری درخت تصمیم بر پایه یک عمل جستجوی حریصانه بالا به پائین در فضای درختهای موجود عمل میکنند.
در درخت تصمیم (ID3) از یک مقدار آماری به نام بهره اطلاعات Information Gain استفاده می شود تا اینکه مشخص کنیم که یک
ویژگی تا چه مقدار قادر است مثالهای آموزشی را بر حسب دسته بندی آنها جدا کند.
آنتروپی:
میزان خلوص (بی نظمی یا عدم خالص بودن)  مجموعه ای از مثالها را مشخص می کند. اگر مجموعه S شامل مثالهای مثبت و منفی از یک
مفهوم هدف باشد آنتروپی S نسبت به این دسته بندی بولی بصورت زیر تعریف می شود :
![توضیح تصویر](https://boute.s3.amazonaws.com/168-daum_equation_1428910115242.png)

بهره اطلاعات (Information Gain) :
بهره اطلاعات یک ویژگی عبارت است از مقدار کاهش آنتروپی که بواسطه جداسازی مثالها از طریق این ویژگی حاصل میشود.
بعبارت دیگر بهره اطلاعات (Gain(S,A برای یک ویژگی نظیر A نسبت به مجموعه مثالهای S بصورت زیر تعریف میشود:
![توضیح تصویر](https://boute.s3.amazonaws.com/168-daum_equation_1428910608348.png)

که در آن (Values A) مجموعه همه مقدار ویژگی های A بوده و VS زیرمجموعه ای از S است که برای آن A دارای مقدار V است.
در تعریف فوق عبارت اول مقدار آنتروپی داده ها و عبارت دوم مقدار آنتروپی مورد انتظار بعد از جداسازی داده هاست
<br></br> 
<br></br> 
# 2.2 معرفی انواع معماری های تشخیص نفوذ
<br></br> 

## **2.2.1 سیستم تشخیص نفوذ مبتنی بر میزبان :**<sup class="footnote-ref" id="fnref-12"><a href="#fn-12" rel="footnote">12</a></sup>

این سیستم، شناسایی و تشخیص فعالیت های غیرمجاز بر روی کامپیوتر میزبان را بر عهده دارد. سیستم تشخیص نفوذ مبتنی بر میزبان می تواند حملات و تهدیداتی را روی سیستم های بحرانی تشخیص دهد (شامل دسترسی به فایل ها، اسب های تروا و …) که توسط سیستم های تشخیص نفوذ مبتنی بر شبکه قابل تشخیص نیستند. HIDS فقط از میزبان هایی که روی آن ها مستقر است محافظت می کند و کارت واسط شبکه ی (NIC) <sup class="footnote-ref" id="fnref-17"><a href="#fn-17" rel="footnote">17</a></sup> آن ها به صورت پیش فرض در حالت باقاعده <sup class="footnote-ref" id="fnref-18"><a href="#fn-18" rel="footnote">18</a></sup> کار می کند. حالت با قاعده ی، در بعضی از موارد می تواند مفید باشد. چون همه ی کارت های واسط شبکه ی قابلیت حالت بی قاعده <sup class="footnote-ref" id="fnref-19"><a href="#fn-19" rel="footnote">19</a></sup> را ندارند. HIDS ها به واسطه ی مکانشان روی میزبانی که باید نظارت شود، از همه ی انواع اطلاعات محلی اضافی با پیاد ه سازی های امنیتی (شامل فراخوانی های سیستمی، تغییرات فایل های سیستمی و اتصالات سیستم) مطلع می باشند. این مساله هنگام ترکیب با ارتباطات شبکه ها، داده های خوبی را برای جستجوی رویداد های ممکن فراهم می کند.[7]
![توضیح تصویر](https://boute.s3.amazonaws.com/168-hids.JPG)

مزیت دیگر HIDS توانایی سازماندهی بسیار خوب تصمیمات برای هر میزبان منحصر به فرد می باشد. به عنوان مثال نیازی نیست روی میزبانی که سرویس نام گذاری دامنه (DNS) <sup class="footnote-ref" id="fnref-20"><a href="#fn-20" rel="footnote">20</a></sup> را اجرا نمی کند، قوانین چند گانه ای بررسی شوند که برای تشخیص سوءاستفاد ه ها از DNS طراحی شده اند. در نتیجه کاهش تعداد قوانین مربوطه، کارآیی را بالا می برد و سربار پردازنده را برای هر میزبان کاهش می دهد. همچنین HIDSها اطلاعات مشخصی در این باره که نفوذ از کجا، توسط چه کسی و چه موقع اتفاق افتاده است را فراهم می کنند. این عمل بسیار مفید است چون هیچ گونه کم کاری و حذف وجود ندارد.
در IDSهای مبتنی بر میزبان احتمال هشدارهای نادرست بسیار کم است، چرا که اطلاعات مستقیماً به کاربران برنامه های کاربردی بر می گردد. این IDS ها ترافیک کمتری نسبت به NIDS داشته و تاًکید بیشتری روی حسگرهای چندگانه ی مجزا و ایستگاه های مدیریت مرکزی <sup class="footnote-ref" id="fnref-21"><a href="#fn-21" rel="footnote">21</a></sup> دارند.از معایب HIDSها سازگاری کم بین سیستم عامل و در نتیجه نرم افزارهای چندگانه است. اغلب  IDSهای مبتنی بر میزبان تنها برای یک سیستم عامل نوشته می شوند. دیگر این که HIDS ها بعضی از حملات را که در لایه های پایین شبکه انجام می شوند، شناسایی نمی کنند.
<br></br>

## **2.2.2 سیستم تشخیص نفوذ مبتنی بر شبکه**<sup class="footnote-ref" id="fnref-10"><a href="#fn-10" rel="footnote">10</a></sup>

نام NIDS از این حقیقت مشتق شده است که از منظر محلی که قرار گرفته، بر تمام شبکه نظارت دارد. شناسایی و تشخیص نفوذهای غیرمجاز قبل از رسیدن به سیستمهای بحرانی، به عهده ی سیستم تشخیص نفوذ مبتنی بر شبکه است NIDSها اغلب از دو بخش ناظر (حسگر) و عامل <sup class="footnote-ref" id="fnref-22"><a href="#fn-22" rel="footnote">22</a></sup> تشکیل شده اند. این دو بخش اغلب در پشت دیواره ی آتش و بقیه نقاط دسترسی برای تشخیص هر نوع فعالیت غیرمجاز نصب می شود. عامل های شبکه می توانند جایگزین زیرساختار شبکه شوند تا ترافیک شبکه را جستجو کنند. نصب عاملها و ناظرها این مزیت را دارد که هر نوع حمله ای را در ابتدا از بین می برد. ضمناً دنباله های بررسی یک یا چند میزبان می توانند برای جستجوی علائم حملات، مفید باشند.
![توضیح تصویر](https://boute.s3.amazonaws.com/168-N-IDS.jpg)

عموماً کارت شبکه ی کامپیوتر در حالت باقاعده کار می کند. در این حالت عملیات، فقط بسته هایی که عازم آدرس ویژه ی فیزیکی(MAC) <sup class="footnote-ref" id="fnref-23"><a href="#fn-23" rel="footnote">23</a></sup> کارت شبکه هستند    ( یا بسته های همه پخشی <sup class="footnote-ref" id="fnref-24"><a href="#fn-24" rel="footnote">24</a></sup> ) برای تحلیل به پشته پروتکلی فرستاده می شوند NIDS باید در حالت بی قاعده کار کند تا بر ترافیک شبکه که عازم آدرس MAC خودش نیست، نظارت داشته باشد. در حالت بی قاعده، NIDS می تواند روی همه ی ارتباطات در سگمنت های شبکه استراق سمع کند. عملیات کارت شبکه ی NIDS  در حالت بی قاعده، برای حفاظت شبکه ضروری است. اگرچه از دید مقررات محرمانه و قوانین استراق سمع، نظارت بر ارتباطات شبکه مسئولیتی است که باید به دقت مورد رسیدگی قرار گیرد.شکل ۲ شبکه ای را نشان می دهد که از سه واحد NIDS استفاده کرده است. واحد ها روی سگمنت های استراتژیک قرار گرفته اند و می توانند بر ترافیک شبکه برای همه ی اجزای سگمنت ها نظارت کنند. این پیکربندی، استانداردی پیرامون توپولوژی امنیتی شبکه ارائه می دهد، به طوری که زیرشبکه های مجزای تحت پوشش سرویس دهنده های عمومی، به وسیله ی NIDS محافظت می شود.NIDS ها می توانند طوری برنامه ریزی شوند که مزاحمتی در طول کار ایجاد نشود. به طوری که حضور هر حمل های که تشخیص NIDSمی دهد، درون فایل رویدادها <sup class="footnote-ref" id="fnref-25"><a href="#fn-25" rel="footnote">25</a></sup> ثبت کرده و بدون این که مهاجم متوجه شود، به مدیر شبکه اطلاع می دهد.سیستم های تشخیص نفوذ مبتنی بر شبکه نیاز به کلمه ی عبور برای برنامه های کاربردی، حقوق مربوط به سیستم عامل شبکه یا اتصالات مربوط به سیستم در هنگام اجرای نرم افزار ندارد. همچنین از آنجا که این سیستم ها در سطح لایه ی شبکه عمل می کنند، به سیستم عامل وابستگی ندارند. ضمناً هیچگونه سربار و تغییری روی سرویس دهنده ها و ایستگاه های کاری <sup class="footnote-ref" id="fnref-26"><a href="#fn-26" rel="footnote">26</a></sup> به وجود نمی آورند، چرا که برای این سیستم های تشخیص نفوذ نیازی به نصب ابزارهای اضافی نیست.

معایب ها NIDS عبارتند از:
**۱-**    بعضی از سیستم ها قادر به جمع آوری داده با سرعت بالا نیستند. NIDS به خاطر جمع آوری و تجزیه و تحلیل با سرعت بالا، ممکن است بسیاری از بسته ها را از دست بدهد. بعضی از NIDS ها در سرعتهای بالا تر از ۱۰۰Mbps دچار مشکل می شود.
**۲-**    این سیستم ها فقط قادر ند به ترافیک سگمنت های محلی گوش دهند، یعنی فقط به کامپیوتر هایی گوش کنند که در آن سگمنت قرار دارند. ایده ال این است که NIDS به هر هاب و هر پورت معین روی یک سوییچ متصل شود. اگر حوزه ی دید محدود باشد، عملکرد نیز محدود خواهد شد.
**۳-**    بسته به ساختار NIDS اگر میزان داده ها زیاد باشد، این داده ها به ایستگاه مدیریت مرکزی قابل برگشت می باشد. هرچه مقدار داده جمع آوری شده بیشتر باشد، متعاقباً ترافیک نیز بیشتر خواهد بود.
**۴-**    واحد گزارش گیری می تواند تعداد زیادی از رویدادها را گزارش کند. به همین دلیل به یک فرد متخصص نیاز است تا گزارشات را تجزیه و تحلیل کرده و موارد نادرست را شناسایی کند.
**۵-**    چنانچه ترافیک شبکه رمز شده باشد، NIDS نمی تواند الگوهای حمله را تشخیص دهد. به طور کلی NIDS ها در شبکه های سوییچ شده دچار مشکل هستند.

همان طور که گفته شد سیستم های تشخیص نفوذ مبتنی بر شبکه از دو بخش ناظر و عامل تشکیل شده اند.ناظر یک دستگاه یا یک بسته ی نرم افزاری شبکه را به منظور یافتن بسته های اطلاعاتی مشکوک بررسی می کند. عامل نرم افزاری است که معمولاً به طور جداگانه روی هر یک از کامپیوتر های مورد نیاز قرار می گیرد و نقش ارسال اطلاعات را به صورت بازخوردی به ناظر برعهده دارد. همچنین ممکن است بخش دیگری هم به نام کنسول مدیریت وجود داشته باشد که به شکلی مطمئن (با اعتبار سنجی و رمزنگاری) به ناظر متصل می شود و از آن گزارش دریافت می کند و نیز به تبادل اطلاعات مربوط به تنظیم پیکربندی سیستم می پردازد. این سیستم های تشخیص نفوذ با استفاده از تکنیک هایی مانند شنود بسته ها <sup class="footnote-ref" id="fnref-27"><a href="#fn-27" rel="footnote">27</a></sup> ، داده ها را از درون بسته های اطلاعاتی TCP/IP یا سایر پروتکل ها که در حال جریان و نقل و انتقال در شبکه می باشند، استخراج می کنند. کارآیی این سیستم ها در برابر حملات جلوگیری از سرویس (DoS) <sup class="footnote-ref" id="fnref-28"><a href="#fn-28" rel="footnote">28</a></sup> و اشغال پهنای باند می باشد.[7]
<br></br>

## **2.2.3 سیستم تشخیص نفوذ توزیع شده**<sup class="footnote-ref" id="fnref-13"><a href="#fn-13" rel="footnote">13</a></sup>

این سیستم ها از چندین NIDS یا HIDS یا ترکیبی از این دو نوع همراه یک ایستگاه مدیریت مرکزی تشکیل شده است. بدین صورت که هر IDS که در شبکه موجود است گزارش های خود را برای ایستگاه مدیریت مرکزی ارسال می کند. ایستگاه مرکزی وظیفه بررسی گزارش های رسیده و آگاه سازی مسئول امنیتی سیستم را برعهده دارد. این ایستگاه مرکزی همچنین وظیفه به روزرسانی پایگاه قوانین تشخیص هر یک از IDS های موجود در شبکه را برعهده دارد. شکل ۳ یک سیستم تشخیص نفوذ توزیع شده را نمایش می دهد. NIDS 1,2 وظیفه محافظت از سرویس دهنده های عمومی و NIDS 3,4 وظیفه محافظت از شبکه داخلی را برعهده دارند. اطلاعات در ایستگاه مدیریت مرکزی ذخیره می شود. شبکه بین NIDS ها با سامانه مدیریت مرکزی می تواند خصوصی باشد و یا این که از زیرساخت موجود برای ارسال داده ها استفاده شود. وقتی از شبکه ی موجود برای ارسال داده های مدیریتی استفاده شود، امنیت های اضافی به وسیله ی رمزنگاری یا تکنولوژی شبکه های خصوصی مجازی VPN <sup class="footnote-ref" id="fnref-29"><a href="#fn-29" rel="footnote">29</a></sup> حاصل می گردد.![توضیح تصویر](https://boute.s3.amazonaws.com/168-dids.png)




# آزمایش‌ها

# کارهای آینده

# مراجع
<ol>
<li dir="ltr"><p> Paul Innella and Oba McMillan, “An Introduction to Intrusion Detection Systems”, ۲۰۰۱ <p></li>
<li dir="ltr"> <p> Ning , peng , and sushil jajodia “Intrusion Detection Techniques”.2004 <p> </li>
<li dir="ltr"> <p> Brian Caswell, Jay Beale, and Andrew R Baker, “Snort IDS and IPS Toolkit”, SyngressPublishing, 2007<p> </li>
<li dir="ltr"> <p>M. Analoui, A. Mirzaei, and P. Kabiri, “Intrusion detection using multivariate analysis of variance al-gorithm,”<p> </li>
<li dir="ltr"> <p> Brian Caswell, Jay Beale, and Andrew R Baker, “Snort IDS and IPS Toolkit”, Syngress Publishing, 2007. <p> </li>
<li dir="ltr"><p>Kabiri, Peyman, and Ali A. Ghorbani. "Research on Intrusion Detection and Response: A Survey." IJ Network Security 1.2 (2005): 84-102. <p></li>
<li dir="ltr"><p>http://hafiz-cert.com/Services/article/view.aspx?OId=116&PageIndex=0<p></li>
<li dir="ltr"><p> by Przemyslaw Kazienko & Piotr Dorosz [Published on _7 April 2003_ / Last Updated on _7 April 2003_] <p></li>
<li dir="ltr"> <p>.LixinWang, “Artificial Neural Network for Anomaly Intrusion Detection” ,٢٠٠٣ <p> </li>
<li dir="ltr"> <p>Abuadlla Yousef, Zoran Jovanovic, “Flow-Based Anomaly Intrusion Detection System using Neural Network”, Computer Engineering Department,University of Belgrae,Belgrade, Serbia.٢٠١٢<p> </li>
<li dir="ltr"><p>J.Han, and M.Kamber, "Data Mining: Concepts and Techniques", San Diego Academic Press, 2001.<p></li> 
<li dir="ltr"> <p> Alhazzaa, L., Intrusion Detection Systems Using Genetic Algorithms,12th Annual Canadian Information Technology Security Symposium, 2007. <p> </li>
<li dir="ltr"> <p>Kruegel, C., Toth, Th., Using Decision Trees to Improve Signature-Based Intrusion Detection, 43rd annual Southeast regional conference, 2005.<p> </li>
<br></br> 
<br></br> 


**با توجه به این که روش های معمول موجود برای تشخیص نفوذ در فاز قبل توضیح داده شد ، در این فاز و فاز بعد می خواهیم پرکاربردترین و بهترین این روش ها را با جزئیات بیشتری توضیح داده و تا حد ممکن با یکدیگر مقایسه کنیم.
در فاز 2 درخت تصمیم و ماشین بردار پشتیبان را ابتدا هر کدام به صورت انفرادی و همراه با نتایج بررسی کرده ،سپس با ارائه نتایج چند آزمایش انجام شده نتایج استفاده از این 2 را در سیستم های تشخیص نفوذ مقایسه می کنیم و در نهایت کارهای مرتبطی که در آن ها از این 2 به صورت ترکیبی استفاده شده را بررسی می کنیم. ضمن این که در این فاز به مفهوم کاهش ویژگی که در تشخیص نفوذ بسیار اهمیت دارد نیز می پردازیم.
در فاز 3 (اگر عمری بود و باز هم به لطف دوستان نمره صفر نگرفتیم!!) به بررسی شبکه عصبی ، الگوریتم ژنتیک و روش بیز و مقایسه ی کلی این چند روش با هم می پردازیم. امیدوارم در پایان این 3 فاز و با بررسی روش های ذکر شده که تقریبا شامل تمامی روش های کاربردی و معروف تشخیص نفوذ می شوند تا حد خوبی بررسی شده باشند.**

**نکته ی دیگر این که تقریبا سعی شد تمام رابطه و فرمول هایی که در مقاله ها گفته شده در این متن آورده شود اما تعداد بسیار کمی آورده نشده که به 2 دلیل بوده است. اول این که احساس می شد این روابط ربطی به موضوعات الگوریتمی و موضوع کلی بحث ندارد و صرفا محاسباتی برای پیدا کردن مقدار برخی متغیرهاست و دوم این که خود بنده (نویسنده) با وجود تلاش زیاد نتوانستم آن را به طور کامل درک کنم و طبیعتا از استفاده ی این فرمول ها که تعدادشان بسیار کم (در حد 3 یا 4) بود در متن این پروژه خودداری کردم.**


# **درخت تصمیم**:

درخت تصمیم به عنوان یک "مدل پیش بینی کننده بر اساس یادگیری ماشین و آمارها به منظور ایجاد یک ساختار درختی برای مدل کردن الگوهای داده ای" معرفی می شود. در واقع درخت های تصمیم مثال بارزی از الگوریتم کلاس بندی داده ها هستند. کلاس بندی روشی است که در آن هر کدام از داده ها به یکی از الگوهای تعیین شده نسبت داده می شوند[10].
مثلا درخت تصمیم در حوزه ی تشخیص نفوذ می تواند داده های شبکه را به کلاس های مخرب ، و یا هر مدل دلخواه دیگری    تقسیم بندی کند.
در واقع الگوریتم کلاس بندی مقدمه ای برای ساخت درخت است، به این ترتیب که با پیدا کردن الگوهای خاص در مجموعه ی داده ها درخت ها را ایجاد می کند. در شکل زیر مثالی از کلاس بندی و ایجاد یک خروجی به صورت درخت مشاهده می شود.

![توضیح تصویر](https://boute.s3.amazonaws.com/168-2.png)

آن چه که در شکل به عنوان ورودی مشاهده می کنید مشخصات داده ها هستند که این مشخصات عامل دسته بندی داده ها می باشند. مشخصات داده ها می توانند گسسته یا پیوسته باشند و برای نگهداری آن ها می توان مانند تصویر بالا از جداول و یا پایگاه داده ها و یا هر گونه فایل قابل قسمت بندی استفاده کرد.

به طور کلی ساختن یک درخت کاملا بهینه نشدنی است چرا که با افزایش خصوصیاتی در داده ها که برای ما مهم باشند تعداد حالات تولید درخت ها به صورت نمایی افزایش پیدا می کند. به همین خاطر انواع مختلفی از درخت ها وجود دارد که در جدول زیر 3 کلاس بندی کننده مختلف از درخت های تصمیم را با خصوصیات آن ها مشاهده می کنید [10]:

![توضیح تصویر](https://boute.s3.amazonaws.com/168-1.png)

نکته ای که در مورد مقایسه ی این درخت ها وجود دارد این است که نمی توان به طور مطلق یکی را برتر از دیگران دانست. در واقع در شرایط مختلف و در مورد مجموعه ی داده های مختلف درخت های متفاوتی می توانند بهترین نتایج را ارائه دهند.
کلاس بندی های که درخت های تصمیم انجام می دهند می توانند یک گروه را برای این که کدام الگوها را نگه داری کنند ، کدام روش های دیوار آتش را پیاده سازی کنند و یا کدام فعالیت ها را در شبکه برای آنالیز کردن نشانه گذاری کنند کمک می کنند اما مانند دیوار آتش یا سیستم های جلوگیری از نفوذ (IPS) نمی توانند به تنهایی نمی توانند عملیاتی برای مقابله با نفوذ انجام دهند.
<br></br> 
حالا می خواهیم اجزای درخت های تصمیم را با جزئیات بیشتری بررسی کنیم :

یک درخت تصمیم از 3 بخش اصلی تشکیل شده است [11]:

1- گره تصمیم 1 که نمایانگر یک صفت یا خصوصیت قابل تست است.

2- یال که بیانگر مقدار یک صفت یا به طور واضح تر خروجی تست آن صفت است.

3- برگ که همان گره پاسخ نامیده شده و بیانگر کلاسی است که شیء به آن تعلق دارد.

الگوریتم های مختلفی برای تولید درخت تصمیم معرفی شدند که در جدول بالا 3 نمونه به طور اختصاری بررسی شدند. اما برای انتخاب روش مناسب برای ساخت یک درخت تصمیم پارامترهای مختلفی وجود دارد [11]:
<br></br> 
**1- معیار انتخاب صفت مناسب :**
همان طور که گفته شد گره تصمیم بیانگر یک صفت است. این که کدام صفت را برای قرار گرفتن در گره ریشه ی درخت یا زیر درخت قرار دهیم نیاز به تعیین یک معیار مناسب برای مشخص شدن توان هر گره برای انتخاب شدن دارد.
معیارهای مختلفی برای این کار وجود دارد که ما به توضیح آن چه برای درخت C4.5 تعیین شده است می پردازیم. این معیار gain ratio نام دارد. ورودی های این تابع یک صفت به نام A  و یک مجموعه از اشیاء با نام T است.  این تابع به این صورت تعریف می شود :
![توضیح تصویر](https://boute.s3.amazonaws.com/168-9.png)

که در آن Ci تعداد اشیاء موجود در T است که به Ci تعلق دارد. و  ![توضیح تصویر](https://boute.s3.amazonaws.com/168-13.png)     زیر مجموعه ای از اشیاء است که در آن مشخصه ی Ak دارای مقدار ak است. و سپس مقدار مشخصات مشخصه ی Ak از رابطه ی زیر به دست می آید :
![توضیح تصویر](https://boute.s3.amazonaws.com/168-10.png)

و در نهایت Gain Ratio با این رابطه و با درجه بندی شدن توسط رابطه ی بالا این گونه نوشته می شود :
![توضیح تصویر](https://boute.s3.amazonaws.com/168-11.png)

همین مورد در درخت ID3 این گونه بیان می شود :
اغلب الگوریتم های یادگیری درخت تصمیم بر پایه یک عمل جستجوی حریصانه بالا به پائین در فضای درختهای موجود عمل میکنند. در درخت تصمیم (ID3) از یک مقدار آماری به نام بهره اطلاعات Information Gain استفاده می شود تا اینکه مشخص کنیم که یک ویژگی تا چه مقدار قادر است مثالهای آموزشی را بر حسب دسته بندی آنها جدا کند [9]. آنتروپی: [9] میزان خلوص (بی نظمی یا عدم خالص بودن)  مجموعه ای از مثالها را مشخص می کند. اگر مجموعه S شامل مثالهای مثبت و منفی از یک مفهوم هدف باشد آنتروپی S نسبت به این دسته بندی بولی بصورت زیر تعریف می شود : ![توضیح تصویر](https://boute.s3.amazonaws.com/168-daum_equation_1428910115242.png)  بهره اطلاعات [9] (Information Gain)  بهره اطلاعات یک ویژگی عبارت است از مقدار کاهش آنتروپی که بواسطه جداسازی مثالها از طریق این ویژگی حاصل میشود. بعبارت دیگر بهره اطلاعات (Gain(S,A برای یک ویژگی نظیر A نسبت به مجموعه مثالهای S بصورت زیر تعریف میشود: ![توضیح تصویر](https://boute.s3.amazonaws.com/168-daum_equation_1428910608348.png)  که در آن (Values A) مجموعه همه مقدار ویژگی های A بوده و VS زیرمجموعه ای از S است که برای آن A دارای مقدار V است. در تعریف فوق عبارت اول مقدار آنتروپی داده ها و عبارت دوم مقدار آنتروپی مورد انتظار بعد از جداسازی داده هاست
<br></br> 
**2- استراتژی تقسیم بندی :** 
روشی که در آن اعضای مجموعه ای که در مورد 1 ذکر شد را به کلاس صفت مناسب نسبت دهد.
<br></br> 
**3- محدوده ی توقف :**
این مورد تعیین کننده ی شرایطی است که با به وجود آمدن آن ادامه ی گسترش یک زیر درخت (و یا کل درخت) متوقف شود و در واقع زمان توقف ادامه ی تقسیم بندی مجموعه را بیان می کند. در واقع عملیات مقدار دهی به گره ها و یال ها در یک زیر درخت آنقدر ادامه پیدا می کنید تا همه ی داده ها در آن زیر درخت به یک کلاس تعلق پیدا کنند.

برای اضافه کردن اطلاعات به درخت تصمیم هر داده از ریشه شروع کرده و به گره ها می رود. در هر گره بررسی می شود که این داده به کدام کلاس مربوط است. این عمل آنقدر تکرار می شود تا به یک گره برگ برسیم. در آنجا برگی که این داده به آن تعلق پیدا کند محلی است که باید به آن جا اضافه شود.
<br></br> <br></br> 
ارتباط درخت تصمیم با سیستم های تشخیص نفوذ :
به طور خلاصه اگر بخواهیم فواید درخت تصمیم را برای سیستم های تشخیص نفوذ توضیح دهیم می توانیم فرآیندهای زیر را که به این سیستم ها کمک می کنند نام ببریم [10]:

-          استفاده به همراه روش ظرف عسل (Honey pot) (که روشیست بسیار جالب و جذاب!) که در آن یادگیری روش و تکنیک های نفوذ گران انجام شده و در شناسایی فعالیت های مخرب در شبکه کمک می کند.

به طور خلاصه تکنیک ذکر شده به این صورت است که به راحتی اجازه ی نفوذ را به نفوذگر می دهد و وی با فرض راحت بودن این کار ردپایی از خود به جا می گذارد که پیدا کردن این ردپا دقیقا همان هدف این تکنیک است!

-          کمک در تست های نفوذ با یاد گرفتن روش ها از تست کننده ها و پیدا کردن روش هایی برای شناخت روش های تست تست کننده ها.

-          شناخت و برجسته کردن ترافیک مخرب و مشکوک در شبکه

-          اولویت بندی کردن هشدارها با مشخص کردن هشدارهای با ارزش و اولویت کمتر.

-          نشانه گذاری روش های نفوذی که مکررا از آن ها استفاده می شود

-          شناسایی رفتارهای غیر عادی در شبکه که در فاز 1 در مورد آن ها توضیحات و مثال هایی ارائه شد

-          پشتیبانی و کمک به افزایش اطلاعات سیستم تشخیص نفوذ با پیدا کردن روش های تشخیص فعالیت های مخرب 

پس از این که درخت تصمیم ساخته شد ، می تواند حجم داده های موجود را کاهش دهد. در واقع داده هایی که به عنوان مخرب شناسایی نشده اند می توانند به خاطر بی خطر بودنشان حذف شوند. این کم کردن حجم اطلاعات یک کارایی بسیار مهم برای درخت تصمیم است.

در واقع کاری که یک درخت تصمیم در یک سیستم امنیتی انجام می دهد مشابه نشانه ی هدف گیری در یک اسلحه است که هدف را به تیرانداز نشان می دهد و سایر اجزا مانند خود سیستم تشخیص و جلوگیری نفوذ و دیوار آتش مانند اجزای شلیک تفنگ عمل می کنند.
هنگامی که روش یک نفوذ پیچیده شده و تعداد متغیرها و خصوصیت ها افزایش پیدا می کند روش های سیستماتیک مثل درخت تصمیم می تواند از این پیچیدگی کاسته و عملیات مخرب را شناسایی کند. یکی از مزیت های مهم درخت تصمیم نسبت به سایر روش ها ایجاد قوانینی کاملا شفاف ، قابل فهم و ساده برای پیاده سازی در سیستم های دارای محدودیت زمانی مثل تشخیص نفوذ و یا دیوار آتش است.

یکی دیگر از بزرگترین قابلیت های درخت تصمیم این است که تشخیص می دهد که روش های برخی از حملات زیرمجموعه ای از روش های دیگری است که در آموزش های قبلی فراگرفته است و این در تشخیص روش بسیاری از نفوذها مناسب است[12].
<br></br> <br></br> 
**پیاده سازی درخت تصمیم برای تشخیص نفوذ :**

نخستین کاری که باید انجام شود این است که داده ها و ابزارهای موجود که دریافت می کنیم باید پیش پردازش شوند. این پیش پردازش باید داده ها را به فرمی در آورد که درخت تصمیم بتواند از آن ها استفاده کند. در واقع داده های خام و پردازش نشده نمی تواند به عنوان ورودی درخت تصمیم مورد استفاده قرار گیرد!
نتیجه پردازش داده ها برای مرحله بعد که تعیین مجموعه قوانین است بسیار مهم است. در مرحله ی بعد آنالیز روی این داده ها انجام شده و از نتیجه ای آن برای تعیین قوانین تصمیم گیری استفاده می شود. شکل زیر مراحل کار درخت تصمیم را نشان می دهد [10]:

![توضیح تصویر](https://boute.s3.amazonaws.com/168-1.png)

<br></br> <br></br> 

**گرد آوری داده ها :**

گرد آوری داده ها یکی از زمان بر ترین و مهم ترین کارها برای استفاده از یک روش مانند درخت تصمیم است. روشی که برای گردآوری داده ها انتخاب می شود باید به عملیاتی که تیم تشخیص نفوذ از درخت تصمیم انتظار دارند مربوط باشد. به عنوان مثال اگر درخت تصمیمی قرار است داده های مخرب را از بی خطر تشخیص دهد باید دو مجموعه داده که یکی شامل داده های نمونه ی مخرب و دیگری شامل داده های نمونه ی بی خطر است در اختیار داشته باشد. پیدا کردن و تقسیم بندی چنین داده هایی می تواند بزرگترین دغدغه برای پیاده سازی این تکنیک باشد.
برای جمع آوری داده ها نیز می توان از روش های زیر استفاده کرد [10]:

-          ظرف های عسل که توضیحاتی در مورد آن ها داده شد منبع بسیار خوبی برای جمع آوری داده ها هستند چرا که آن ها با فراهم کردن امکان نفوذ برای نفوذگر باعث به جا ماندن ردپا از او و اطلاعاتش خواهند شد و این اطلاعات و داده ها قطعا برای سیستم ما مفید است.

-          فایل هایی که در آن ها اطلاعات و داده های نفوذ های قبلی ذخیره شده اند نیز منابع بسیار مناسبی هستند.

-          اطلاعاتی که از تست های نفوذ به دست می آید قابل استفاده است. در واقع روش هایی که تست کننده ها برای نفوذ به سیستم استفاده می کنند تا بتوانند قابلیت آن را آزمایش کنند نیز همراه با داده هایی است که می توانیم در سیستم خود از آن ها استفاده کنیم.

-          و در نهایت داده های موجود در سایت ها مانند [www.openpacket.org](http://www.openpacket.org) که می توانند داده های مخرب که قبلا آزمایش شده اند را در اختیار شخص قرار دهند.

اکنون به بررسی نتایج آزمایش روی یکی از انواع درخت که j48 است می پردازیم [8] .
برای این آزمایش از نرم افزار weka استفاده شده است که از 3 روش اصلی برای انتخاب ویژگی ها استفاده می کند :

**الف - روش (Correlation-based Feature Selection (CFS :**
نوعی روش کاهش ویژگیهاست که براساس همبستگی ها پایه گذاری شده است.این الگوریتم نمره بالایی به ویژگیهایی می دهد که دارای وابستگی شدیدتر به کلاس و وابستگی ضعیفی با یکدیگر دارند.

**ب-  (Information Gain) :** 
در مورد این روش در همین بخش و در قسمت درخت ID3 توضیحات لازم داده شده است.

**ج – (Gain Ratio) :**
خاصیت آن حساسیت داشتن به این است که یک ویژگی با چه گستردگی و یکنواختی داده ها را جدا میکند.برای اینکار عبارتی
به صورت  زیر تعریف میشود:

![توضیح تصویر](https://boute.s3.amazonaws.com/168-3.png)

حال با استفاده از این فرمول بهره به صورت زیر تعریف می شود :
![توضیح تصویر](https://boute.s3.amazonaws.com/168-4.png)

برای این آزمایش نیز از مجموعه داده KDDCup99 استفاده شده که 10 درصد آن شامل 494021 رکورد است (در مورد این مجموعه داده در آزمایش های بعدی توضیحات بیشتری ارائه شده است.
در این جا به جای 5 کلاس معمول موجود در مجموعه داده ها از 11 زیر کلاس مربوط به این 5 کلاس نام برده شده است. که در جدول های بعدی آن ها را مشاهده خواهید کرد.

برای نرمال سازی داده ها که عبارت است از بردن مقادیر ویژگی ها به محدوده [0,1] و همه داده های غیر عددی به عددی تبدیل می شوند از رابطه ی زیر استفاده شده که در آن Fi مقدار ویژگی که قرار است نرمال شود ، (min(F و (max(F بزرگترین و کوچکترین مقادیر ویژگی و FNi ویژگی نرمال شده می باشد :
![توضیح تصویر](https://boute.s3.amazonaws.com/168-12.png)

برای ارزیابی دسته ها از معیارهای استاندارد زیر استفاده شده است :

تی پی <sup class="footnote-ref" id="fnref-17"><a href="\#fn-17" rel="footnote">17</a></sup>  : این معیار بیانگر تعداد رکوردهایی است که دسته واقعی آن ها مثبت بوده و الگوریتم دسته بندی دسته آن ها را به درستی تشخیص داده است.
اف پی <sup class="footnote-ref" id="fnref-18"><a href="\#fn-18" rel="footnote">18</a></sup> : این معیار بیانگر تعداد رکوردهایی است که دسته واقعی آن ها منفی بوده و الگوریتم دسته بندی به اشتباه دسته آن ها را مثبت تشخیص داده است.
دقت <sup class="footnote-ref" id="fnref-19"><a href="\#fn-19" rel="footnote">19</a></sup> : مبتنی بر دقت دسته بندی است و مبین آن که چه اندازه می توان به خروجی اعتماد کرد.
فراخوانی <sup class="footnote-ref" id="fnref-20"><a href="\#fn-20" rel="footnote">20</a></sup> : برابر تعداد رکوردهای با برچسب مورد نظر است.

در جدول زیر ، زیر کلاس های حملات را که 11 زیر کلاس مشتق شده از 5 کلاس اصلی است مشاهده می کنید :

![توضیح تصویر](https://boute.s3.amazonaws.com/168-2.png)

و اما دراین جدول مقدار به دست آمده برای هر یک از معیارهای CfS,Gr,IG را مشاهده می کنید :

![توضیح تصویر](https://boute.s3.amazonaws.com/168-3.png)

مقایسه ی کلاس بندی های درست و غلط درخت تصمیم بر اساس 3 معیار CFS,GR,IG :

![توضیح تصویر](https://boute.s3.amazonaws.com/168-4.png)

و در نهایت مقایسه TP ها در زیر حملات بر اساس 3 معیار CFS,GR,IG 
![توضیح تصویر](https://boute.s3.amazonaws.com/168-5.png)

اما برای نتیجه گیری همان طور که مشاهده می شود ، دقت به دست آمده از الگوریتم CFS از دو الگوریتم دیگر بیشتر است و این الگوریتم باعث بهبود بیشتری در الگوریتم درخت J48 نسبت به دو الگوریتم دیگر می شود.




<br></br> <br></br> <br></br> <br></br> 



# **ماشین بردار پشتیبان :**

ماشین بردار پشتیبان یک متد برمبنای یادگیری ماشین است که اساس آن یادگیری با کمک اطلاعات است که داده ها را با کمک بردارهای پشتیبان که الگوهای داده ای را بیان می کنند کلاس بندی می کند[13].
برای دسته بندی کردن داده ها به 2 دسته باید تابع  (f(X ای پیدا کنیم به طوری که Yi= f(Xi) که برای N داده به صورت (X1 , Y1) .... (Xi,yi) ........ (Xn,Yn) تابع f را بتوان به این صورت تعریف کرد :  

![توضیح تصویر](https://boute.s3.amazonaws.com/168-5.png)

که در آن l تعداد رکوردهایی هستند که برای آموزش استفاده می شوند. {Yi ϵ {-1,1 و ai عددی مثبت و کوچکتر از عدد ثابت C است و Xi نیز بردار پشتیبان است.اما اگر تابعی که برای دسته بندی استفاده می شود خطی نشود ، باید داده ها را به ابعادی بالاتر ببریم تا تابع جدا کننده ی آن ها تابعی خطی بشود. برای این کار تبدیل به صورت زیر در می آید :

![توضیح تصویر](https://boute.s3.amazonaws.com/168-6.png)

که در آن (k(Xi,X تابع هسته نامیده می شود که همان تابعی است که برای بردن داده ها به بعد بالاتر از آن استفاده می شود.

<br></br> 

مدل ارتقاء یافته ماشین بردار پشتیبان [13]:

تابع هسته که در قسمت قبل معرفی شد می تواند انواع مختلفی داشته باشد و به دسته های مختلفی تقسیم شود که به علت پیچیدگی ریاضی بالا بیان آن ها مشکل است. بیشتر انواع توابع هسته به صورت خطی هستند و تفاوتی میان خصوصیت های مختلف داده ها قائل نمی شوند. مثلا تابعی که در قسمت قبل بیان شد نیز یک تابع خطی است که همین خصوصیت را دارد که در آن با همه خصوصیات داده ها به طور یکسان رفتار می شود. این یکسان بودن رفتار کارایی را پایین آورده و بر روی دقت ماشین بردار پشتیبان اثر منفی می گذارد. راه حلی که برای این کار به نظر می رسد این است که برای تابع هسته وزن در نظر بگیریم. این وزن ها برای تعیین اثر خصوصیت ها به کار می روند. حالت کلی تابع جدیدی که برای این کار در نظر می گیریم به صورت (k(WXi,X است ، که در آن W برداری است که شامل وزن خصوصیت ها می باشد.
به این ترتیب تابع کلی به صورت زیر در می آید :

![توضیح تصویر](https://boute.s3.amazonaws.com/168-7.png)

حالا نتیجه ی آزمایش انجام شده روی ماشین بردار پشتیبان معمولی و ارتقاء یافته را نشان می دهیم [13] :

در این آزمایش نیز مثل آزمایش های قبل و بعد از مجموعه داده های KDD استفاده شده است. که به علت وجود توضیحات در سایر آزمایش ها از توضیح آن خودداری می کنیم. در این آزمایش از 10 درصد این داده ها استفاده شده که 1.5 درصد آن ها مربوط به نفوذ ها و بقیه مربوط به داده های معمولی و غیر نفوذ است. برای این آزمایش یک مجموعه داده آموزشی به همراه 3 مجموعه برای تست که همگی زیر مجموعه ی مجموعه داده های اصلی هستند در نظر گرفته شده است.
مفاهیمی که در جدول از آن ها استفاده شده در آزمایش قبلی (درخت تصمیم) شرح داده شده است. نتایج به صورت زیر است :

![توضیح تصویر](https://boute.s3.amazonaws.com/168-6.png)

همان طور که در نتایج مشاهده می شود استفاده از ماشین بردار پشتیبان ارتقا یافته بیشتر از 80 درصد زمان بررسی داده ها را کاهش داده است! علاوه بر آن دقت تشخیص را نیز تا مقدار قابل توجهی بالا برده است. که از نظر تئوری هم همان طور که بیان شد این نتیجه کاملا قابل پیش بینی بود. چرا که در نظر گرفتن اهمیت و وزن خصوصیات داده ها یک مزیت بسیار اثرگذار است که در مقابل رفتار یکسان با همه خصوصیت ها قرار می گیرد.


<br></br> <br></br> 



مقایسه ی نتایج حاصل از دو روش درخت تصمیم و ماشین بردار پشتیبان بر روی داده های یکسان :

در این آزمایش از مجموعه داده های KDD99 استفاده شده است که داده های خام و مخرب TCP در طول 9 هفته می باشد. مجموعه ی داده ها به 24 نوع حمله (نفوذ) تقسیم بندی می شوند که این حمله ها نیز خود به 4 دسته اصلی تقسیم می شوند [12].

**1- حملات Dos :** در این حمله ها با ایجاد درخواست بیش از و به کارگرفته شدن بیش از حد منابع حافظه ای باعث اختلال در سیستم می شوند.

**2-حملات Remote to User:** در این نوع حملات نفوذگر در ماشین هدف اکانتی ندارد ، بنابراین با فرستادن پکت هایی در شبکه و با استفاده از آسیب پذیری ها به عنوان کاربر آن سیستم وارد می شود!

**3-حملات User to Root :** در این نوع حمله نفوذگر به یک اکانت معمولی دسترسی پیدا می کند و سپس با استفاده از نقاط آسیب پذیر به عنوان ریشه یا همان root دسترسی پیدا کرده و سیستم را در دست می گیرد.

**4-حملات  Probing:** در این نوع نفوذ ، نفوذگر با بررسی مداوم شبکه به نقاط آسیب پذیر یک سیستم پی می برد و با استفاده از آن ها به سیستم آسیب می زند.

یکی از نکات مهم انتخاب خصوصیت هایی است که می خواهیم آن ها را مورد بررسی قرار دهیم. این خصوصیات انواع مختلفی دارند. مثلا خصوصیت هایی که ارتباط هایی را بررسی می کنند که در 2 ثانیه گذشته دارای مقصد مشترکی بوده اند. یا ارتباط هایی که در 2 ثانیه گذشته سرویس مشترکی را داشته اند. بعضی دیگر نیز به دنبال خصوصیات رفتاری خاصی می گردند. مانند تعداد تلاش ناموفق برای ورود سیستم در یک زمان محدود.

اما برای تست یک روش تشخیص نفوذ مجموعه ی داده ای 2 قسمت می شود. تعدادی از آن ها که به صورت اتفاقی نیز انتخاب می شوند برای آموزش آن سیستم استفاده شده و بقیه برای تست استفاده می شوند. مثلا در آزمایش فعلی از حدود 11982 رکورد 5092 رکورد برای آموزش و 6890 رکورد برای تست استفاده می شوند.

هدف اصلی از این سیستم تشخیص نفوذ این است که تمامی این داده ها به 4 کلاس حمله که در بالا در مورد 4 نوع آن توضیح داده شد و یک کلاس معمولی که همان موارد بی خطر یا معمولی است تقسیم بندی شوند. در واقع ما 5 کلاس داریم که داده ها باید در یکی از این کلاس ها قرار گیرند.

روند کلی کار شامل 2 مرحله است که در ابتدا داده هایی برای آموزش سیستم به صورت تصادفی انتخاب می شوند که تعداد آن ها را در بالا ذکر کردیم. پس از این که سیستم آموزش لازم را دید باید به وسیله ی سایر داده ها آزموده شده و دقت آن در کلاس بندی داده های باقیمانده مورد ارزیابی قرار گیرد.
<br></br> 
نتایج مربوط به درخت تصمیم :

به صورت کلی هر کلاس بندی کننده (در این جا درخت تصمیم یا ماشین بردار پشتیبان) با داده های آموزشی ایجاد خواهد شد و هر داده به ترتیب با هر کدام از کلاس ها بررسی خواهد شد. هر کلاسی داده را به یکی از دسته های عادی یا حمله می دهد. طبیعی است که اگر کلاسی یک داده را در حالت معمولی قرار داد یعنی این که آن داده حداقل حمله ای از نوع آن کلاس نیست!
نتایج به دست آمده برای درخت تصمیم به این صورت است [12]:
![توضیح تصویر](https://boute.s3.amazonaws.com/168-7.png)
<br></br> 
نتایج مربوط به ماشین بردار پشتیبان [12]
برای ماشین بردار پشتیبان هم موارد ذکر شده در بخش بالا (درخت تصمیم) برقرار است. نتایج به دست آمده به این صورت است :
![توضیح تصویر](https://boute.s3.amazonaws.com/168-8.png)

در این ماشین بردار پشتیبان از تابع هسته ی درجه ای استفاده شده است (که در قسمت ماشین بردار پشتیبان توضیح آن ارائه شد) که چون در هر مورد می توان درجه های مختلف را بررسی کرده و نتایج مختلف گرفت نتایج به دست آمده از درجه های مختلف را این گونه نشان می دهیم [12]:

![توضیح تصویر](https://boute.s3.amazonaws.com/168-9.png)
<br></br> 
مقایسه بین نتایج درخت تصمیم و ماشین بردار پشتیبان :

درخت تصمیم در 3 مورد Probe , R2L , U2R دارای دقت بهتری بود در حالی که در مورد حملات DOS ماشین بردار پشتیبان دقت بهتری داشت. در مورد داده های Normal دقت مشابه بود. نکته مهمی که از نتایج به دست می آید این است که فاصله ی دقت این دو روش در 2 کلاس U2R , R2L زیاد است و درخت تصمیم با فاصله ی زیادی عملکرد بهتری دارد. همان طور که می دانیم این دو روش ذکر شده دارای آموزش کمتری نسبت به سایرین هستند بنابراین می توان نتیجه گرفت که درخت تصمیم با مجموعه داده های آموزشی کوچکتر نتایج خیلی بهتری ارائه می دهد.نمودار زیر هم کارایی درخت تصمیم و ماشین بردار پشتیبان را در مورد کلاس R2L نشان می دهد که واضح است که کارایی درخت تصمیم تا چه حد بهتر از ماشین بردار پشتیبان بوده است. در این نمودار از 30 نقطه داده ای برای نشان دادن کارایی ها استفاده شده است.

![توضیح تصویر](https://boute.s3.amazonaws.com/168-Untitled.png)



<br></br> <br></br> <br></br> <br></br> 

# **بهبود تشخیص نفوذ با استفاده از داده کاوی :**

در این جا ما به دنبال یافتن مهمترین ویژگیها و نحوه ارتباط بین آنها می باشیم درنتیجه برای تحلیل ارتباط ویژگیها میتوان از روشهای ارائه شده در تحلیل شبکه های اجتماعی بهره برد. برای این کار ابتدا لازم است مدل گراف ارتباط ویژگیها به دست آید.
مشکلی که در مدل دادهای سیستمهای تشخیص نفوذ وجود دارد این است که در این سیستمها، اطلاعاتی بین ویژگیها مبادله نمیشود درنتیجه لازم است مدل داده ای به نحوی به مدل گراف تبدیل شود، که نحوه انجام این تبدیل در بخش حاضر بیان میشود.[14]
<br></br> 
برای ایجاد مدل گراف ویژگی ها، ماتریس دقت معرفی می شود .ستونهای ماتریس دقت، نشاندهنده ویژگی ها و ردیفهای آن بیانگر انواع کلاسهای حملات در روشهای مختلف کلاس بندی می باشد،این ماتریس شاملf ستون و n*m   ردیف می باشد. به نحوی که تعداد f تعداد ویژگی های موجود در مجموعه داده و n تعداد روش های کلاس بندی و m تعداد انواع حملات می باشد. خانه (i,j) مقدار دقت کلاس i در عدم حضور ویژگی j  می باشد. علاوه بر میزان دقت، متغیر دیگری تحت عنوان زیر آستانه نیز در خانه های ماتریس قرار می گیرد. این متغیر دو مقدار صفر و یا یک را به خود می گیرد. درصورتی که حذف یک ویژگی از مجموعه ویژگی ها دقت کلاس را از حد آستانه تعیین  شده، پایین تر ببرد مقدار این متغیر به یک تنظیم می شود .مقدار یک بیان میکند که ویژگی j انتخاب شده برای کلاس i از اهمیت بالایی برخوردار است، چرا که حذف آن، دقت کلاس را بسیار کاهش داده است[14].
![توضیح تصویر](https://boute.s3.amazonaws.com/168-Untitled2.png)


برای محاسبه ماتریس دقت، الگوریتمهای دسته بندی مختلف به ازای حذف هر ویژگی، بر روی مجموعه داده اجرا میشوند. پس از اجرای هر روش دسته بندی، دقت دسته بندی مربوط به هرنوع حمله با استفاده از ماتریس اغتشاش که دقت هر دسته را نمایش می دهد در ماتریس دقت ثبت می شود .چنانچه میزان دقت هردسته کمتر از حد آستانه باشد، نشان دهنده اهمیت حضور ویژگی حذف شده می باشد .
حالا مدل گراف را با استفاده از این فرمول به دست می آوریم [14]: 
![توضیح تصویر](https://boute.s3.amazonaws.com/168-8.png)

این فرمول ، با استفاده از احتمال شرطی، وزن و جهت یال از ویژگی i به ویژگی j را به دست می آورد.[14] 
مقدار C نشان دهنده کلیه کلاس هایی است که متغیر زیر آستانه متناظر با آن ها در ماتریس دقت ، به ازای ویژگی انتخاب شده دارای مقدار 1 هستند. به همین ترتیب مقدار C تعداد کلاس هایی است که به ازای ویژگی i دارای مقدار یک هستند. در نهایت با کمک فرمول بالا و طبق احتمال شرطی جهت یال بین دو ویژگی i و j به دست می آید. خروجی این مرحله ماتریس گراف می باشد که دارای f سطر و f ستون است و مقدار خانه (i,j) وزن یال جهت دار از i به j را نشان می دهد.
<br></br> 
پس از ایجاد مدل گراف می خواهیم مدل سلسله مراتبی را ایجاد کنیم. اما قبل از آن ویژگی هایی که اندازه ی یال بین آن ها یک می باشد را حذف می کنیم. چرا که عدد 1 نشان دهنده این است که این ویژگی ها از نظر اهمیت مشابه هم هستند. این کار به منظور کاهش هزینه زمانی انجام می شود و پس از ایجاد مدل سلسله مراتبی دوباره آن ها را اضافه می کنیم.
برای ایجاد مدل سلسله مراتبی از 2 قانون استفاده می کنیم [14]:

1- در گراف ویژگی ها اگر یالی از i به j وجود داشته باشد ، گره i به عنوان پدر j انتخاب می شود.

2- یک گره نمی تواند 2 پدر داشته باشد! بنابراین اگر از دو گره j,k به i یال وجود داشته باشد ، در چنین شرایطی از مرکزیت وابستگی (که دارای یک رابطه ریاضی است) استفاده می شود که در نتیجه ی آن معلوم می شود که وابستگی i به j بیشتر است یا k. مثلا اگر وابستگی به k بیشتر باشد، k به عنوان پدر i شناخته شده و یال بین i و j حذف می شود.

در مدل سلسله مراتبی ویژگی هایی که در بالاترین سطح قرار گرفته اند مهم ترین و ویژگی های پایین ترین سطح غیر مهم و یا نامربوط هستند.
برای ارزیابی روش گفته شده از مجموعه داده KDD99 که برای ارزیابی تشخیص نفوذ جمع آوری شده ، استفاده شده است که دارای 4 میلیون رکورد با 41 ویژگی است که در این جا از بین آن ها 11000 رکورد انتخاب شده است. الگوریتم پیشنهادی نیز با استفاده از نرم افزار weka که ابزاری متن باز و مناسب برای این ارزیابی ها است، استفاده شده است.

در انجام آزمایش مدل سلسله مراتبی به این صورت در آمده است :

![توضیح تصویر](https://boute.s3.amazonaws.com/168-Untitled3.png)

که در آن گره های 2،22،23 در بالاترین سطح قرار دارند پس با اهمیت ترین ها هستند و چون گره 2 از نظر اهمیت مشابه 33،35،41 است در نهایت 6 ویژگی به عنوان مهم ترین ویژگی ها معرفی شده اند. نتایج حاصل از اجرای الگوریتم در مقایسه با سایرین به این گونه است[14] :
![توضیح تصویر](https://boute.s3.amazonaws.com/168-Untitled4.png)

همان طور که در جدول قابل مشاهده است، روش بیان شده در بعضی موارد دارای دقت بیشتری نسبت به سایر روش هاست و در سایر موارد دارای دقت مناسبی است.در واقع به طور کلی این روش به کاهش ویژگی ها می پردازد. از آن جا که سیستم های تشخیص نفوذ معمولا با داده های حجیم سر و کار دارند کاهش این مجموعه به سرعت و دقت این سیستم ها کمک بسیاری می کند. نکته دیگر این که دانستن مجموعه ویژگی های بهینه برای هر نوع حمله نیز نکته ای بسیار مهم در این روش است که می تواند کمک زیادی به سیستم تشخیص نفوذ بکند و سیستم می تواند برای هر نوع حمله از مجموعه مربوط به خود آن استفاده کند.


# کارهای آینده

# مراجع
<ol>

<li dir="ltr"><p>آلاله حمیدی ، سیده مارال ضیایی، "معرفی سیستم های تشخیص نفوذ"، آزمایشگاه تخصصی آپا در حوزه امنیت سرویس های شبکه و تجهیزات بی سیم، تیر 88 <p></li> 

<li dir="ltr"><p>http://hafiz-cert.com/Services/article/view.aspx?OId=116&PageIndex=0<p></li> 

<li dir="ltr"><p> Paul Innella and Oba McMillan, “An Introduction to Intrusion Detection Systems”, ۲۰۰۱ <p></li> 

<li dir="ltr"><p> + Kabiri, Peyman, and Ali A. Ghorbani. "Research on Intrusion Detection and Response: A Survey." IJ Network Security 1.2 (2005): 84-102.<p></li> 

<li dir="ltr"><p> ابراهیم بهروزیان نژاد ، "بررسی چند نمونه از سیستم های تشخیص نفوذ مبتنی بر شبکه عصبی" ، اسفند 1392 <p></li> 

<li dir="ltr"><p>  ،Jake Ryan , Meng-Jang Lin, Risto Miikkulainen, "Intrusion Detectio with Neural Networks", Texas University, 1997  <p></li> 

<li dir="ltr"><p>وحید شهبازی ، غلامرضا لطیف شبگاهی ، "مرور و دسته بندی روش های تشخیص نفوذ در شبکه های کامپیوتری"، آذر 91 <p></li> 

<li dir="ltr"><p>زینب محزون گلهپردسری، آناهیتا محمدی گلرنگ ، علی احمدیان رمکی و رضا ابراهیمی آتانی ، "تشخیص نفوذ در شبکه با استفاده از درخت تصمیمگیری J48 مبتنی بر انتخاب ویژگیهای مؤثر"، دانشگاه گیلان <p></li> 

<li dir="ltr"><p>حسن فضلی مقصودی، حسین مومنی ، "مقایسه و بررسی الگوریتم های دادهکاوی درخت تصمیم وماشین بردار پشتیبان برای تشخیص
نفوذ" <p></li> 

<li dir="ltr"><p>Jeff Markey, "Using Decision Tree Analysis for Intrusion Detection : How-To Guide", June 5 2011<p></li> 

<li dir="ltr"><p>Nahla Ben Amor, Salem Benferhat, Zied Elouedi, "Naive Bayes vs Decision Trees
in Intrusion Detection Systems",2004 ACM Symposium on Applied Computing<p></li> 

<li dir="ltr"><p>Sandhya Peddabachigari, Ajith Abraham, Johnson Thomas, "Intrusion Detection Systems Using Decision Trees
and Support Vector Machines",Department of Computer Science, Oklahoma State University, USA<p></li> 

<li dir="ltr"><p>JingTao Yao, Songlun Zhao, and Lisa Fan, "An Enhanced Support Vector Machine Model
for Intrusion Detection", Department of Computer Science, University of Regina<p></li> 

<li dir="ltr"><p>مریم معدنیپور، حسن ابوالحسنی، حسین شیرازی ، "بهبود تشخیص نفوذ براساس کاهش ویژگی و با استفاده از
دادهکاوی" ، 24 و 25 شهریورماه 1389 ، دانشگاه صنعتی خواجه نصیرالدین طوسی<p></li> 


</ol>


<br></br> <br></br> <br></br> <br></br> <br></br> <br></br> 


----------

<ol>
<li dir="ltr" id="fn-1"><p dir="ltr">Intrusion</p></li>
<li dir="ltr" id="fn-2"><p dir="ltr">Firewall</p></li>
<li dir="ltr" id="fn-3"><p dir="ltr">Intrusion Detection System</p></li>
<li dir="ltr" id="fn-4"><p dir="ltr">Anomay Detection</p></li>
<li dir="ltr" id="fn-5"><p dir="ltr">Misuse Detection</p></li>
<li dir="ltr" id="fn-6"><p dir="ltr">Signature-Based Detection</p></li>
<li dir="ltr" id="fn-7"><p dir="ltr">Threshold Detection</p></li>
<li dir="ltr" id="fn-8"><p dir="ltr">Heuristic</p></li>
<li dir="ltr" id="fn-9"><p dir="ltr">Statistical Measures</p></li>
<li dir="ltr" id="fn-10"><p dir="ltr">Network-based Intrusion Detection System</p></li>
<li dir="ltr" id="fn-11"><p dir="ltr">Rule-based Measures</p></li>
<li dir="ltr" id="fn-12"><p dir="ltr">Host-based Detection System</p></li>
<li dir="ltr" id="fn-13"><p dir="ltr">Distributed Intrusion Detection System</p></li>
<li dir="ltr" id="fn-14"><p dir="ltr">Neural Network Intrusion Detection</p></li>
<li dir="ltr" id="fn-15"><p dir="ltr">Genetic Algorithm</p></li>
<li dir="ltr" id="fn-16"><p dir="ltr">Decision Tree</p></li>
<li dir="ltr" id="fn-17"><p dir="ltr">Network Interface Card</p></li>
<li dir="ltr" id="fn-18"><p dir="ltr">Non promiscuous mode</p></li>
<li dir="ltr" id="fn-19"><p dir="ltr">promiscuous mode</p></li>
<li dir="ltr" id="fn-20"><p dir="ltr">Domain Name Service</p></li>
<li dir="ltr" id="fn-21"><p dir="ltr">Cetntralized management statement</p></li>
<li dir="ltr" id="fn-22"><p dir="ltr">Agent</p></li>
<li dir="ltr" id="fn-23"><p dir="ltr">Media Acess Control</p></li>
<li dir="ltr" id="fn-24"><p dir="ltr">Broadcast</p></li>
<li dir="ltr" id="fn-25"><p dir="ltr">Log file</p></li>
<li dir="ltr" id="fn-26"><p dir="ltr">Workstation</p></li>
<li dir="ltr" id="fn-27"><p dir="ltr">Packet Sniffing</p></li>
<li dir="ltr" id="fn-28"><p dir="ltr">Denial of Service</p></li>
<li dir="ltr" id="fn-29"><p dir="ltr">Virtual Private Network</p></li>True Positive (TP)</p></li> 
<li dir="ltr" id="fn-18"><p dir="ltr">False Positive (FP)</p></li> 
<li dir="ltr" id="fn-19"><p dir="ltr">Precision</p></li> 
<li dir="ltr" id="fn-20"><p dir="ltr">Recall</p></li> 

</ol>


 

# پیوندهای مفید

+ [The NSL-KDD Data Set](http://nsl.cs.unb.ca/NSL-KDD)