Xülasə-Anomaliyaların aşkarlanması verilənlərin analizində əsas məsələlərdəndir və şəbəkə təhdidlərinin aşkarlanmasında geniş istifadə olunur. Məqalədə Big data analitika əsasında şəbəkə trafikində anomaliyaların aşkarlanması üçün daha dəqiq və sadə multi-klassifikator modeli təklif olunmuşdur. Eksperimentlər NSL-KDD verilənlər dəsti üzrə WEKA proqram təminatında aparılmışdır.Anomaliyaların aşkarlanmasının dəqiqliyi baxımından təklif olunan model yaxşı nəticələr göstərmişdir.Açar sözlər-Anomaliya, Big data, Big data analitika, informasiya təhlükəsizliyi, klassifikatorlar ansamblı, IDS, NSL-KDD, WEKA.
I.
GİRİŞBəşəriyyətin mövcudluğundan təhlükəsizlik problemləri insanları daim düşündürmüş. Big data erasında isə təhlükəsizlik məsələlərinə maraq daha da artmış və siyasi, iqtisadi, sosial, demoqrafik, hərbi, ekoloji və s. kimi aspektlərdə çox ciddi elmi-tədqiqat istiqamətinə çevrilmişdir.[1]-də də göstərildiyi kimi Big data və informasiya təhlükəsizliyi məsələlərinə iki müxtəlif aspektdən baxmaq olar: informasiya təhlükəsizliyində Big data analitikanın tətbiqi və Big data texnologiyalarında informasiya təhlükəsizliyi problemləri.Şəbəkə xidmətlərindən, veb əlavələrdən geniş istifadə müəssisə və təşkilatlarda şəbəkə və kompüter təhdidlərinə qarşı təhlükəsizlik tədbirlərinin həyata keçirilməsini ön plana çəkmişdir. Belə ki, son zamanlar kiber-terror, kibermüharibələr və s. kimi kiber-məqsədli hücumların (məsələn, kiber-terror, kiber-müharibələr, APT-Advanced Persistent Threat və s.) sayı sürətlə artmaqdadır [2]. Korporativ kompüter şəbəkələrin təhlükəsizliyinə böyük təhdidlər yaradanbu hücumların aşkarlanması üçün şəbəkə, host, təhlükəsizlik qurğuları və s. mənbələrdən çox böyük həcmdə verilənlərin toplanması, verilənlərdə anomaliyaların aşkarlanması məsələsini aktuallaşdırır və məsələnin həllində daha effektiv analiz metod və alqoritmlərinin yaradılmasını tələb edir. Çünki kompüter şəbəkələrində təhlükəli trafiklərin erkən aşkarlanması, log faylların analizi şəbəkə təhlükəsizliyinin təmin edilməsində əsas şərtdir. Verilənlərin analizində anomaliyaların aşkarlanması isə əsas məsələlərdəndir. Anomaliyaların aşkarlanması qeyri-müntəzəm davranışlara müdaxilə etmək imkanı verir. Hücumların qarşısının qabaqcadan alınması (0-cı gündən), yəni əvvəllər rast gəlinməyən və bədniyyətli verilənlərin filtirlənməsi xüsusilə vacibdir.Anomaliya verilənlərdə müəyyən olunmuş normal davranışa uyğun olmayan qanunauyğunluq kimi başa düşülür və ya verilənlərin göstəricisi kimi təyin olunur. Tədqiqatlarda anomaliya sözünə sinonim kimi "outliers", "exceptions", "peculiarities", "surprise" terminləri də istifadə olunur [3]. Yəni anomaliyaların aşkarlanması verilənlərdə ehtimal olunan davranışlara uyğun olmayan şablonların tapılması problemidir. Bu problem özünü Big data kontekstində daha qabarıq göstərir. Anomaliyaların aşkarlanmasındakı ənənəvi metodlar böyük həcm, müxtəliflik, yüksək sürət kimi kimi xüsusiyyətlərlə təyin olunan böyük verilənlərdə yaxşı nəticə göstərmirlər [4][5][6][7].Anomaliyaların düzgün aşkarlanmaması və ya emalı əldə olu...