Məqalədə verilənlərin sanitarizasiyası metodundan istifadə etməklə ziyanlı informasiyanın qarşısının alınması üçün konseptual model təklif olunmuşdur. Məqsəd intellektual analiz metodlarından istifadə etməklə İnternet şəbəkəsində uşaqların təhlükəsizliyinin təmin edilməsini nəzərdə tutan sistemin yaradılmasıdır. Açar sözlər-uşaqların təhlükəsizliyi, sanitarizasiya metodu, konseptual model, veb-separator, veb-total.
Uşaqların İnternet mühitində təhlükəsizliyinin təmin olunması bu gün dünyada informasiya təhlükəsizliyinin vacib məsələlərindəndir. Hər bir dövlət gələcək nəslin daha sağlam və yararlı vətəndaş olmasında maraqlıdır. Məqalədə uşaqların İnternet mühitində qarşılaşdığı təhlükələr analiz edilərək müəyyənləşdirilmiş, uşaqların informasiya təhlükəsizliyinin təmin olunması ilə əlaqədar beynəlxalq və ölkədaxili tədbirlər, normativ sənədlər və qanunlar araşdırılmışdır. Müvafiq qanunvericilik aktlarından irəli gələn texnoloji vəzifələr müəyyənləşdirilmişdir. Uşaqların zərərli informasiyadan qorunmasını daha səmərəli şəkildə təmin etmək üçün texnoloji tədbirlərin görülməsinə dair təkliflər işlənmişdir.
Məqalədə verilənlərin sanitarizasiyasının (təmizlənməsinin), məqsəd və vəzifələri, əhatə dairəsi, tətbiq sahələri, perspektivləri araşdırılmışdır. Verilənlərin sanitarizasiyasının texnologiyaları, mövcud üsulları, bəzi elmi-nəzəri və aktual problemləri analiz olunmuşdur. Bu problemin həlli ilə bağlı görülən işlər təhlil olunmuş, müvafiq tövsiyə və təkliflər irəli sürülmüşdür.
Məqalədə veb-kontentlərdə vulqarizmlərin maşın təlimi əsasında aşkarlanması üçün bir yanaşma işlənmişdir. Veb-səhifələrdə zərərli məzmun daşıyan kontentlərin sayının artması zərərli məzmundan qorunma məsələsini aktuallaşdırır. İstifadəçilərin, əsasən də uşaq və yeniyetmələrin İnternetdə vulqarizmlərlə (qeyri-etik danışıq, jarqon ifadə, söyüş, təhqir və s.) qarşılaşması onların psixologiyasına öz mənfi təsirini göstərir. Həm onlayn mediada, həm də sosial mediada (Twitter və Facebook və s.) vulqar söz, söz birləşməsi və ifadələrin aşkarlanması üçün daha etibarlı avtomatik mətn aşkarlama metodlarının inkişaf etdirilməsi bu problemin həlli üçün çox böyük əhəmiyyət daşıyır. Təqdim olunan məqalədə N-grams+TF-IDF əlamətlərindən istifadə etməklə vulqarizmlərin aşkarlanması üçün yanaşma təklif edilmişdir. Burada əvvəlcədən məlum olan vulqar sözlərə N-gram+TF-IDF əsaslı əlamətlərin çıxarılması üsulu tətbiq olunaraq ədədi vektorlar generasiya olunmuşdur. Generasiya edilmiş ədədi vektor Naive Bayes alqoritmlərinin girişinə ötürülmüşdür. Müxtəlif əlamətlərdən istifadə etməklə aparılan eksperimentlərin nəticəsində unigram+TF-IDF əlamətləri əsasında klassifikasiya daha üstün nəticələr vermişdir. Vulqarizmlərin aşkarlanması üçün təklif edilən bu yanaşma uşaq və yeniyetmələrin danışıq mədəniyyətinin və insanlarla ünsiyyətinin formalaşmasında əhəmiyyətlidir. Bu yanaşma uşaqların İnternetdən əldə edilən zərərli məzmundan qorunmasında faydalıdır və uşaq təhlükəsizlik mərkəzlərində, təhsil sistemində istifadə edilə bilər.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.