Matrix Factorization is a widely used technique for modeling pairwise and matrix-like data. It is widely used in pattern recognition, topic analysis and other areas. Very often side information is available for every pair along with pairwise indices, however utilization of this extra information is problematic in pure matrix factorization framework. This article proposes novel method of utilizing side information by combining Quantile Random Forest and Regularized Matrix Factorization under Bayesian framework. Resulting algorithm estimates avoids exhaustive hyperparameter search by estimating them simultaneously during optimization. Optimization procedure with novel Surrogate Function is used to solve resulting MAP estimator. The model is evaluated on a real dataset.
На сучасному етапі розвитку інформаційного суспільства особливо актуальним завданням є забезпечення інформаційної безпеки персональних і корпоративних даних. Захист даних в інтернеті речей і вбудованих системах є темою публікацій останніх років. Одним із аспектів захисту інформації є розроблення спеціалізованого програмного забезпечення, завдання якого полягає у виявленні потенційних загроз із подальшим автоматичним реагуванням або інформуванням користувачів. Прикладом таких програмних засобів є системи виявлення вторгнень, що використовуються для забезпечення захисту комп'ютерних мереж від несанкціонованого доступу. Нині можна виділити такі основні напрями в розробленні подібних систем: підходи на основі певного набору правил; методи автоматизованого виявлення аномалій трафіку. Передбачається, що поведінка зловмисника в комп'ютерній мережі відрізняється від цифрових слідів, які залишає звичайний користувач. Отже, зазвичай завдання виявлення вторгнень зводиться до аналізу мережевого трафіку й розроблення методів розпізнавання. Одним із потужним засобів автоматичного пошуку шаблонів даних є нейронні мережі, які знаходять застосування й у системах виявлення атак. Особливостями роботи таких систем є висока швидкість навчання та адаптивність до нових типів атак. Зазвичай таке програмне забезпечення захисту даних працює в режимі реального часу й аналізує трафік як усередині мережі, так і зовнішні запити. Стаття присвячена аналізу останніх публікацій із побудови нейромережевих моделей у цій галузі. Акцент робиться на роботах, які пропонують методи побудови гібридних систем на основі поєднання нейронних мереж з іншими методами машинного навчання. Саме такі підходи отримали значні результати в комп'ютерній галузі та у сфері машинного перекладу. На основі аналізу попередніх публікацій пропонуються шляхи розвитку систем виявлення атак. Ключові слова: система виявлення вторгнень, нейронна мережа, захист інформації, гібридна система, ансаблеве навчання.
Matrix Factorization is a widely used technique for modeling pairwise and matrix-like data. It is frequently used in pattern recognition, topic analysis and other areas. Side information is often available, however utilization of this additional information is problematic in the pure matrix factorization framework. This article proposes a novel method of utilizing side information by combining arbitrary nonlinear Quantile Regression model and Matrix Factorization under Bayesian framework. Gradient-free optimization procedure with the novel Surrogate Function is used to solve the resulting MAP estimator. The model performance has been evaluated on real data-sets.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.