Предметом вивчення у статті є процес тестування методів побудови рекомендаційних систем на основі відкритих наборів даних у мережі Інтернет. Метою є дослідження відкритих наборів даних веб-ресурсів у контексті застосування їх для тестування різних методів побудови рекомендаційних систем. Завдання: дослідити сучасні вебплатформи з відкритими наборами даних та можливість застосування їх даних для тестування якості роботи різних рекомендаційних систем. Отримані такі результати: Розглянуто найбільш популярні веб-платформи з відкритими наборами різнотипних мережевих даних. Здійснено порівняльний аналіз цих платформ з точки зору наявності вільного доступу до завантаження даних, їх функціональності та територіальної приналежності, формату даних та зручності для подальшого використання для машинного навчання, а також можливості застосування для тестування рекомендаційних систем. Також проведено оцінку актуальності даних, що зберігаються у репозиторіях з вільним доступом та наявності їх оновлення з часом. Висновки. Досліджено веб-платформи, що містять відкриті набори даних, які можна використати для тестування рекомендаційних систем. Основними перевагами більшості платформ є підтримка сучасних форматів даних та умовно вільний або вільний доступ. Серед недоліків розглянутих платформ слід зазначити недостатню структурованість деяких наборів даних, зокрема текстових, що значно обмежує їх застосування для тестування методів контентної фільтрації. Окрім того, одним з факторів, що обмежує використання відкритих наборів даних є їхня актуальність, тому що деякі набори, що зберігаються на платформах, є застарілими та не оновлюються. Усі розглянуті набори даних можуть бути застосовані для дослідницьких цілей та тестування роботи рекомендаційних систем.
Стаття присвячена розробці методу роботи рекомендаційних систем в однорангових децентралізованих комп’ютерних мережах. Існує велика кількість методів роботи рекомендаційних систем для веб-сайтів та застосунків, призначених для централізованих комп’ютерних мереж. В той же час дослідження децентралізованих однорангових мереж показало, що питання створення рекомендаційних систем для такої архітектури практично не розглядалося. Проведено дослідження методів роботи однорангових децентралізованих структурованих комп’ютерних мереж, наведено узагальнені принципи їх роботи. Запропоновано метод роботи рекомендаційної системи на основі колаборативної фільтрації для однорангової децентралізованої структурованої комп’ютерної мережі з адресацією на основі розподілених хеш-таблиць. Для представлення даних рекомендаційної системи було використано дві структури даних: розгорнуті зв’язні списки та хеш-таблиці з відкритою адресацією. Використовувалося два типи розгорнутих списків: асоційовані з користувачами – містили списки вподобаних ними об’єктів та асоційовані з об’єктами – містили списки користувачів, які вподобали відповідні об’єкти. Кожен комп’ютер децентралізованої комп’ютерної мережі містив список вподобань асоційований зі своїм користувачем та списки вподобань асоційовані з об’єктами, які на ньому розташовані. Доступ до відсутньої на поточному комп’ютері інформації здійснювався за допомогою запитів до інших комп’ютерів за відповідними ідентифікаторами, організованими розподіленою хеш-таблицею однорангової децентралізованої мережі. Проведено експериментальне дослідження запропонованого методу роботи рекомендаційної системи. Воно показало, що розроблений метод має досить високі показники точності (Precision) та низьку середньоквадратичну помилку. Недоліком розробленого методу є низькі показники повноти (Recall), що виникає через те, що метод часто робить помилкові негативні прогнози. Це жодним чином не впливає на точність рекомендацій, тому що об’єкти з негативним прогнозом вподобань не потрапляють до списку рекомендацій. Але це погіршує наповненість списків, адже багато елементів, які можна було додати до них, відсіюються.