Розглянуто проблему моделювання часу виконання запитів в автономних реляційних базах даних з конкурентними запитами. Відзначено недоліки існуючих підходів, які ігнорують витрат на частку послідовних операцій при кооперативному доступі до даних в ієрархії пам'яті. Розглянуто питання застосування умовної вартості виконання складових операцій плану запиту, замість розрахунку передбачуваного часу обчислень. Запропоновано спосіб формального формування прецедентів навчальної вибірки, а також підхід до побудови регресійної моделі. Розроблена модифікація методу машинного навчання випадковий ліс застосовується для розрахунку часів виконання запитів за їхніми текстами та тимчасовими позначками початку, тривалості виконання. Розроблена параметрична модель конкурентного доступу до даних необхідна для отримання точних оцінок часу виконання запитів при використанні паралельних обчислень. Моделі з подібними характеристиками потрібні в рішенні задач автоматизації управління фізичною схемою даних, створення СУБД, що самовизначаються. Ключовими відмінностями від існуючих підходів є використання часу виконання запитів в якості цільового значення, обліку значень предикатів і взаємовпливу паралельно виконуваних запитів. Для підтвердження отриманих результатів була використана імітаційна модель на базі широко відомого тесту TPC-C. В якості функції втрат, з урахуванням регресійної природи моделі, було використано відношення суми модулів різниці фактичних і одержуваних часів до фактичних часів. Сама перевірка проводилася за контрольною вибіркою, що сформована за зростаючою довжиною навчання на відкладених даних. В ході проведених досліджень була доведена можливість застосування методу машинного навчання випадковий ліс для обробки статистичних даних виконання SQL запитів. Отриманий результат свідчить про перспективність такого підходу і дозволяє отримувати параметричні моделі конкурентної обробки запитів Ключові слова: автономні систем управління базами даних, бази даних, що самовизначаються, випадковий ліс, конкурентний доступ, паралельні обчислення в реляційних систем управління базами даних UDC 004.65
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.