Розглянуто програмні засоби для аналізу, моделювання та візуалізації гідрологічних даних. Представлено огляд основних можливостей комерційних програмних продуктів та програмних засобів з відкритим вихідним кодом. Визначено особливості використання проектів з відкритим вихідним кодом при створенні програмних засобів.Ключові слова: візуалізація даних, аналіз гідрологічних даних, ГІС, GRASS, QGIS, SAGA, ESRI.Рассмотрены программные средства для анализа, моделирования и визуализации гидрологических данных. Представлен обзор основных возможностей коммерческих программных продуктов и программных продуктов с открытым исходным кодом. Определены возможности использования проектов с открытым исходным кодом при создании программных средств.Ключевые слова: визуализация данных, анализ гидрологических данных, ГИС, GRASS, QGIS, SAGA, ESRI.The use of various software tools, including geoinformation technologies, in modern hydrological research is due to the large volumes of spatial information used, the complexity, specifics of its processing, analysis and visualization. The main goal of the work is to review the software tools and their capabilities in conducting hydrological studies. Not only commercial software tools are considered in this paper, but also so-called OpenSource projects, which in one way or another provide solutions to hydrological tasks. In the analysis of literature, the authors of the article are considering works on application of existing software tools in hydrological research, as well as new, modern developments in this direction. The following commercial software products were considered: ESRI's product line (ArcMap, ArcCatalog, ArcToolbox), ESRI and Aquaveо's joint campaign development software package (Arc
Розглядається обчислювальна схема розкладання часового ряду на компоненти та її реалізація на прикладі даних гідрологічного моніторингу.Ключові слова: компоненти часового ряду; декомпозиція; тренд; сезонність.Рассматривается вычислительная схема разложения временного ряда на компоненты и ее реализация на примере данных гидрологического мониторинга.Ключевые слова: компоненты временного ряда; декомпозиция, тренд; сезонность.Conducting research on the hydrological data objects is an important step in monitoring their condition. Changes in the quality and quantity of surface waters has social, environmental and economic consequences and require careful monitoring and, if necessary, quick response to adverse changes. This article discusses the computational scheme for the allocation of components in the time series, as well as the implementation and analysis of the above scheme using the example of hydrological monitoring data.The developed computational scheme processes the data presented in the form of time series.The first step in the analysis of hydrological data is the determination of the primary statistical characteristics of the object under study. Among these characteristics: average, minimum and maximum values of the time series; median, variance, coefficient of variation, kurtosis and asymmetry of the time series. The preliminary assumptions about the presence of deterministic components in the time series are made on the basis of a correlogram analysis based on the initial data.To test the hypothesis of the presence in the time series of the trend component, the Fosters-Stewarts method is used. When confirming the hypothesis that a trend in the time series is present, the trend component is removed by the described linear regression model, the parameters of which are calculated by the least squares method. Identification of periodic component of a time series is carried out using the methods of the Fourier analysis. The dynamics of the series are determined with using the methods of linear and nonlinear regression, in particular: polynomial (3 degrees), power, exponential, Phillips curve and Engel curve, whose parameters are calculated by the least ____________________
The aim of the work is to develop and implement a technology for identifying similar series, and to test on series of data represented by hydrological samples. The subject of the study is the methods and approaches for identifying similar series. The object of the study is the process of identifying similar series, which are represented by certain indicators. The task is to propose and implement distance measures, where one of them takes into consideration the similarity between the values of the series and their relationship, and another is based on a weighted Euclidean distance taking into account the need to actualize the values that are the most important under certain conditions of the task; to implement a technology to find similar series represented by certain indicators values; to obtain a more resilient solution, to implement a procedure for determining a set of similar series based on the results obtained for each individual distance; the results should be analyzed and the conclusions have to be drawn dealing with practical application of the technology. The following methods were used: statistical analysis methods, methods for calculating distances, and similarity between data series. The following results were obtained: the technology for similar data series detection has been implemented; two distance measures were proposed and described as a part of the technology implemented; a procedure for determining a set of similar rows was implemented that was based on the obtained distances calculation. The scientific novelty of the research under discussion involves: Euclidean weighted distance was described and applied taking into account the actuality of data series values; a new measure of distance has been described and applied that allows both the degree of similarity between the values of the series and their correlation to be taken into account, as well as a technique has been developed for determining similar series from a set of selected distance measures. The practical importance of the developed and implemented technology consists in the following possibilities application to data series of different applied fields: conducting an assessment and identifying some similar series, in particular as an intermediate step in the analysis; in addition, the proposed distance measures improve the quality of identifying similar data series. In our further research, we plan to investigate the possibilities of lengthening the data series and filling in the gaps with values from other series defined as similar ones.
Проблема недостатності інформації суттєво впливає на вибір підходів та методів аналізу рядів даних, а також на якість отримуваних результатів. Зважаючи на таку проблему, автори роботи вважають, що актуальним є питання розробки та аналізу підходів та моделей для подовження рядів даних. Основною задачею даної роботи є описання та реалізація технології подовження рядів даних. В основу реалізації технології закладено використання значень схожих рядів даних в якості ознак для подовження певного ряду даних, представленого тими ж показниками, що й схожі ряди даних. В роботі описано схему визначення схожих рядів даних. Згідно цієї схеми найбільш схожими рядами даних є такі, що мають найменше значення відстані та сильний прямий кореляційний зв’язок, обчислені між потенційно схожим рядом та рядом, для якого буде відбуватися подовження. Для подовження ряду в даній роботі розглядається сім моделей: лінійної множинної регресії; суми зважених значень по групі схожих рядів; середньозважених значеннях по групі схожих рядів, з коригуванням на середнє значення ряду, для якого виконується подовження; випадкового лісу; к-найближчих сусідів; методу опорних векторів; градієнтного бустінгу. Обчислювальний експеримент проведено на рядах, представлених значеннями показників рівнів води, зафіксованими на гідрологічних постах, що розміщені на водних об’єктах басейну річки Дніпро. Для ряду даних посту 79545, розташованого на р. Случ, м. Новоград-Волинський, Житомирської обл., виконується подовження на один рік, тобто довжина ряду збільшується на 365 значень. В результаті визначено, що найбільш схожими є ряди показників постів 79555 та 79694, які мають найменші значення розрахованих відстаней та значення коефіцієнта кореляції більше 0,75. При подовженні ряду визначено, що найкращі результати отримано при використанні двох моделей: суми зважених значень по групі схожих рядів та середньозважених значень по групі схожих рядів, з коригуванням на середнє значення ряду, для якого виконується подовження.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.