2023
DOI: 10.21203/rs.3.rs-3356633/v1
|View full text |Cite
Preprint
|
Sign up to set email alerts
|

A Benchmark of Existing Tools for Outlier Detection and Cleaning in Trajectories

Mariana Machado Garcez Duarte,
Mahmoud Sakr

Abstract: Outlier detection and cleaning is an essential step in data preprocessing to ensure the integrity and validity of data analyses. This paper focuses on outlier points within a individual trajectories, i.e., points that deviate significantly inside a single trajectory. We benchmark ten open-source libraries to comprehensively evaluate available tools, comparing their efficiency and accuracy in identifying and cleaning outliers. This benchmarking considers the libraries as they are offered to end users, with real… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1

Citation Types

0
0
0
3

Year Published

2023
2023
2024
2024

Publication Types

Select...
1
1

Relationship

0
2

Authors

Journals

citations
Cited by 2 publications
(3 citation statements)
references
References 33 publications
0
0
0
3
Order By: Relevance
“…No trabalho [Duarte and Sakr 2023], é apresentado um método para gerar ground-truth, ou seja, um método para gerar um conjunto de targets ou labels que posteriormente podem ser usados para treinar e testar um ou mais modelos, utilizando validac ¸ão cruzada. Especificamente, esse método serve para gerar labels de 'outliers' ou 'ruído' em quatro conjuntos de dados distintos, que serão utilizados para avaliar os métodos de detecc ¸ão de outliers, e limpeza de trajetória, implementados em sete bibliotecas: (i)Movetk [Custers et al 2021]; (ii) Moving Pandas [Graser and Dragaschnig 2020]; (iii) Scikit-mobility [Pappalardo et al 2022]; (iv) Ptrail [Haidri et al 2021]; (v) Pymove [Sanches 2019, Bráz 2020]; (vi) Argosfilter [Freitas and Freitas 2022]; (vii) Stmove [Seidel et al 2019].…”
Section: Outlier Detection and Cleaning In Trajectories: A Benchmark ...unclassified
See 2 more Smart Citations
“…No trabalho [Duarte and Sakr 2023], é apresentado um método para gerar ground-truth, ou seja, um método para gerar um conjunto de targets ou labels que posteriormente podem ser usados para treinar e testar um ou mais modelos, utilizando validac ¸ão cruzada. Especificamente, esse método serve para gerar labels de 'outliers' ou 'ruído' em quatro conjuntos de dados distintos, que serão utilizados para avaliar os métodos de detecc ¸ão de outliers, e limpeza de trajetória, implementados em sete bibliotecas: (i)Movetk [Custers et al 2021]; (ii) Moving Pandas [Graser and Dragaschnig 2020]; (iii) Scikit-mobility [Pappalardo et al 2022]; (iv) Ptrail [Haidri et al 2021]; (v) Pymove [Sanches 2019, Bráz 2020]; (vi) Argosfilter [Freitas and Freitas 2022]; (vii) Stmove [Seidel et al 2019].…”
Section: Outlier Detection and Cleaning In Trajectories: A Benchmark ...unclassified
“…Usando um conjunto de dados gerados por meio desse framework, foram implementados e comparados alguns dos métodos mais utilizados descritos na literatura. Os resultados confirmaram trabalhos anteriores, como [Duarte and Sakr 2023], e introduziram novos algoritmos a comparac ¸ão, SGC, MSN e DFF. Contudo, é importante destacar também que pontos de melhoria foram identificados, como a realizac ¸ão de novas análises que considerem métodos diferentes de aquisic ¸ão de dados e seus impactos.…”
Section: Conclusãounclassified
See 1 more Smart Citation