2021
DOI: 10.1190/int-2021-0008.1
|View full text |Cite
|
Sign up to set email alerts
|

An in-depth analysis of logarithmic data transformation and per-class normalization in machine learning: Application to unsupervised classification of a turbidite system in the Canterbury Basin, New Zealand, and supervised classification of salt in the Eugene Island minibasin, Gulf of Mexico

Abstract: In a machine learning workflow, data normalization is a crucial step that compensates for the large variation in data ranges and averages associated with different types of input measured with different units. However, most machine learning implementations do not provide data normalization beyond the z-score algorithm which subtracts the mean from the distribution and then scales the result by dividing by the standard deviation. Although z-score converts data with Gaussian behavior to have the same shape and s… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1

Citation Types

0
1
0
2

Year Published

2022
2022
2024
2024

Publication Types

Select...
5
1
1

Relationship

0
7

Authors

Journals

citations
Cited by 10 publications
(3 citation statements)
references
References 32 publications
0
1
0
2
Order By: Relevance
“…En la etapa de selección de atributos, se llevó a cabo un análisis exhaustivo para identificar los atributos más relevantes que influyen en la predicción de la productividad de los pozos. Para ello, se utilizó una matriz de correlación para evaluar la relación entre diferentes variables y detectar aquellas con alta colinealidad, es decir, aquellas que están altamente correlacionadas entre sí (Ha et al, 2021).…”
Section: Selección De Predictoresunclassified
See 1 more Smart Citation
“…En la etapa de selección de atributos, se llevó a cabo un análisis exhaustivo para identificar los atributos más relevantes que influyen en la predicción de la productividad de los pozos. Para ello, se utilizó una matriz de correlación para evaluar la relación entre diferentes variables y detectar aquellas con alta colinealidad, es decir, aquellas que están altamente correlacionadas entre sí (Ha et al, 2021).…”
Section: Selección De Predictoresunclassified
“…Esta transformación fue realizada con el objetivo de reducir la variabilidad de los datos y mejorar la normalidad de la distribución, lo que facilita la interpretación de los resultados y mejora el desempeño de ciertos modelos estadísticos (Ha et al, 2021).…”
Section: Transformación Logarítmicaunclassified
“…Finally, we computed the logarithm of the whole dataset obtained so far, which can enhance subtle details in the classification step [58]. Since the domain of logarithms contains only positive real numbers, we calibrated the value of each feature before computing its logarithm.…”
Section: Log Transformmentioning
confidence: 99%