Abstract:In the pursuit of portable, efficient and effective sleep staging systems, researchers have been testing a massive number of combinations of EEG features and classifiers. State of the art sleep classification ensembles achieve accuracy in the order of 90%. However, there is presently no consensus regarding the best set of features for identifying sleep stages with a single EEG channel, leading researchers to modify the feature selection according to the number of classification stages. This paper introduces a reduced set of frequency-domain features capable of yielding high classification accuracy (90.9%, 91.8%, 92.4%, 94.3% and 97.1%) for all 6-to 2-state sleep stages. The proposed system uses fast Fourier transform (FFT) to convert data from Pz-Oz EEG channel into the frequency domain. Afterwards, eight statistical features are extracted from specific frequency ranges associated to brain rhythms, feeding a random forest classifier. Keywords: sleep stage classification -random forest -FFT -statistical momentsResumo: Na busca por sistemas portáveis, eficientes e efetivos para classificação de sono, pesquisadores têm testado um grande número de combinações de atributos de sinais EEG e classificadores. O estado da arte dos aplicativos de classificação para estágios de sono atinge taxas de acerto na ordem de 90%. Contudo, não existe um consenso em relação ao melhor grupo de atributos para identificar estágios de sono em sinais EEG de umúnico canal, levando pesquisadores a modificar a seleção dos atributos de acordo com o número de estágios a serem classificados. Este trabalho apresenta um conjunto reduzido de atributos, capaz de produzir uma classificação com taxas elevadas de acerto (90.9%, 91.8%, 92.4%, 94.3% and 97.1%) para todos os agrupamentos de estágios de sono (de 6 a 2 estágios). O sistema proposto utiliza a transformada rápida de Fourier (FFT) para converter os dados do canal de EEG Pz-Oz para o domínio da frequência. Posteriormente, oito atributos estatísticos são extraídos de faixas de frequência específicas associadas a ritmos cerebrais, alimentando um classificador do tipo floresta aleatória. Palavras-Chave: classificação de estágios de sono -floresta aleatória -FFT -momentos estatísticos
RESUMONeste trabalho estudam-se o algoritmo k-means, suas diferentes variações e sua associação a transformadas de Fourier e wavelets para a classificação de sinais eletroencefalogramas (EEG). O objetivo central dessa classificação é identificar a presença de padrões associados à sonolência em diferentes épocas (intervalos de análise dos sinais EEG).O algoritmo k-means [6] é amplamente utilizado na identificaçã o de subconjuntos (clusters) com comportamentos similares dentro de um conjunto {p i /p i ∈ R d , i = 1, 2, ..., n}, com uma quantidade grande (n) de dados. Na verdade, estes subconjuntos (clusters) são formados de acordo com k valores médios arbitrados inicialmente e essas similaridades são obtidas a partir do cálculo das distâncias entre os elementos do conjunto e os k valores médios que representam possíveis centróides para os k clusters.Uma vez obtida uma configuração para os clusters, os k valores médios são então recalculados, dando início a um processo iterativo no qual as novas distâncias entre os elementos do conjunto inicial e os novos k valores médios de referência são obtidos, permitindo o ajuste dos elementos em cada classe.A Figura 1 apresenta 4 iterações do algoritmo k-means, considerando o cálculo via distâcia Euclidiana, sendo o conjunto inicial formado por 3000 pontos aleatoriamente gerados no [−4, 4]×[−4, 4] ∈ R 2 . Em cada uma das iterações apresentadas na Figura 1 é indicado o novo valor do centróide, recalculado através dos elementos associados a cada um dos clusters, a cada iteração. Diferentes variações para o algoritmo são obtidas cada vez que diferentes métricas são consideradas, como por exemplo a distância de Minkowski considerada em [3]. Além disso, a escolha para o número de clusters k também influencia na dinâmica do algoritmo, permitindo diferentes agrupamentos ao final do processo iterativo.Figura 1: Quatro primeiras iterações do algoritmo k-means, utilizando distância Euclidiana, quando aplicado a uma nuvem de 3000 pontos, p i ∈ R 2 , distribuídos em 3 clusters (k = 3).Apesar do algoritmo k-means ser amplamente utilizado em diversos tipos de dados [1,2], ele pode produzir resultados não satisfatórios, quando aplicado a séries temporais [8]. Este baixo desempenho se dá principalmente devido a grande dimensão d de cada elemento do conjunto das séries a serem classificadas, possível alta correlação entre os dados e a grande quantidade de ruído geralmente presente em séries temporais obtidas através de medições associadas a problemas realistas .Uma maneira de se poder contornar essas situações é aplicar algum tipo de transformada aos dados iniciais, selecionar uma quantidade menor dos coeficientes dessas novas representações e então aplicar o
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.