Recebido em 16/9/09; aceito em 3/4/10; publicado na web em 20/7/10 PERIODIC CLASSIFICATION: A DIDACTIC EXAMPLE TO TEACH PRINCIPAL COMPONENT ANALYSIS. A dataset of chemical properties of the elements is used herein to introduce principal components analysis (PCA). The focus in this article is to verify the classification of the elements within the periodic table. The reclassification of the semimetals as metals or nonmetals emerges naturally from PCA and agrees with the current SBQ/IUPAC periodic table. Dataset construction, basic preprocessing, loading and score plots, and interpretation have been emphasized. This activity can be carried out even when students with distinct levels of formation are together in the same learning environment.Keywords: principal components analysis; semimetals; chemical properties of the elements. INTRODUÇÃOA análise de componentes principais (PCA) encontra-se certamente entre as mais importantes ferramentas da análise multivariada, inclusive por constituir a base onde se fundamentam a maioria dos outros métodos multivariados de análise de dados. Como uma ferramenta de análise exploratória a PCA permite revelar a existência ou não de amostras anômalas, de relações entre as variáveis medidas e de relações ou agrupamentos entre amostras. Além disto, métodos eficientes de classificação, como a modelagem independente para analogia de classes (SIMCA) e de calibração, como a regressão em componentes principais (PCR) ou a regressão por mínimos quadrados parciais (PLS), são derivados da PCA.No contexto da aplicação em problemas químicos estes métodos estatísticos são denominados métodos quimiométricos. A importância da quimiometria para os laboratórios modernos de química cresceu com a capacidade dos instrumentos analíticos de produzirem conjuntos de dados cada vez maiores e mais complexos e com a evolução dos computadores que permitem tratá-los agilmente. Assim, aplicações de PCA em problemas de química são cada vez mais comuns e podem ser encontradas facilmente na literatura. 1-10Para o aprendizado desta ferramenta estão disponíveis vários livros 11,12 e artigos, 13-15 tanto para quem pretende apenas usar a PCA como para quem pretende se aprofundar na álgebra e nos algoritmos empregados. Um problema recorrente que não pode ser negligenciado é o risco que os usuários correm de perder o sentido químico de seus estudos, muitas vezes preocupados apenas com as tabelas e os gráficos de excelente qualidade produzidos pelos programas. Este risco é minimizado quando o sistema estudado é bem conhecido e as interpretações dos resultados da PCA são feitas fundamentadas neste conhecimento prévio.Nos cursos de quimiometria comumente enfrentam-se dificuldades para encontrar uma aplicação para a análise de componentes principais que seja suficientemente didática para um primeiro contato. Aplicações envolvendo os mais diversos sistemas 1-10 podem ser empregadas, mas estes sempre serão dominados por alguns alunos e não por outros. Assim, um banco de dados oriundo de espectroscopia é um bom exemplo para um ...
This article describes the classification of biodiesel samples using NIR spectroscopy and chemometric techniques. A total of 108 spectra of biodiesel samples were taken (being three samples each of four types of oil, cottonseed, sunflower, soybean and canola), from nine manufacturers. The measurements for each of the three samples were in the spectral region between 12,500 and 4000 cm(-1). The data were preprocessed by selecting a spectral range of 5000-4500 cm(-1), and then a Savitzky-Golay second-order polynomial was used with 21 data points to obtain second derivative spectra. Characterization of the biodiesel was done using chemometric models based on hierarchical cluster analysis (HCA), principal component analysis (PCA) and soft independent modeling of class analogy (SIMCA) elaborated for each group of biodiesel samples (cotton, sunflower, soybean and canola). For the HCA and PCA, the formation of clusters for each group of biodiesel was observed, and SIMCA models were built using 18 spectral measurements for each type of biodiesel (training set), and nine spectral measurements to construct a classification set (except for the canola oil which used eight spectra). The SIMCA classifications obtained 100% accurate identifications. Using this strategy, it was feasible to classify biodiesel quickly and nondestructively without the need for various analytical determinations.
This work is concerned of evaluate the use of visible and near-infrared (NIR) range, separately and combined, to determine the biodiesel content in biodiesel/diesel blends using Multiple Linear Regression (MLR) and variable selection by Successive Projections Algorithm (SPA). Full spectrum models employing Partial Least Squares (PLS) and variables selection by Stepwise (SW) regression coupled with Multiple Linear Regression (MLR) and PLS models also with variable selection by Jack-Knife (Jk) were compared the proposed methodology. Several preprocessing were evaluated, being chosen derivative Savitzky-Golay with second-order polynomial and 17-point window for NIR and visible-NIR range, with offset correction. A total of 100 blends with biodiesel content between 5 and 50% (v/v) prepared starting from ten sample of biodiesel. In the NIR and visible region the best model was the SPA-MLR using only two and eight wavelengths with RMSEP of 0.6439% (v/v) and 0.5741 respectively, while in the visible-NIR region the best model was the SW-MLR using five wavelengths and RMSEP of 0.9533% (v/v). Results indicate that both spectral ranges evaluated showed potential for developing a rapid and nondestructive method to quantify biodiesel in blends with mineral diesel. Finally, one can still mention that the improvement in terms of prediction error obtained with the procedure for variables selection was significant.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.