Neste artigo, é proposta uma nova técnica para transferência de calibração, que combina o Algoritmo das Projeções Sucessivas (APS) para seleção de variáveis robustas com a técnica de sub-amostragem e agregação de modelos conhecida como subagging. A técnica proposta tem por objetivo construir modelos de Regressão Linear Múltipla (RLM) que sejam robustos com respeito a diferenças na resposta instrumental de dois espectrômetros (primário e secundário). Para isso, um pequeno conjunto de amostras de transferência, com espectros adquiridos no instrumento secundário, é empregado para guiar o procedimento de seleção de variáveis. A eficiência da técnica proposta é demonstrada em um estudo de caso envolvendo a determinação por FT-IR da massa específica e duas temperaturas de destilação (T10%, T90%) em amostras de gasolina e a determinação por NIR de umidade em amostras de milho. Em termos do erro quadrático médio de predição no espectrômetro secundário, os modelos RLM gerados pela abordagem APS-subagging forneceram resultados melhores que os obtidos por Mínimos Quadrados Parciais empregando Padronização Direta por Partes. Em particular, o uso de subagging resultou em uma redução mais sistemática do erro de predição com a inclusão progressiva de amostras de transferência. This paper proposes a new technique for calibration transfer, which combines the Successive Projections Algorithm (SPA) for robust variable selection with the subsampling and model aggregation technique known as subagging. The proposed technique is aimed at building Multiple Linear Regression (MLR) models that are robust with respect to differences in the instrumental response of two spectrometers (primary and secondary). For this purpose, a small set of transfer samples with spectra acquired at the secondary instrument is employed to guide the variable selection procedure. The efficiency of the proposed technique is demonstrated in a case study concerning the FT-IR determination of specific mass and two distillation temperatures (T10%, T90%) for gasoline samples and the NIR determination of moisture in corn samples. In terms of the root-mean-square error of prediction at the secondary spectrometer, the MLR models obtained according to the SPA-subagging approach provided better results in comparison with Partial Least Squares employing Piecewise Direct Standardization. In particular, the use of subagging resulted in a more systematic reduction in the prediction error with the progressive inclusion of transfer samples.Keywords: multivariate calibration, calibration transfer, variable selection, successive projections algorithm, subagging
IntroductionIn a wide sense, the term Calibration Transfer concerns a body of methods aimed at compensating for changes in experimental conditions that would compromise the prediction accuracy and reliability of a multivariate model. Such changes may refer to physical/ chemical characteristics of the sample (such as viscosity, granularity, surface texture, and presence of interferent species), environmental conditions (te...