Se desarrolla la teoría necesaria para realizar el Análisis de Datos en presencia de semiproductos escalares, extendiendo los conceptos clásicos de productos escalares usualmente empleados. Para ello, retomamos las definiciones algebraicas básicas de las formas bilineales no degeneradas y vamos desarrollando todas las herramientas algebraicas necesarias. Se estudian los operadores más importantes en el espacio de individuos, como el operados V M y el operador MV . También se estudia el caso del semiproducto escalar de pesos en el espacio de variables, que en el caso de pesos nulos corresponde a la introducción de individuos suplementarios. Finalmente, llegamos a los conceptos usuales del Análisis en Componentes Principales.Palabras clave: semiproductos escalares, formas bilineales no degeneradas, semimétricas, operador de proyección ortogonal, análisis en componentes principales.
AbstractWe develop the theory necessary for Data Analysis with inner semiproducts, extending tha classical concepts of inner products usually employed. For this, we use the basic algebraic definitions of non degenerated bilinear forms and develop all the algebraic tools needed. We study the most important operators on the individual space, such as the V M and the MV operators. We also study the case of the inner semiproduct of weights in the variable space, which corresponds to the introduction of supplementary individuals in the case of null weights. Finally, we arrive to the usual concepts of Principal Component Analysis.Keywords: inner semiproducts, non degenerated bilinear forms, semimetrics, orthogonal projection operator, principal component analysis.
IntroducciónEm algunos métodos de Análisis de Datos, se encuentran dificultades para definir una distancia en el espacio de los individuos. Este es el caso en los análisis canónicos cuando las variables están muy correlacionadas, pues la matriz de covarianzas es entonces numéricamente no invertible, y por ello es difícil calcular la matriz de una distancia de Mahalanobis. Hemos encontrado dificultades similares para definir una distancia entre conjunciones de modalidades esplicativas [12,14,13]. Hemos por lo tanto estudiado, en una primera parte, el uso de semiproductos escalares en Análisis de Datos. En una segunda parte, estudiamos algunas propiedades -en este contexto de semiproductos escalaresde dos operadoresútiles en Análisis de Datos. Finalmente, abordamos la definición de algunos conceptos clásicos del Análisis de Datos, como los relacionados con la dispersión de una nube y el Análisis en Componentes Principales. Hacemos notar que estos temas los hemos abordado en otras publicaciones de circulación restringida [11,14,13].
Algunos resultados sobre los semiproductos escalaresSean L un espacio vectorial de dimensión finita, L * su espacio dual, H un subespacio de L y T una forma bilineal simétrica sobre L. Se denota con la misma letra T la aplicación lineal de L en L * associada a T . T /H es la restricción de la aplicación T a H.
Proposición 1 Si T es una forma bilinea...