VIEW ARTICLE DOI: 10.1094/ASBCJ-63-0113
Multivariate Analysis of Routine Beer Analysis Results. Karl J. Siebert (1), Food Science and Technology Department, Cornell University, Geneva, NY 14456. (1) Corresponding author. Phone: +1.315.787.2299; Fax: +1.315.787.2284; E-mail: <kjs3@cornell.edu> J. Am. Soc. Brew. Chem. 63(3):113-120, 2005. Accepted December 20, 2004.
A study of the collective information content of 47 analytical observations applied to at least six samples each of 10 beer brands was carried out. Principal components analysis was used to determine the number of fundamental properties represented in the data set, and thereby, estimate the degree of redundancy. The number of significant principal components (PCs) is seven or eight depending on the criterion used. This indicates that the 47 measurements together only contained information on seven to eight fundamental properties and there was considerable redundancy. The first two PCs contained information that was sufficient to almost completely separate samples of the 10 brands. It was possible to identify 14 measurements from the 47 used that captured most of this information and retained much of the ability to separate brands. Hierarchical cluster analysis applied to a correlation matrix of the measurements showed close relationships among some of the measurements. Several pattern recognition procedures were applied to attempt classification of the samples by brand. This was quite successful with linear discriminant analysis, K-nearest neighbor analysis, and soft independent modeling of class analogy. Keywords: Chemometrics, Cluster analysis, Discriminant analysis, K-nearest neighbor analysis, Principal components analysis, SIMCA
Análisis Multivariante de Resultados Rutinarios de Análisis de Cerveza
Un estudio de contenido de información colectiva de 47 observaciones analíticas aplicadas por lo menos a seis muestras cada una de 10 marcas de cerveza fue realizado. El análisis de componentes principales fue utilizado para determinar el número de características fundamentales representadas en el set de datos, y de tal modo estimar el grado de redundancia. El número de componentes principales (PC) significativos es siete u ocho dependiendo del criterio usado. Esto indica que las 47 mediciones juntas contuvieron solamente información sobre siete a ocho características fundamentales y había considerable redundancia. Los primeras dos PC contuvieron información suficiente para casi totalmente separar las muestras de las 10 marcas. Fue posible identificar 14 mediciones de las 47 usadas cuales capturaron la mayoría de esta información y retuvieron mucha de la habilidad para separar marcas. El análisis de agrupación jerárquico aplicado a una matriz de correlación de las mediciones demostró buenas relaciones entre algunas de las mediciones. Varios procedimientos de reconocimiento de patrón fueron aplicados para intentar la clasificación de muestras por marca. Esto fue muy exitoso con el análisis discriminante linear, el análisis K vecino mas cercano, y la analogía de clase leve modelar independiente. Palabras claves: Análisis de agrupación, Análisis de componentes principales, Análisis discriminante, Análisis K vecino mas cercano, Métricas químicas, SIMCA