Det Kemometriske Rum 480 460 440 420 400 380 360 340 Skulderbredde (mm) uopdaget er ikke bare teoretisk. Denne sidste konklusion har selv den amerikanske Food and Drug Administration definitivt erkendt ved i deres nylige Process Analytical Technology (PAT) vejledning [2] for den farmaceutiske industri at skrive ”Traditional one-factor-at-a-time experiments do not effectively address interactions between products and process variables”. PAT vil blive emnet for en fremtidig artikel i Det Kemometriske Rum. Latente variable metoder Lårbenets længde (mm) 400 380 360 340 320 300 Latin America (Eur.-neg.) Ovennævnte eksempel viser, at der findes information latent (skjult) i multivariable data og mange af de metoder, der anvendes i kemometrien, kaldes derfor også latente variable metoder. Vi har i eksemplet betragtet to variable (lårbenslængde og skulderbredde) målt på tyve prøver (mennesker). Grundlæggende set handler kemometri om 2D datateknologi dvs. analyse af multiple målinger på et sæt af sammenlignelige objekter. Men hvis vi nu i stedet måler 1000 variable per prøve, f.eks. et nærinfrarødt spektrum, er det ikke optimalt at plotte variabel 1 mod 2, variabel 1 mod 3, variabel 1 mod 4 osv. Det vil give en uoverstigelig mængde figurer og ikke bidrage til at give et overblik over sammenhængen i data. Til det formål er metoden Principal Component Analyse (PCA) velegnet og i næste klumme vil vi beskrive princippet bag PCA. Latin America (Indian) West Africa South-eastern Africa Near East North India South India Korea/Japan South-east Asia North America North Africa North Asia South-Eastern Europe Northern Europe Eastern Europe Iberian Peninsula South China Central Europe Australia France Figur 1. Lårbenets gennemsnitlige længde og tilsvarende skulderbredde (begge i millimeter) for mænd fra tyve forskellige lokaliteter og tre racer. Udfordring En udfordring til læserne er følgende: i tabel 1 er angivet indholdet af næringsstoffer samt energi i forskellige McDonalds produkter (data fra 2003). Hvorledes kan man (f.eks. grafisk) placere eller karakterisere de forskellige produkter i forhold til hinanden baseret på indholdet af både fedt, protein, kulhydrat, mættet fedt og energi? 1. Lee S. and Bro R., Regional Differences in World Human Body Dimensions: The Multi-Way Analysis Approach, Theoretical Issues in Ergonomics Science, in press. 2. Guidance for Industry. PAT – A Framework for Innovative Pharmaceutical Development, Manufacturing, and Quality Assurance. U.S. Department of Health and Human Services, Food and Drug Administration, September 2004 (http://www.fda.gov/Cder/guidance/6419fnl.htm). ligt at skelne perfekt mellem racerne baseret på lårbenets længde alene. Betragter vi skulderbredden på samme måde er min-max værdierne 420-430 mm, 380-430 mm og 440-460 mm for henholdsvis afrikansk, asiatisk og kaukasisk race. Kaukaserne er generelt mere bredskuldrede, mens der er interval overlap for afrikanere og asiater. Heller ikke denne måling giver alene mulighed for at gruppere racerne. 380 South-eastern Africa North Africa Lårbenets længde (mm) 370 West Africa Northern Europe 360 Central Europe Australia North America France 350 Korea/Japan Near East 340 North India South China 330 South-east Asia South India 380 390 400 410 420 430 Latin America (Eur.-Neg.) Eastern Europe South-Eastern Europe Iberian Peninsula North Asia Klummeskriverne: - Lars Nørgaard (LN) er ph.d. og lektor i eksplorativ dataanalyse & kemometri, Formand for Dansk Selskab for Kemometri - Søren Balling Engelsen (SBE) er ph.d., professor og leder af faggruppen for Kvalitet & Teknologi - Rasmus Bro (RB) er ph.d. og professor i kemometri og proces analytisk teknologi Klummeskriverne er alle uddannet som civilingeniør i kemi fra Danmarks Tekniske Universitet og er ansat på Det Biovidenskabelige Fakultet, Københavns Universitet. De har mere end 10 års undervisningserfaring i kemometri og kvantitativ spektroskopi med over 2000 studerende/deltagere. Deres forskningsområde er kemometri, kvantitativ spektroskopi, proces analytisk teknologi, metabolomics, kvalitetskontrol, molekylær funktionalitet og sundhedseffekter af plantebaserede fødevarer. Dette har ledt til en omfattende videnskabelig produktion, herunder to bøger om kemometri, udvikling af kemometrisk software og tæt industriel kontakt. Se mere på www.models.life.ku.dk og www.odin.life.ku.dk. Latin America (Indian) 440 450 460 470 Skulderbredde (mm) Figur 2. Lårbenets længde afbildet mod skulderbredde for data vist i figur 1. Ved at plotte lårbenets længde mod skulderbredden fås figur 2. I denne er de tre racer adskilte baseret på information fra begge målinger. Det er således kombinationen af to målinger, der muliggør denne adskillelse. Der opstår ny information, som ikke er tilgængelig ved at betragte hver variabel for sig. Det er altså utilstrækkeligt og uvidenskabeligt kun at analysere én variabel ad gangen! Sandsynligheden for at værdifuld information forbliver 33 dansk kemi, 88, nr. 12, 2007
Download PDF fil
Se arkivet med udgivelser af Dansk Kemi her
TechMedias mange andre fagblade kan læses her