Det Kemometriske Rum PCA på NIR data Præcis som for eksemplet med McDonalds data (Dansk Kemi, januar 2008) opstilles en PCA model X = TP For at være lidt mere præcis kan modellen skrives Xc = TaP’a + E a Her betyder Xc de centrerede spektrale data med samme dimensioner, som den oprindelige X matrix, altså en tabel med 231 objekter og 350 variable. Indeks a angiver antal principale komponenter, der er beregnet i modellen. I dette eksempel vil vi nøjes med at inspicere de første to principale komponenter, hvilket giver god mening i forhold til antal kemiske variationskilder i prøverne: tre kemiske komponenter i et blandingsdesign (sum er 100%) giver ideelt anledning til to uafhængige variationskilder. Vi gemmer til en senere klumme, hvorledes det optimale antal komponenter i en PCA model kan bestemmes matematisk. Ta og Pa indeholder henholdsvis scores og loadings for tokomponent modellen, og E a indeholder residualerne; dvs. den del af data, der ikke er beskrevet af modellen. Figur 3. Centrerede NIR spektre farvet efter sukrosekoncentration. Centrering af data Første trin inden PCA modellering er at centrere de spektroskopiske data. Dette gøres for at fokusere på variationerne mellem de enkelte prøver i stedet for det generelle signal niveau. Centrering består simpelthen i at fratrække gennemsnitsreflektansen ved hver bølgelængde, således at reflektansen ved hver bølgelængde/tal summerer til nul. PCA - en lineær & additiv model I figur 4 er princippet i PCA illustreret for tre udvalgte prøver; bemærk at PCA modellen er beregnet på alle 231 prøver. Til venstre i figuren ses de rå spektre for prøve 43 (blå), prøve 107 ▼ Prøve 43 0,8 log(1/ R) Middelspektrum 0,16 1. Loading 0,21 2. Loading 0,01 Residualer 0,6 0,4 0,2 1200 1600 2000 2400 nm 1200 1600 2000 2400 -0,16 1200 1600 2000 2400 −0,21 − = −0,51× −0,02× + −0,01 1200 1600 2000 2400 1200 1600 2000 2400 Prøve 107 0,16 0,8 0,6 0,4 0,2 1200 1600 2000 2400 1200 1600 2000 2400 -0,16 1200 1600 2000 2400 −0,21 0,21 0,01 − = 0,12× +0,08× + −0,01 1200 1600 2000 2400 1200 1600 2000 2400 Prøve 224 0,16 0,8 0,6 0,4 0,2 1200 1600 2000 2400 1200 1600 2000 2400 −0,16 0,21 0,01 − = 0,37× −0,17× −0,21 + −0,01 1200 1600 2000 2400 1200 1600 2000 2400 1200 1600 2000 2400 Figur 4. Illustration af PCA på NIR data. Se tekst for detaljeret beskrivelse. 31 dansk kemi, 89, nr. 2, 2008
Download PDF fil
Se arkivet med udgivelser af Dansk Kemi her
TechMedias mange andre fagblade kan læses her