V encyklopedii Allmultimedia.cz byl aktivován špičkový grafický skin Foreground.
Foreground plně podporuje – RWD, HTML 5.0, Super Galerii a YouTube 2.0 !

Analýza hlavních komponent

Z Multimediaexpo.cz

Analýza hlavních komponent (Principal Component Analysis, PCA) je v teorii signálu transformace sloužící k dekorelaci dat. Často se používá ke snížení dimenze dat s co nejmenší ztrátou informace.[1] PCA je možno najít také jako Karhunen-Loèveho transformaci, Hotellingovu transformaci, nebo jako singulární rozklad (SVD; v lineární algebře).

Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné souřadné soustavy:

\(Y = X P\)

kde X je centrovaná matice n x d se vstupními d-rozměrnými daty v n řádcích, Y obdobná matice výstupních dat, P je d x d matice vlastních vektorů kovarianční matice \(C_X\) splňující vztah \(C_X = P \Lambda P^T\), kde \(\Lambda\) je diagonální matice obsahující na diagonále vlastní čísla \(C_X\) a matice vlastních vektorů \(P\) je ortonormální, tj. \(P^T P = I_d\), kde \(I_d\) je jednotková matice dimenze \(d\).

Vlastní vektory (sloupce matice P) tvoří onu novou souřadnou soustavu. Centrování matice X dosáhneme odečtením příslušného výběrového průměru od každého sloupce.

Obsah

Odvození

Matice Y je zřejmě také centrovaná, tj. aritmetický průměr každého jejího sloupce je 0.[2]

Spočítáme, jak musí vypadat kovarianční matice nových dat Y:

\(C_Y = E(Y^T Y) = E[(X P)^T (XP)] = E (P^T X^T X P) = P^T E(X^T X) P = P^T C_X P = P^T P \Lambda P^T P = \Lambda.\)

Vzhledem k tomu, že matice \(\Lambda\) je diagonální,

\(C_Y = \Lambda = \left ( \begin{matrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_d \\ \end{matrix}\right ), \)

vidíme, že sloupce matice Y jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.

Použití

Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel \(\lambda_i\), budeme dostávat složky v Y setříděné podle rozptylu. Pokud chceme snížit dimenzi dat, stačí z Y vzít jen tolik prvních složek kolik uznáme za vhodné. Vybírání komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které tímto postupem zahodíme.

Rozpoznávání

V rozpoznávání slouží PCA jako jedna z tzv. Feature Extraction metod (extrakce rysů). Používají ji například kriminalisté pro rozpoznávání obličejů.

Komprese

Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké korelace mezi jednotlivými spektrálními kanály a převede obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.

Související články

Reference

  1. Martin Sebera - FSpS MU - Vícerozměrné statistické metody. www.fsps.muni.cz [online].  [cit. 2022-01-17]. Dostupné online.  
  2. Archivovaná kopie.  [cit. 2022-01-17]. Dostupné online.
     
  3. dimensionality reduction - Relationship between SVD and PCA. How to use SVD to perform PCA?. Cross Validated [online].  [cit. 2022-01-17]. Dostupné online.  

Externí odkazy


Commons nabízí fotografie, obrázky a videa k tématu
Analýza hlavních komponent