Medián
Z Multimediaexpo.cz
m (1 revizi) |
(+ Masivní vylepšení) |
||
Řádka 1: | Řádka 1: | ||
- | + | '''Medián''' (označován Me nebo <math>\tilde x</math>) je hodnota, jež dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny. Ve [[statistika|statistice]] patří mezi [[střední hodnota|míry centrální tendence]]. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Medián má smysl definovat | |
+ | pouze pro jednorozměrnou reálnou veličinu, jako je např. výška, hmotnost, výše mzdy atd. | ||
+ | Pro nalezení mediánu daného souboru stačí hodnoty seřadit podle velikosti a vzít hodnotu, která se nalézá uprostřed seznamu. Pokud má soubor sudý počet prvků, obvykle se za medián označuje [[aritmetický průměr]] hodnot na místech ''n''/2 a ''n''/2+1. | ||
+ | |||
+ | Obecně se za medián dá označit více čísel. V už zmíněném případě sudého počtu prvků neexistuje jedinečná střední hodnota. Platí však, že polovina hodnot je menší nebo rovna a polovina prvků je větší nebo rovna, ať už se za medián zvolí libovolné z obou prostředních čísel. Totéž dokonce platí i pro libovolné číslo, jehož velikost leží mezi těmito dvěma čísly. Proto se jako medián takového souboru může vzít libovolné z obou prostředních čísel i libovolné z čísel mezi nimi. | ||
+ | |||
+ | == Výhody a nevýhody mediánu == | ||
+ | Základní výhodou mediánu jako statistického ukazatele je fakt, že není ovlivněn [[Extrém funkce|extrémními]] hodnotami. Proto se často používá v případě šikmých rozdělení, u kterých aritmetický průměr dává obvykle nevhodné výsledky. Např. u souboru { 1, 2, 2, 3, 9 } je medián (stejně jako [[modus]]) roven dvěma, což je zřetelně vhodnější míra polohy než [[aritmetický průměr]], který je zde roven 3,4. | ||
+ | |||
+ | Další výhodou je, že medián lze definovat na každém souboru uspořádaném relací „menší nebo rovno“, i když se nejedná o soubor čísel. Například medián souboru {bez základního vzdělání, absolvent ZŠ, vyučen, vyučen s maturitou, vysokoškolák} je roven hodnotě „vyučen“, pokud kategorie vzdělání považujeme za seřazené podle náročnosti školy. | ||
+ | |||
+ | Nevýhodné je obvykle použití mediánu u souborů, ve kterých sledovaný znak nabývá jen dvou možných hodnot. Tam se medián chová stejně jako modus: je hrubým měřítkem vlastností rozdělení a v případě, že obě kategorie jsou zastoupeny zhruba stejně, je velmi nestabilní. | ||
+ | |||
+ | == Teoretické vlastnosti == | ||
+ | V případě [[rozdělení pravděpodobnosti]] je mediánem číslo ''m'', které splňuje rovnost ''P''(''X'' ≤ ''m'') ≥ 0,5 a ''P''(''X'' ≥ ''m'') ≥ 0,5. V případě spojité reálné jednorozměrné náhodné veličiny s [[hustota pravděpodobnosti|hustotou pravděpodobnosti]] ''f'' pro medián platí: | ||
+ | |||
+ | : <math>\int_{-\infty}^{m} f(x) \, \mathrm{d}x = 0{,}5</math>. | ||
+ | |||
+ | Medián nemusí být výše uvedenou rovností určen jednoznačně. | ||
+ | |||
+ | Medián je také odhad střední hodnoty, který minimalizuje absolutní odchylku. U předchozího příkladu je tato chyba při použití mediánu rovna 1 + 0 + 0 + 1 + 7 = 9, zatímco při použití aritmetického průměru by byla rovna 2,4 + 1,4 + 1,4 + 0,4 + 5,6 = 11,2. To znamená, že číslo ''m'', které minimalizuje výraz E(|''X'' − ''m''|), je mediánem rozdělení náhodné veličiny ''X''. | ||
+ | |||
+ | Pro rozdělení náhodné veličiny, které mají konečnou střední hodnotu a medián platí, že absolutní hodnota rozdílu mezi mediánem a aritmetickým průměrem daného rozdělení je menší nebo roven jedné [[směrodatná odchylka|směrodatné odchylce]]. | ||
+ | |||
+ | == Medián jako kvantil == | ||
+ | Medián je nejspíš nejpoužívanější [[kvantil]]. Kromě mediánu se velmi často používají ''kvartily'' (soubor se dělí na čtyři části), ''decily'' (na deset částí) a ''percentily'' (na sto částí). | ||
+ | |||
+ | == Související články == | ||
+ | * [[Aritmetický průměr]] | ||
+ | * [[Geometrický průměr]] | ||
+ | * [[Modus]] | ||
+ | * [[Kvantil]] | ||
+ | * [[Mezikvartilové rozpětí]] | ||
+ | |||
+ | |||
+ | {{Článek z Wikipedie}} | ||
[[Kategorie:Statistika]] | [[Kategorie:Statistika]] |
Verze z 8. 8. 2014, 07:33
Medián (označován Me nebo <math>\tilde x</math>) je hodnota, jež dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Medián má smysl definovat pouze pro jednorozměrnou reálnou veličinu, jako je např. výška, hmotnost, výše mzdy atd.
Pro nalezení mediánu daného souboru stačí hodnoty seřadit podle velikosti a vzít hodnotu, která se nalézá uprostřed seznamu. Pokud má soubor sudý počet prvků, obvykle se za medián označuje aritmetický průměr hodnot na místech n/2 a n/2+1.
Obecně se za medián dá označit více čísel. V už zmíněném případě sudého počtu prvků neexistuje jedinečná střední hodnota. Platí však, že polovina hodnot je menší nebo rovna a polovina prvků je větší nebo rovna, ať už se za medián zvolí libovolné z obou prostředních čísel. Totéž dokonce platí i pro libovolné číslo, jehož velikost leží mezi těmito dvěma čísly. Proto se jako medián takového souboru může vzít libovolné z obou prostředních čísel i libovolné z čísel mezi nimi.
Obsah |
Výhody a nevýhody mediánu
Základní výhodou mediánu jako statistického ukazatele je fakt, že není ovlivněn extrémními hodnotami. Proto se často používá v případě šikmých rozdělení, u kterých aritmetický průměr dává obvykle nevhodné výsledky. Např. u souboru { 1, 2, 2, 3, 9 } je medián (stejně jako modus) roven dvěma, což je zřetelně vhodnější míra polohy než aritmetický průměr, který je zde roven 3,4.
Další výhodou je, že medián lze definovat na každém souboru uspořádaném relací „menší nebo rovno“, i když se nejedná o soubor čísel. Například medián souboru {bez základního vzdělání, absolvent ZŠ, vyučen, vyučen s maturitou, vysokoškolák} je roven hodnotě „vyučen“, pokud kategorie vzdělání považujeme za seřazené podle náročnosti školy.
Nevýhodné je obvykle použití mediánu u souborů, ve kterých sledovaný znak nabývá jen dvou možných hodnot. Tam se medián chová stejně jako modus: je hrubým měřítkem vlastností rozdělení a v případě, že obě kategorie jsou zastoupeny zhruba stejně, je velmi nestabilní.
Teoretické vlastnosti
V případě rozdělení pravděpodobnosti je mediánem číslo m, které splňuje rovnost P(X ≤ m) ≥ 0,5 a P(X ≥ m) ≥ 0,5. V případě spojité reálné jednorozměrné náhodné veličiny s hustotou pravděpodobnosti f pro medián platí:
- <math>\int_{-\infty}^{m} f(x) \, \mathrm{d}x = 0{,}5</math>.
Medián nemusí být výše uvedenou rovností určen jednoznačně.
Medián je také odhad střední hodnoty, který minimalizuje absolutní odchylku. U předchozího příkladu je tato chyba při použití mediánu rovna 1 + 0 + 0 + 1 + 7 = 9, zatímco při použití aritmetického průměru by byla rovna 2,4 + 1,4 + 1,4 + 0,4 + 5,6 = 11,2. To znamená, že číslo m, které minimalizuje výraz E(|X − m|), je mediánem rozdělení náhodné veličiny X.
Pro rozdělení náhodné veličiny, které mají konečnou střední hodnotu a medián platí, že absolutní hodnota rozdílu mezi mediánem a aritmetickým průměrem daného rozdělení je menší nebo roven jedné směrodatné odchylce.
Medián jako kvantil
Medián je nejspíš nejpoužívanější kvantil. Kromě mediánu se velmi často používají kvartily (soubor se dělí na čtyři části), decily (na deset částí) a percentily (na sto částí).
Související články
Náklady na energie a provoz naší encyklopedie prudce vzrostly. Potřebujeme vaši podporu... Kolik ?? To je na Vás. Náš FIO účet — 2500575897 / 2010 |
---|
Informace o článku.
Článek je převzat z Wikipedie, otevřené encyklopedie, do které přispívají dobrovolníci z celého světa. |