Invia.cz
Eurovíkendy
Kanárské ostrovy
Dominikánská republika
Madeira
Last minute
Vydělávejte peníze s INVIA.CZ
T-test je metodou matematické statistiky, která umožňuje ověřit některou z následujících hypotéz:
V prvním případě může být náhodný výběr tvořen buď jednotlivými hodnotami (pak se jedná o jednovýběrový t-test), anebo dvojicemi hodnot, u nichž se zkoumají jejich rozdíly (pak se jedná o párový t-test). Ve druhém případě jde o dvouvýběrový t-test.
V praxi se t-test často používá k porovnání, zda se výsledky měření na jedné skupině významně liší od výsledků měření na druhé skupině.
Obsah |
Test je založen na skutečnosti, že výběrový průměr z normálního rozdělení, od něhož se odečte střední hodnota tohoto rozdělení a rozdíl se vydělí výběrovou směrodatnou odchylkou, má T rozdělení.
Označme jednotlivé hodnoty náhodného výběru jako x1,x2,...,xn, výběrový průměr jako
a výběrový rozptyl jako S2. Test testuje hypotézu, že střední hodnota normálního rozdělení, z něhož výběr pochází, se rovná μ0.
Platí-li hypotéza, má náhodná veličina
T rozdělení s n-1 stupni volnosti. Hypotézu zamítáme, je-li T příliš velké nebo příliš malé (výběrový průměr se příliš liší od očekávané střední hodnoty). Konkrétně se T porovná s kritickou hodnotou T rozdělení pro předem stanovenou hladinu významnosti.
Párový t-test se od jednovýběrového liší pouze v tom, že náhodný výběr poskytuje dvojice hodnot (y1,z1),(y2,z2),...,(yn,zn), přičemž uvnitř každé dvojice nemusí jít o nezávislé veličiny. V párovém t-testu ověřujeme, zda rozdíl středních hodnot rozdělení pro veličiny y a rozdělení pro veličiny z je roven určitému číslu (často nule).
Položíme-li xi = yi − zi a označíme-li μ0 jako číslo, kterému se má rovnat rozdíl středních hodnot, můžeme párový test zcela převést na případ jednovýběrového t-testu.
Označme jednotlivé hodnoty prvního náhodného výběru jako x1,x2,...,xn, výběrový průměr jako
a výběrový rozptyl jako
. Obdobně označme jednotlivé hodnoty druhého náhodného výběru jako y1,y2,...,ym, výběrový průměr jako
a výběrový rozptyl jako
. Oba výběry musejí být vzájemně nezávislé. Nakonec označme δ číslo, které se má rovnat rozdílu středních hodnot μ1 − μ2 (jak již bylo řečeno, často δ = 0).
Potom veličina

má za platnosti hypotézy, že se rozdíl středních hodnot rovná δ, T rozdělení o n+m-2 stupních volnosti. Hypotéza se tedy zamítá v případě, že veličina T překročí kritickou hodnotu T rozdělení o uvedeném počtu stupňů volnosti.
Předpoklad, že oba výběry pocházejí z normálního rozdělení, nemusí být za každou cenu dodržen. T-test totiž pracuje s průměry obou výběrů, a ty již při rozsahu výběru v řádu desítek mají přibližně normální rozdělení díky centrální limitní větě.
Před provedením t-testu by mělo být prověřeno, že oba náhodné výběry mají stejný rozptyl. K tomu může posloužit F-test. Existují i modifikace t-testu pro výběry s různými rozptyly.
Pokud je rozsah výběru (resp. obou výběrů) velký (v řádu stovek a víc), lze místo kritických hodnot T rozdělení použít kritické hodnoty normálního rozdělení.
Je-li skupin hodnot (tj. náhodných výběrů) víc než dva, je správnější provést simultánní porovnání pomocí analýzy rozptylu než opakovanými t-testy po dvojicích.
Anděl, J.: Matematická statistika, SNTL 1985.