Kritický význam studentské statistiky. Základní statistika a Studentův t-test

MINISTERSTVO ŠKOLSTVÍ RUSKÉ FEDERACE

Permská státní univerzita

Vědecké a vzdělávací centrum

"Nerovnovážné přechody v kontinuálních médiích"

Yu.K. Bratukhin, G.F. Putin

ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Učebnice pro laboratorní workshop „Mechanika“

kurz obecné fyziky

Perm 2003


BBK 22.253.3

UDC 531.7.08 (076.5)

Bratukhin Yu.K., Putin G.F.

B 87 Zpracování experimentálních dat: Učebnice pro laboratorní workshop „Mechanika“ kurzu obecné fyziky / Perm. univ. – Perm, 2003. – 80 s.

ISBN 5–7944–0370 5

Příručka je určena studentům prvních ročníků fyzikálních kateder vysokých škol, ale i studentům dalších přírodovědných kateder vysokých škol a technických vysokých škol, kteří začínají pracovat v dílně obecné fyziky. Je sestaven v souladu s aktuálním sylabem předmětu obecné fyziky jako úvod do průběhu laboratorních prací. Je uvedeno stručné shrnutí teorie týkající se všech úloh a popis několika laboratorních prací, z nichž každou mohou provádět současně studenti celé skupiny. Formulace úkolů zajišťuje, že realizace většiny experimentálních instalací je jednoduchá a studenti po dokončení experimentů sami mohou navrhnout jejich vylepšení nebo je na přání reprodukovat doma. Manuál lze tedy využít i pro samostatnou práci.

Stůl 10. Nemocný. 13. Bibliografie 12 titulů

Učebnice byla připravena za podpory Vědecko-vzdělávacího centra „Nerovnovážné přechody v médiích kontinua“

Zveřejněno rozhodnutím akademické rady Fyzikální fakulty Permské univerzity

Recenzenti:

Katedra aplikované fyziky, Perm State Technical University;

Doktor fyzikálních a matematických věd, profesor A.F. Psheničnikov

ISBN 5–7944–0370 5 Ó Y.K.Bratukhin, G.F.Putin, 2003


1. Pravidla pro zpracování výsledků měření. . . . . . .5



1.1. Zpracování výsledků přímého měření. . . . . . . . . . . . . . . 5

1.2. Zpracování výsledků nepřímých měření. . . . . . . . . . . . .9

2. Příprava protokolů o laboratorních pracích. . jedenáct

3. Úvod. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

4. Typy měření. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

4.1. Měření. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

4.2. Přímá měření. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

4.3. Nepřímá měření. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

5. Prezentace výsledků měření. . . . . . . . . . 16

5.1. Záznam výsledku měření. . . . . . . . . . . . . . . . . . . . . . . . . .16

5.2. Průměrná hodnota. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16

5.3. Skutečný význam. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

5.4. Interval spolehlivosti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

5.5. Faktor spolehlivosti. . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

6. Typy chyb. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18

6.1. Absolutní chyba. . . . . . . . . . . . . . . . . . . . . . . . . . . . .18

6.2. Relativní chyba. . . . . . . . . . . . . . . . . . . . . . . . . . .18

6.3. Systematická chyba. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

6.4. Náhodná chyba. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21

6.5. Slečna, minout. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

7. Chyby měřicích přístrojů. . . . . . . . . . 23

7.1. Maximální chyba zařízení. . . . . . . . . . . . . . . . . . . . . . . . . . 23

7.2. Třída přesnosti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24

7.3. Chyba zařízení. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24

7.4. Chyba zaokrouhlení. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .25

7.5. Celková chyba měření. . . . . . . . . . . . . . . . . . . . . . . . .25

8. Statistické zpracování výsledků

měření obsahující náhodnou chybu. . . .27

8.1.Zpracování výsledků přímých měření. . . . . . . . . . . . . . .27

8.2. Gaussovo rozdělení. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . třicet

8.3. Studentova metoda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31

8.4. Zpracování výsledků nepřímých měření. . . . . . . . . . . .33

9. Přibližné výpočty při zpracování

experimentální data. . . . . . . . . . . . . . . . . . . . . .37

9.1. Počet platných číslic při určování chyby. . . . . 38

9.2. Směrem k výpočtu celkové chyby měření. . . . . . . . . . . . 40

9.3. O přesnosti výpočtů. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

10. Laboratorní práce ze statistiky

zpracování výsledků měření. . . . . . . . . . . . . . . .42

10.1. Laboratorní práce. Studium rozdělení náhody

množství. Lorentzův plyn. . . . . . . . . . 44

10.2. Laboratorní práce. Experimentální stanovení

čísla π. Buffonova jehla. . . . . . . . . . 55

10.3. Laboratorní práce. Simulace měření,

doprovázena velkou náhodnou chybou. . . . . . . . 64

10.4. Laboratorní práce. Příklad odhadu chyb

nepřímá měření. Stanovení hustoty pevné látky. . . . . . . . . 70

10.5. Laboratorní práce. Stanovení hustoty pevných látek

tělesa pravidelného geometrického tvaru. . . . . . . . . . . . . . . . . . . . . . . . 76

11. Jak psát laboratorní zprávy a

výzkumné práce a

vědecké články. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

BIBLIOGRAFICKÝ SEZNAM. . . . . . . . . . . . . . . . . . . . . . . 79


Kapitoly 1 a 2 stručně popisují sled kroků potřebných při zpracování a prezentaci experimentálních dat a při přípravě zpráv o laboratorních pracích. Podrobná prezentace těchto problémů je obsažena v částech 3 – 11, které tvoří hlavní obsah této příručky.

1. PRAVIDLA ZPRACOVÁNÍ VÝSLEDKŮ MĚŘENÍ

Při zpracování výsledků měření je navržen následující postup.

1.1. Zpracování výsledků Přímo Měření

Přímá měření jsou taková, při kterých se požadovaná hodnota odečítá přímo z přístroje.

Ať se to děje za stejných podmínek n měření nějaké fyzikální veličiny X.

1. Výsledky každého z jednotlivých měření zapisujeme do tabulky v sešitu. x 1, x 2, ... x n.

2. Vypočítejte aritmetický průměr <X> od n Měření

4. Určete z tabulky 1.1.1 Studentův koeficient t p , n pro počet provedených měření n(a vzhledem k spolehlivosti p = 0.95).

Stůl 1.1.1

Studentské koeficienty

p = 0.95

6. Vypočítejte absolutní chyba přístroje D atd podle vzorce

Kde ω – cena nejmenší divize zařízení.

Chyby přístroje ∆ atd a zaokrouhlení ∆ okr pro některé přístroje používané v laboratorních dílnách mechaniky jsou uvedeny v tabulce 1.1.2 :

Stůl 1.1.2

Chyby přístroje

p = 0.95

8. Určete součet absolutní chyba D X zkušenosti podle vzorce

. (1.1.6) / (7.5.1)

Při výpočtu D X podle vzorce (1.1.6) můžete zahodit jednu nebo dvě z chyb D atd a ∆ okr, pokud jsou jejich hodnoty poloviční nebo výrazně nižší než zbývající.

9. Zaokrouhlete absolutní chybu D X(viz odstavec 9.1):

Dx = 0. 523 0.5 ;

D x = 0. 124 0.12 .

Zde a v některých z následujících příkladů jsou podtržena významná čísla.

10. Zapište si finále výsledek experimentu tak jako

a uveďte měrné jednotky.

Záznam (1.1.7) znamená, že skutečná hodnota X měřená veličina X leží v interval spolehlivosti ( - D X, <X>+D X) s pravděpodobností p ve výši 95 %.

11. Zaokrouhlete průměrnou hodnotu<X> takovým způsobem, že chyba D X zaúčtováno (viz odstavec 9.1):

· do poslední kategorie sekundární<X> pokud D X psáno s jednou významnou postavou

· pro poslední dvě kategorie průměru<X> pokud D X psáno dvěma významnými číslicemi

12. Definujte relativní chyba D x rel výsledek řady měření

D x rel=D X/<X>. (1.1.10) / (6.2.1)

13. Zapisujeme si teoretickou, tabulkovou, nebo získanou v jiných studiích apod. hodnotu fyzikální veličiny, kterou studujeme. X. Uvádíme podrobný odkaz na citovaný zdroj.

Například: Tabulková hodnota hustoty hliníku při teplotě 20°C

p = 2,69 g/cm3.

Viz: Tabulky fyzikálních veličin: Handbook / Ed. I.K. Kikoina. M.: Atomizdat. 1976. 1006 s. (tabulka na straně 121).

14. Výsledek získaný v našich experimentech porovnáme s údaji z předchozího odstavce 13. Pokud se tyto výsledky výrazně liší, měly by být zjištěny důvody takové nesrovnalosti: zkontrolujte výpočty; opakujte měření pro jednu nebo dvě charakteristické hodnoty parametru.

15. Zapište si výstup.

Například: Výsledky našich měření v mezích experimentální chyby souhlasí (nesouhlasí) s teoretickou, nebo tabelovanou, nebo uvedenou v citované práci [N] hodnotou. (Nesrovnalosti ve výsledcích mohou být způsobeny následujícími důvody: ... nebo následujícími nedostatky použitých přístrojů a experimentální techniky: ...).

1.2. Zpracování výsledků nepřímý Měření

Nepřímá měření jsou ta, ve kterých nás kvantita zajímá z je funkce k (k 1) přímo měřené veličiny x 1,x 2,…, x k:

z = z(x 1,x 2,…, x k). (1.2.1)/(8.4.1)

Při zpracování výsledků nepřímých měření je nejčastější následující způsob.

1. Data z přímých měření každého parametru x 1, x 2,…, x k zpracováno tak, jak je popsáno v odstavci 1.1:

· Počítáme aritmetické průměry argumenty , , …, podle vzorce (1.1.1) ;

· Shledáváme absolutní chyby D x 1, D x2,…, D x k měření každého argumentu pomocí výše uvedených vzorců (1.1.3) (1.1.6) . V tomto případě nastavíme stejnou hodnotu spolehlivosti pro všechny argumenty p = 0.95.

2. Výsledek nepřímého měření určit dosazením zjištěných průměrů , , …, z přímo naměřených hodnot do vzorce pro funkci z

kde jsou parciální derivace funkce z, vypočítané na hodnotách proměnných x 1 = , x 2 = , …, x k = .

Výsledná chyba D z má stejnou spolehlivost p = 0.95.

Při výpočtu výsledné chyby pomocí vzorce (1.2.3) ty z výrazů v radikálním výrazu, které jsou alespoň z poloviny tak velké než zbývající výrazy, by měly být zanedbány.

Další způsob zpracování výsledků nepřímých měření je popsán dále v odstavci 8.4.


2. VYPRACOVÁNÍ ZPRÁV LABORATORNÍ PRÁCE

1. Každá práce musí začínat na nové stránce.

2. Název díla musí být zvýrazněn.

3. Po názvu musíte napsat krátký úvod, který by měl odrážet následující body:

· vyjádření problému, jaký jev nebo jaká závislost bude zkoumána, co se očekává, že se během práce získá;

· fyzikální veličiny, které se budou při práci měřit; jaké jsou jejich rozměry a měrné jednotky;

· popis metody měření použité v práci. V tomto případě je nutné schematicky nakreslit experimentální uspořádání a napsat pracovní vzorec a vzorce pro výpočet chyb.

4. Experimentální výsledky zapisujte pouze do sešitu, do předem připravených tabulek. Pro tyto účely by se neměly používat koncepty.

5. Pokud měřená veličina závisí na vnějších podmínkách, např. na teplotě nebo tlaku, je nutné zapsat experimentální podmínky.

6. Konečný výsledek by měl být zaznamenán na konci zprávy s uvedením intervalu spolehlivosti, koeficientu spolehlivosti, jednotek měření a vnějších podmínek. Tento výsledek by měl být zvýrazněn.

7. Získaný výsledek musí být pokud možno porovnán s existujícími tabulkovými údaji, teoretickými výpočty nebo experimentálními výsledky jiných autorů, přičemž je třeba uvést odkaz na zdroj těchto údajů.

8. Pokud měření obsahují systematické chyby (např. třecí síla nezohledněná ve vzorcích), pak nemá smysl uvádět interval spolehlivosti. V tomto případě se omezujeme na posouzení přesnosti metody měření.

9. Pro charakterizaci kvality výsledků a použité experimentální metody se doporučuje vždy vyhodnotit relativní chybu výsledku.

10. Všechny zápisy v zápisníku musí být datovány.


ÚVOD

Hlavní cíle laboratorní praxe jsou:

· seznámení se s přístroji;

· získávání zkušeností s prováděním experimentů;

· ilustrace teoretických principů fyziky.

Je zřejmé, že žádný kurz praktické práce nemůže obsáhnout celou teorii a představit všechny nástroje. Hlavním úkolem tohoto workshopu je proto naučit se:

· naplánovat experiment tak, aby přesnost měření odpovídala cílům;

· vzít v úvahu možnost systematických chyb a přijmout opatření k jejich odstranění;

· analyzovat výsledky experimentu a vyvodit správné závěry;

· vyhodnotit správnost konečného výsledku;

· vést záznamy o měření a výpočtech úhledně, jasně a stručně.

Pro seznámení s technikami praktických měření, statistickým zpracováním jejich výsledků, metodami experimentálního výzkumu a návody pro formátování výsledků, sestavování zpráv a psaní vědeckých článků doporučujeme přečíst knihu „Praktická fyzika“ od J. Squirese.

Navrhovaný laboratorní workshop mechaniky jako jednoho z oborů fyziky nemá čtenáři ani tak poskytnout nové informace – to již škola provedla – ale pomoci mu lépe pochopit podstatu více či méně známých faktů a jejich vzájemný vztah. Tento náš hlavní cíl také přímo souvisí s pěstováním tvůrčích schopností a formováním samostatného myšlení. Takové vzdělání lze utvářet v těchto hlavních oblastech: schopnost generalizace - indukce; schopnost aplikovat teorii na konkrétní problém - dedukce a co je možná nejdůležitější, schopnost identifikovat rozpory mezi teoretickými zobecněními a praxí - dialektika.

Teoretický obraz, který je vám předkládán na přednáškách, zkoumá ty aspekty reálného světa, které teorie považuje za důležité. Může se ukázat, že vaše seznámení s přírodním světem je omezeno pouze na tyto aspekty a budete si jisti, že se jedná o celý skutečný svět, a ne jeho jednotlivé aspekty. Navíc v takovém obrázku je vše tak dobře propojeno, že je snadné ztratit ze zřetele úsilí, které bylo zapotřebí k jeho vytvoření. Nejlepším lékem na takovou nemoc je jít do laboratoře a vidět složitost skutečného světa.

Když studujete experimentální fyziku, nejprve se naučíte, jak těžké může být otestovat teorii, změřit to, co potřebujete a ne něco jiného, ​​a naučit se takové potíže překonat. Zároveň získáte pohled na fyziku obecně a na vztah teorie a experimentu.

Pro výuku psaní zpráv o vědeckém výzkumu (pro vás je toto školení rozděleno do etap - laboratorní práce, studentské vědecké semináře a konference, účast na výzkumu katedry) jsou některé níže uvedené popisy laboratorních prací sestaveny ve stylu články ve vědeckých časopisech. Jak psát vědecké články je podrobně rozebráno v knihách, které dávají praktické rady, doporučení a příklady. Zde pouze upozorníme, že v takových popisech se budeme držet obecně uznávaného rozdělení článku do následujících sekcí:

· úvod s popisem problému;

· popis experimentálního uspořádání a techniky měření;

· Experimentální výsledky;

· jejich rozbor a srovnání s výsledky jiných autorů;

· závěry.

Pro všechny fyziky na světě se tento způsob prezentace stal natolik nedílnou profesionální dovedností, že často slouží jako důvod k vtipům a parodiím – viz např. články P. Jordana a R. de Kroniga „Movement of the dolní čelist u skotu při procesu žvýkání potravy“ a I. Frenkel „Směrem ke kvantové teorii tance“ v knize. Autoři této publikace nemohli odolat podobnému vtipu na úkor klišé a sami ze sebe a do sekce „Diskuse o výsledcích“ společné publikace v respektovaném akademickém časopise umístili doslovný citát z parodie „Návod k Čtenář vědeckých článků“: „Vezmeme-li v úvahu aproximace provedené v analýze, shodu mezi experimentálními a teoretickými výsledky je třeba považovat za uspokojivou,“ avšak s vynecháním tajného významu této fráze odhalené v „Pokynech. ..“: „Neexistuje vůbec žádná shoda“ - v důvěře, že zasvěcení pochopí tento význam bez dalších vysvětlení.

Abychom demonstrovali, jak užitečné je při vykazování experimentálních dat uvádět nejen průměrné charakteristiky, ale také intervaly spolehlivosti, ve kterých se s největší pravděpodobností nacházejí skutečné hodnoty měřených veličin, a také ukázat, jak teoretické a experimentální výsledky lze při studiu konkrétních problémů korelovat, Zde jsou dva grafy ze zmíněného článku.


4. TYPY MĚŘENÍ

Měření

Měření libovolné fyzikální veličiny je operace, která umožňuje zjistit, kolikrát je měřená veličina větší (nebo menší) než odpovídající hodnota brána jako jednotka.

Je třeba zdůraznit, že takové srovnání s etalonem - měření - musí být prováděno za přesně definovaných podmínek a zcela specifickým způsobem. Například měření délky objektu předpokládá, že standard je ve vztahu k němu nehybný, a měření trvání události se provádí pomocí nehybných hodin. V tomto smyslu Einsteinova analýza konceptu simultánnosti, který v klasické fyzice nebyl vůbec definován jako a priori"samozřejmé".

Měření se dělí na přímá a nepřímá.

Přímá měření

Přímá měření jsou taková, při kterých se požadovaná hodnota porovnává s jednotkou měření přímo nebo pomocí měřicího zařízení kalibrovaného v příslušných jednotkách. Příkladem přímého měření je měření délky pomocí pravítka nebo posuvného měřítka; měření hmotností na pákových vahách pomocí sady závaží; měření časových úseků pomocí hodin nebo stopek, měření teploty teploměrem, napětí voltmetrem atd. Hodnota měřené veličiny se měří na stupnici přístroje nebo se zjišťuje počítáním mír, závaží atp.

Nepřímá měření

Nepřímá měření jsou taková, ve kterých je požadovaná veličina nalezena jako funkce několika přímo měřených veličin. Příklady nepřímých měření zahrnují: zjištění hustoty pevné látky měřením její hmotnosti a objemu; měření viskozity kapaliny jejím objemovým průtokem při průtoku kruhovou kapilárou, délky a průřezu této kapiláry; nebo rychlostí, kterou malá kulička v této kapalině padá, její hustotou a průměrem atd.

V celém příkladu budeme používat fiktivní informace, aby si čtenář mohl potřebné transformace udělat sám.

Řekněme, že jsme v průběhu výzkumu studovali vliv léku A na obsah látky B (v mmol/g) ve tkáni C a koncentraci látky D v krvi (v mmol/l) u pacientů rozděleny podle nějakého kritéria E do 3 skupin o stejném objemu (n = 10). Výsledky takové fiktivní studie jsou uvedeny v tabulce:

Obsah látky B, mmol/g

Látka D, mmol/l

zvýšení koncentrace


Upozorňujeme, že pro usnadnění prezentace dat a výpočtů uvažujeme vzorky o velikosti 10, v praxi taková velikost vzorku obvykle nestačí k vytvoření statistického závěru.

Jako příklad uvažujme data v 1. sloupci tabulky.

Deskriptivní statistika

Ukázkový průměr

Aritmetický průměr, často jednoduše nazývaný „průměr“, se získá sečtením všech hodnot a vydělením tohoto součtu počtem hodnot v sadě. To lze ukázat pomocí algebraického vzorce. Množina n pozorování proměnné x může být reprezentována jako x 1 , x 2 , x 3 , ..., x n

Vzorec pro určení aritmetického průměru pozorování (vyslovuje se „X s čárou“):

= (Xi + X2 + ... + Xn)/n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Ukázkový rozptyl

Jedním ze způsobů, jak měřit rozptyl dat, je určit míru, do jaké se každé pozorování odchyluje od aritmetického průměru. Je zřejmé, že čím větší odchylka, tím větší variabilita, variabilita pozorování. Nemůžeme však použít průměr těchto odchylek jako míra disperze, protože kladné odchylky kompenzují odchylky záporné (jejich součet je nulový). Abychom tento problém vyřešili, umocníme každou odchylku a zjistíme průměr druhé mocniny odchylek; tato veličina se nazývá variace nebo disperze. Vezměme si n pozorování x 1, x 2, x 3, ..., x n, průměr která se rovná. Výpočet rozptylu toto, obvykle označované jakos2,tyto postřehy:

Výběrový rozptyl tohoto ukazatele je s 2 = 3,2.

Standardní odchylka

Standardní (střední kvadratická) odchylka je kladná druhá odmocnina z rozptylu. S použitím n pozorování jako příkladu to vypadá takto:

Směrodatnou odchylku si můžeme představit jako druh průměrné odchylky pozorování od průměru. Počítá se ve stejných jednotkách (rozměrech) jako původní údaje.

s = sqrt (s 2) = sqrt (3,2) = 1,79.

Variační koeficient

Pokud vydělíte směrodatnou odchylku aritmetickým průměrem a výsledek vyjádříte v procentech, dostanete variační koeficient.

CV = (1,79 / 13,1) * 100 % = 13,7

Ukázka střední chyby

1,79/sqrt(10) = 0,57;

Studentův t koeficient (jednovýběrový t-test)

Používá se k testování hypotézy o rozdílu mezi průměrnou hodnotou a nějakou známou hodnotou m

Počet stupňů volnosti se vypočítá jako f=n-1.

V tomto případě je interval spolehlivosti pro průměr mezi hranicemi 11,87 a 14,39.

Pro 95% hladinu spolehlivosti m=11,87 nebo m=14,39, tedy = |13,1-11,82| = |13,1-14,38| = 1,28

V souladu s tím v tomto případě pro počet stupňů volnosti f = 10 - 1 = 9 a 95% hladina spolehlivosti t = 2,26.

Dialog Základní statistiky a tabulky

V modulu Základní statistiky a tabulky pojďme si vybrat Deskriptivní statistika.

Otevře se dialogové okno Deskriptivní statistika.

V terénu Proměnné pojďme si vybrat Skupina 1.

Lisování OK, získáme tabulky výsledků s popisnou statistikou vybraných proměnných.

Otevře se dialogové okno Jednovýběrový t-test.

Předpokládejme, že víme, že průměrný obsah látky B ve tkáni C je 11.

Tabulka výsledků s popisnou statistikou a Studentovým t-testem je následující:

Museli jsme zamítnout hypotézu, že průměrný obsah látky B ve tkáni C je 11.

Vzhledem k tomu, že vypočtená hodnota kritéria je větší než tabulková hodnota (2.26), je nulová hypotéza na zvolené hladině významnosti zamítnuta a rozdíly mezi vzorkem a známou hodnotou jsou považovány za statisticky významné. Touto metodou je tedy potvrzen závěr o existenci rozdílů učiněný pomocí Studentova testu.

Jedním z nejznámějších statistických nástrojů je Studentův t test. Používá se k měření statistické významnosti různých párových veličin. Microsoft Excel má speciální funkci pro výpočet tohoto ukazatele. Pojďme se naučit, jak vypočítat Studentův t-test v Excelu.

Nejprve si ale pojďme zjistit, co je Studentův t-test obecně. Tento indikátor se používá ke kontrole rovnosti průměrných hodnot dvou vzorků. To znamená, že určuje významnost rozdílů mezi dvěma skupinami dat. Ke stanovení tohoto kritéria se přitom používá celá sada metod. Ukazatel lze vypočítat s ohledem na jednostranné nebo oboustranné rozdělení.

Výpočet ukazatele v Excelu

Nyní přejdeme přímo k otázce, jak vypočítat tento ukazatel v Excelu. To lze provést prostřednictvím funkce STUDENTSKÝ TEST. V roce 2007 a dřívějších verzích Excelu se tomu říkalo TTEST. V pozdějších verzích však byla ponechána z důvodu kompatibility, ale stále se doporučuje používat modernější - STUDENTSKÝ TEST. Tuto funkci lze použít třemi způsoby, které budou podrobně popsány níže.

Metoda 1: Průvodce funkcí

Nejjednodušší způsob, jak vypočítat tento indikátor, je pomocí Průvodce funkcí.


Provede se výpočet a výsledek se zobrazí na obrazovce v předem vybrané buňce.

Metoda 2: Práce s kartou Vzorce

Funkce STUDENTSKÝ TEST lze také vyvolat přechodem na kartu "vzorce" pomocí speciálního tlačítka na stuze.


Metoda 3: Ruční zadání

Vzorec STUDENTSKÝ TEST Můžete jej také zadat ručně do libovolné buňky na listu nebo do řádku funkce. Jeho syntaktická forma vypadá takto:

STUDENT.TEST(Pole1,Pole2,Tails,Typ)

Co každý z argumentů znamená, bylo zvažováno při analýze první metody. Tyto hodnoty by měly být nahrazeny touto funkcí.

Po zadání údajů stiskněte tlačítko Vstupte pro zobrazení výsledku na obrazovce.

Jak vidíte, výpočet Studentova testu v Excelu je velmi jednoduchý a rychlý. Hlavní věc je, že uživatel, který provádí výpočty, musí rozumět tomu, co je a jaká vstupní data jsou za co zodpovědná. Program sám provede přímý výpočet.

Tabulka rozdělení studentů

Integrální tabulky pravděpodobnosti se používají pro velké vzorky z nekonečně velké populace. Ale již v (n)< 100 получается Несоответствие между

tabulková data a limitní pravděpodobnost; v (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

na obecné populaci nezáleží, protože rozložení odchylek výběrového ukazatele od obecné charakteristiky u velkého vzorku se vždy ukáže jako normální.

nom. V malých vzorcích (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

populace s normálním rozložením. Teorii malých vzorků rozvinul anglický statistik W. Gosset (psal pod pseudonymem Student) na počátku 20. století. V

V roce 1908 zkonstruoval speciální rozdělení, které i u malých vzorků umožňuje korelovat (t) a pravděpodobnost spolehlivosti F(t). Pro (n) > 100 poskytují studentské distribuční tabulky stejné výsledky jako Laplaceovy pravděpodobnostní integrální tabulky pro 30< (n ) <

100 rozdílů je zanedbatelných. Proto mezi prakticky malé vzorky patří vzorky o objemu menším než 30 jednotek (za velký se samozřejmě považuje vzorek o objemu větším než 100 jednotek).

Použití malých vzorků je v některých případech dáno povahou zkoumané populace. Při šlechtitelské práci je tedy snazší dosáhnout „čisté“ zkušenosti s malým počtem

pozemků. Výrobní a ekonomický experiment související s ekonomickými náklady se také provádí na malém počtu pokusů. Jak již bylo uvedeno, v případě malého vzorku lze pravděpodobnosti spolehlivosti i meze spolehlivosti obecného průměru vypočítat pouze pro normálně rozloženou populaci.

Hustota pravděpodobnosti Studentova rozdělení je popsána funkcí.

1 + t2

f(t,n) := Bn

n - 1

t - aktuální proměnná n - velikost vzorku;

B je veličina, která závisí pouze na (n).

Studentovo rozdělení má pouze jeden parametr: (d.f.) - počet stupňů volnosti (někdy označovaný (k)). Toto rozdělení je stejně jako normální symetrické podle bodu (t) = 0, ale je plošší. S rostoucí velikostí vzorku a následně i počtem stupňů volnosti se Studentovo rozdělení rychle blíží normálu. Počet stupňů volnosti se rovná počtu těchto hodnot jednotlivých funkcí, které je třeba rozdělit

předpokládat k určení požadované charakteristiky. Pro výpočet rozptylu tedy musí být známa průměrná hodnota. Proto při výpočtu rozptylu použijte (d.f.) = n - 1.

Distribuční tabulky studentů jsou publikovány ve dvou verzích:

1. podobně jako u integrálních pravděpodobnostních tabulek, hodnoty ( t) a odpovídající

aktuální pravděpodobnosti F(t) pro různé počty stupňů volnosti;

2. hodnoty (t) jsou uvedeny pro nejběžněji používané pravděpodobnosti spolehlivosti

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 a 0,99 nebo pro 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 – 0,99 = 0,01.

3. při různém počtu stupňů volnosti. Tento druh tabulky je uveden v příloze

(tabulka 1 - 20), stejně jako hodnota (t) - Studentův test na hladině významnosti 0,7

Metoda umožňuje otestovat hypotézu, že průměrné hodnoty dvou obecných populací, ze kterých jsou extrahovány porovnávané závislý vzorky se od sebe liší. Předpoklad závislosti nejčastěji znamená, že znak je měřen na stejném vzorku dvakrát, například před intervencí a po ní. V obecném případě je každému zástupci jednoho vzorku přiřazen zástupce z jiného vzorku (jsou spojeni do párů), takže obě datové řady spolu pozitivně korelují. Slabší typy výběrové závislosti: vzorek 1 - manželé, vzorek 2 - jejich manželky; vzorek 1 - roční děti, vzorek 2 tvoří dvojčata dětí ve vzorku 1 atd.

Testovatelná statistická hypotéza, jako v předchozím případě, H 0: M1 = M2(průměrné hodnoty ve vzorcích 1 a 2 jsou stejné). M 1 víceméně) M 2

Prvotní předpoklady pro statistické testování:

□ každý zástupce jednoho vzorku (z jedné obecné populace) je spojen se zástupcem jiného vzorku (z jiné obecné populace);

□ data ze dvou vzorků jsou pozitivně korelována (tvoří páry);

□ rozložení studované charakteristiky v obou vzorcích odpovídá normálnímu zákonu.

Struktura zdrojových dat: pro každý objekt (pro každý pár) existují dvě hodnoty studovaného prvku.

Omezení: rozložení charakteristiky v obou vzorcích by se nemělo výrazně lišit od normálního; data dvou měření odpovídajících oběma vzorkům jsou pozitivně korelována.

Alternativy: Wilcoxonův T-test, pokud se distribuce pro alespoň jeden vzorek významně liší od normálního; t-Student test pro nezávislé vzorky - pokud data pro dva vzorky nejsou pozitivně korelována.

Vzorec protože empirická hodnota Studentova t testu odráží skutečnost, že jednotkou analýzy pro rozdíly je rozdíl (posun) charakteristické hodnoty pro každou dvojici pozorování. Podle toho se pro každý z N párů hodnot atributů nejprve vypočítá rozdíl d i = x 1 i - x 2 i.

(3) kde M d – průměrný rozdíl hodnot; σ d – směrodatná odchylka rozdílů.

Příklad výpočtu:

Předpokládejme, že během testování účinnosti školení byla každému z 8 členů skupiny položena otázka „Jak často se vaše názory shodují s názory skupiny?“ - dvakrát, před a po tréninku. Pro odpovědi byla použita 10bodová škála: 1 – nikdy, 5 – poloviční čas, 10 – vždy. Byla testována hypotéza, že v důsledku tréninku se zvýší sebeúcta konformity (touha být jako ostatní ve skupině) účastníků (α = 0,05). Vytvořme tabulku pro mezivýpočty (tab. 3).

Tabulka 3

Aritmetický průměr pro rozdíl Md = (-6)/8= -0,75. Odečtěte tuto hodnotu od každého d (předposlední sloupec tabulky).

Vzorec pro směrodatnou odchylku se liší pouze tím, že se v něm místo X objeví d. Dosadíme všechny potřebné hodnoty a dostaneme

ad = = 0,886.

Krok 1. Vypočítejte empirickou hodnotu kritéria pomocí vzorce (3): průměrný rozdíl Md= -0,75; standardní odchylka σ d = 0,886; t e = 2,39; df = 7.

Krok 2. Pomocí tabulky kritických hodnot kritéria t-Student určíme p-hladinu významnosti. Pro df = 7 je empirická hodnota mezi kritickými hodnotami pro p = 0,05 a p - 0,01. Proto p< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Krok 3. Učiníme statistické rozhodnutí a zformulujeme závěr. Statistická hypotéza o rovnosti průměrů je zamítnuta. Závěr: ukazatel sebehodnocení konformity účastníků po školení statisticky významně vzrostl (na hladině významnosti str< 0,05).

Mezi parametrické metody patří porovnání rozptylů dvou vzorků podle kritéria F-Fisher. Někdy tato metoda vede k cenným smysluplným závěrům a v případě porovnávání průměrů pro nezávislé vzorky je porovnávání rozptylů povinné postup.

Vypočítat F em musíte najít poměr rozptylů dvou vzorků, a to tak, aby větší rozptyl byl v čitateli a menší ve jmenovateli.

Porovnání rozptylů. Metoda umožňuje testovat hypotézu, že rozptyly dvou populací, ze kterých jsou komparované vzorky čerpány, se od sebe liší. Testovaná statistická hypotéza H 0: σ 1 2 = σ 2 2 (rozptyl ve vzorku 1 je roven rozptylu ve vzorku 2). Pokud je zamítnuta, je přijata alternativní hypotéza, že jeden rozptyl je větší než druhý.

Prvotní předpoklady: jsou náhodně odebrány dva vzorky z různých populací s normální distribucí studovaného znaku.

Struktura zdrojových dat: studovaná charakteristika je měřena v objektech (subjektech), z nichž každý patří k jednomu ze dvou porovnávaných vzorků.

Omezení: distribuce znaku v obou vzorcích se významně neliší od normálu.

Alternativní metoda: Leveneův test, jehož použití nevyžaduje kontrolu předpokladu normality (používá se v programu SPSS).

Vzorec pro empirickou hodnotu Fisherova F testu:

(4)

kde σ 1 2 - velká disperze a σ 2 2 - menší disperze. Protože není předem známo, která disperze je větší, používá se k určení p-úrovně Tabulka kritických hodnot pro nesměrové alternativy. Li F e > F Kp pro odpovídající počet stupňů volnosti tedy R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Příklad výpočtu:

Děti dostávaly pravidelné aritmetické úlohy, načež bylo jedné náhodně vybrané polovině studentů sděleno, že v testu neuspěli, a zbytku opak. Každého dítěte bylo poté dotázáno, kolik sekund by mu trvalo vyřešit podobný problém. Experimentátor spočítal rozdíl mezi časem, kdy dítě volalo, a výsledkem splněného úkolu (v sekundách). Očekávalo se, že zpráva o neúspěchu způsobí určitou nedostatečnost v sebevědomí dítěte. Testovanou hypotézou (na úrovni α = 0,005) bylo, že rozptyl souhrnného sebehodnocení nezávisí na zprávách o úspěchu nebo neúspěchu (H 0: σ 1 2 = σ 2 2).

Byly získány následující údaje:


Krok 1. Vypočítejte empirickou hodnotu kritéria a počet stupňů volnosti pomocí vzorců (4):

Krok 2. Podle tabulky kritických hodnot Fisherova f-kritéria pro neorientovaný alternativy, pro které najdeme kritickou hodnotu číslo df = 11; df vědět= 11. Existuje však kritická hodnota pouze pro číslo df= 10 a df vědět = 12. Není možné vzít větší počet stupňů volnosti, proto bereme kritickou hodnotu pro číslo df= 10: Pro R = 0,05 F Kp = 3,526; Pro R = 0,01 F Kp = 5,418.

Krok 3. Učinit statistické rozhodnutí a smysluplný závěr. Protože empirická hodnota překračuje kritickou hodnotu pro R= 0,01 (a ještě více pro p = 0,05), pak v tomto případě p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). V důsledku toho je po zprávě o neúspěchu nedostatečná sebeúcta vyšší než po zprávě o úspěchu.

/ praktická statistika / referenční materiály / hodnoty studentského t-testu

Významt -Studentův t test na hladinách významnosti 0,10, 0,05 a 0,01

ν – stupně volnosti variace

Standardní hodnoty Studentova t-testu

Počet stupňů volnosti

Úrovně významnosti

Počet stupňů volnosti

Úrovně významnosti

Stůl XI

Standardní hodnoty Fisherova testu používané k posouzení významnosti rozdílů mezi dvěma vzorky

Stupně svobody

Úroveň významnosti

Stupně svobody

Úroveň významnosti

Studentův t-test

Studentův t-test- obecný název pro třídu metod statistického testování hypotéz (statistické testy) na základě Studentova rozdělení. Nejběžnější použití t-testu zahrnuje testování rovnosti průměrů ve dvou vzorcích.

t-statistika se obvykle konstruuje podle následujícího obecného principu: čitatelem je náhodná veličina s nulovým matematickým očekáváním (pokud je splněna nulová hypotéza) a jmenovatelem je výběrová směrodatná odchylka této náhodné veličiny získaná jako druhá odmocnina z odhad nesmíšeného rozptylu.

Příběh

Toto kritérium vyvinul William Gossett pro hodnocení kvality piva ve společnosti Guinness. V souvislosti se závazky vůči společnosti ohledně nezveřejňování obchodních tajemství (Guinness management považoval za použití statistického aparátu při své práci) byl Gossetův článek publikován v roce 1908 v časopise Biometrics pod pseudonymem „Student“.

Požadavky na data

Pro uplatnění tohoto kritéria je nutné, aby původní data měla normální rozdělení. V případě aplikace dvouvýběrového testu pro nezávislé výběry je nutné dodržet i podmínku rovnosti rozptylů. Existují však alternativy k Studentovu t testu pro situace s nestejnými rozptyly.

Požadavek normální distribuce dat je nezbytný pro přesný t (\displaystyle t) -test. I u jiných distribucí dat je však možné použít t (\displaystyle t) -statistics. V mnoha případech má tato statistika asymptoticky standardní normální rozdělení - N (0, 1) (\displaystyle N(0,1)) , takže lze použít kvantily tohoto rozdělení. I v tomto případě se však často používají kvantily nikoli standardního normálního rozdělení, ale odpovídajícího Studentova rozdělení, jako v přesném t (\displaystyle t) testu. Jsou asymptoticky ekvivalentní, ale v malých vzorcích jsou intervaly spolehlivosti Studentova rozdělení širší a spolehlivější.

Jednovýběrový t-test

Používá se k testování nulové hypotézy H 0: E (X) = m (\displaystyle H_(0):E(X)=m) o rovnosti matematického očekávání E (X) (\displaystyle E(X)) až nějaká známá hodnota m ( \displaystyle m) .

Je zřejmé, že pokud je splněna nulová hypotéza, E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Vezmeme-li v úvahu předpokládanou nezávislost pozorování, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Použití nezkresleného odhadu rozptylu s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\součet _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) získáme následující t-statistiky:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Podle nulové hypotézy je rozdělení této statistiky t (n − 1) (\displaystyle t(n-1)) . Pokud tedy absolutní hodnota statistiky překročí kritickou hodnotu daného rozdělení (na dané hladině významnosti), je nulová hypotéza zamítnuta.

Dvouvýběrový t-test pro nezávislé vzorky

Nechť existují dva nezávislé vzorky objemů n 1, n 2 (\displaystyle n_(1)~,~n_(2)) normálně rozdělených náhodných proměnných X 1, X 2 (\displaystyle X_(1),~X_(2) )). Je nutné otestovat nulovou hypotézu rovnosti matematických očekávání těchto náhodných veličin H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) pomocí vzorových dat.

Zvažte rozdíl mezi průměry vzorku Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Je zřejmé, že pokud je nulová hypotéza pravdivá, E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Rozptyl tohoto rozdílu je stejný na základě nezávislosti vzorků: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Potom pomocí nestranného odhadu rozptylu s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) získáme nestranný odhad rozptylu rozdílu výběrových průměrů: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ styl zobrazení s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^( 2))(n_(2)))). Proto t-statistika pro testování nulové hypotézy je

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Pokud je nulová hypotéza pravdivá, má tato statistika rozdělení t (d f) (\displaystyle t(df)), kde d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)) +s_(2)^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

Případ stejné odchylky

Pokud se předpokládá, že rozptyly vzorků jsou stejné, pak

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\vpravo))

Pak je t-statistika:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2, s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ styl zobrazení t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2)))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Tato statistika má rozdělení t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Dvouvýběrový t-test pro závislé vzorky

Pro výpočet empirické hodnoty kritéria t (\displaystyle t) v situaci testování hypotézy o rozdílech mezi dvěma závislými vzorky (například dvěma vzorky stejného testu s časovým intervalem) se používá následující vzorec:

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

kde M d (\displaystyle M_(d)) je průměrný rozdíl hodnot, s d (\displaystyle s_(d)) je standardní odchylka rozdílů a n je počet pozorování

Tato statistika má distribuci t (n − 1) (\displaystyle t(n-1)) .

Testování lineárního omezení na parametrech lineární regrese

T-test může také testovat libovolné (jediné) lineární omezení na parametrech lineární regrese odhadované pomocí obyčejných nejmenších čtverců. Nechť je třeba otestovat hypotézu H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . Je zřejmé, že pokud je splněna nulová hypotéza, E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)= c^( T)E((\hat (b)))-a=0) . Zde využíváme vlastnosti nestranných odhadů nejmenších čtverců parametrů modelu E (b ^) = b (\displaystyle E((\hat (b)))=b) . Navíc V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Pokud použijeme místo neznámého rozptylu jeho nezkreslený odhad s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)), získáme následující t-statistiky:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

Tato statistika, když je splněna nulová hypotéza, má rozdělení t (n − k) (\displaystyle t(n-k)) , takže pokud je hodnota statistiky vyšší než kritická hodnota, pak nulová hypotéza lineárního omezení je odmítnut.

Testování hypotéz o koeficientu lineární regrese

Speciálním případem lineárního omezení je testování hypotézy, že regresní koeficient b j (\displaystyle b_(j)) je roven určité hodnotě a (\displaystyle a) . V tomto případě je odpovídající t-statistika:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j)))))

kde s b ^ j (\displaystyle s_((\hat (b))_(j))) je směrodatná chyba odhadu koeficientu - druhá odmocnina odpovídajícího diagonálního prvku kovarianční matice odhadů koeficientů.

Pokud je nulová hypotéza pravdivá, je rozdělení této statistiky t (n − k) (\displaystyle t(n-k)) . Pokud je absolutní hodnota statistiky vyšší než kritická hodnota, pak je rozdíl mezi koeficientem a a (\displaystyle a) statisticky významný (nenáhodný), v opačném případě je nevýznamný (náhodný, to znamená, že skutečný koeficient je pravděpodobně rovná nebo velmi blízko odhadované hodnotě a (\ styl zobrazení a))

Komentář

Jednovýběrový test pro matematická očekávání lze zredukovat na testování lineárního omezení parametrů lineární regrese. V jednovýběrovém testu se jedná o „regresi“ na konstantu. Proto s 2 (\displaystyle s^(2)) regrese je vzorový odhad rozptylu studované náhodné proměnné, matice X T X (\displaystyle X^(T)X) je rovna n (\displaystyle n ) a odhad „koeficientu“ modelu je roven výběrovému průměru. Odtud dostaneme výraz pro t-statistiku uvedený výše pro obecný případ.

Podobně lze ukázat, že dvouvýběrový test se stejnými výběrovými rozptyly se také redukuje na testování lineárních omezení. Ve dvouvýběrovém testu se jedná o "regresi" na konstantě a fiktivní proměnné identifikující dílčí vzorek v závislosti na hodnotě (0 nebo 1): y = a + b D (\displaystyle y=a+bD) . Hypotézu o rovnosti matematických očekávání vzorků lze formulovat jako hypotézu o rovnosti koeficientu b tohoto modelu k nule. Lze ukázat, že vhodná t-statistika pro testování této hypotézy se rovná t-statistice uvedené pro dvouvýběrový test.

Může být také redukován na kontrolu lineárního omezení v případě různých disperzí. V tomto případě má rozptyl chyby modelu dvě hodnoty. Z toho můžete také získat t-statistiku podobnou té, která je uvedena pro dvouvýběrový test.

Neparametrické analogy

Obdobou dvouvýběrového testu pro nezávislé vzorky je Mann-Whitney U test. Pro situaci se závislými vzorky jsou analogy znaménkový test a Wilcoxonův T-test

Literatura

Student. Pravděpodobná chyba průměru. // Biometrika. 1908. č. 6 (1). S. 1-25.

Odkazy

O kritériích pro testování hypotéz o homogenitě prostředků na webových stránkách Státní technické univerzity v Novosibirsku




Horní