A matematikai statisztika elemei
4. Statisztikai jellemzõk megbízhatósága
4.1 Konfidencia tartomány, konfidencia szint
A mintákból meghatározott becslõk magukban is érdekesek lehetnek, különösen, ha minták összehasonlításáról van szó. Természetes azonban, hogy a jellemzõk akkor értékesek igazán, ha azok megbízhatóságáról is van képünk. Ez a kívánalom egyenértékü azzal, hogy többé kevésbé ismerjük a becslõ statisztikák eloszlását, de legalábbis alkalmazhatunk néhány valószínûségszámításból ismert egyenlõtlenséget. Emlékeztetünk arra, hogy a mintákból számított becslések valószínûségi változók függvényei lévén maguk is valószínûségi változók.
A gyakorlatban a kérdések általában így vetõdnek fel:
(a) mi a valószínûsége annak, hogy a valószínûségi változó egy realizációja (= a következõ megfigyelt adat) elõírt határok közé essék (pl a £ x £ b)?
(b) melyek azok a határok, amelyek közé a következõ megfigyelt adat elõírt valószínûséggel esik?
A két kérdés lényegében ugyanaz, egyik feladat a másik inverze. Az (a) kérdéssel egy-egy megfigyelést értékelünk, a (b) kérdéssel követelményeket fogalmazunk meg, pl. pontasságot írunk elõ.
Ha ismerjük a szóbanforgó valószínûségi változó eloszlásfüggvényét, mindkét kérdésre választ kaphatunk:
A továbbiakban az általánosság kedvéért folytonos valószínûségi változók esetére mutatjuk be a megoldások gondolatmenetét.(4.1)
Természettudományos gyakorlatunkban egyik leggyakoribb eloszlásfüggvény a normális eloszlás. Ha valamely vizsgált változóra számos, önmagában kis hatású, a változó értékét egyforma eséllyel növelõ vagy csökkentõ tényezõ is hat, számíthatunk arra, hogy megfigyelt értéke normális eloszlású lesz.
A (4.1) integrál ezesetben:
ahol m az x változó várható értéke, s pedig annak szórása. (4.2) függvénynek nincs analitikusan megadható integrálja, értékeit numerikusan számítják ki az(4.2)
standardizált, 0-közepû és 1 szórású változóra, -¥ és x határok között. (Ezt az eloszlást szokás N(0,1) röviditéssel jelölni). Miután a
függvény szimmetrikus, táblázatokban csak az eloszlás (második) felét adják meg, 0 és +¥ határok között, ahol a F (x) valószínûség 0.5.tõl 1-ig nõ.(4.3)
Negativ x argumentumok esetén a valószínûséget
(4.4)
(4.5)
Érdemes megjegyezni, hogy normális eloszlás esetén
|
illetve nem standardizált változóra:
|
Azt a tartományt amelybe a valószínûségi változó várhatóan p valószínûséggel esik, a változó p szintû megbízhatósági vagy konfidencia tartományának nevezik. A változó természetesen a = 1 - p valószínûséggel a konfidencia tartományon kívül is realizálódhat. Ezt az a értéket tévedési valószínûségnek szokás nevezni. A konfidencia tartományt gyakran a szintû tartománynak is nevezik.
A bevezetésben feltett (b) kérdés, azaz az, hogy
megkívánt, rendszerint kerek konfidencia szinthez milyen
± ks konfidencia határok tartoznak,
alkalmasan átrendezett táblázatokkal válaszolható
meg.
0.99 0.01 2.5758 0.95 0.05 1.9600 0.90 0.1 1.6449 0.70 0.3 1.0364 |
A normális eloszlás -és a továbbiakban tárgyalt
Student és c 2 eloszlások
számértékeit kézikönyvekben vagy pl. a
http://math.uc.edu/~brycw/148/tables.htm
internetcímen lehet megtalálni.
Ha egy normális eloszlású sokaságból vett minta sok elemû (n > 120), akkor a mintából számított s standard deviáció jól becsüli az elméleti szórást, s -t. Ha azonban nem ez a helyzet, a kevesebb elemû mintából becsült s standard deviációval szélesebb konfidencia tartományt kell megadnunk ahhoz, hogy biztonságunk megmaradjon.
A helyes összefüggéseket ezekben az esetekben a normális eloszlás helyett a Student eloszlás adja meg, amelynél a konfidencia tartományok szélességét megadó t szorzók a minta elemszámától, pontosabban a minta szabadsági fokától függenek.
A szintén szimmetrikus
Student eloszlás szintén táblázatoltan található. Leghasználatosabbak azok a táblázatok, amelyekkel az a tévedési valószínüséghez és a n szabadsági fokhoz tartozó konfidencia tartomány határai kereshetõk ki. (Minta. 4.1 táblázat)(4.6)
4.1 táblázat. Student eloszlás t értékei, különbözõ mérésszámnál
|
|
|||
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Mivel a valószínûségi változók négyzetei (pl. a szórás négyzete, a variancia ) gyakorlatunkban igen jelentõsek, fontos szerepû az a függvény, amelyik a független, külön-külön N(0,1) eloszlású változók
összegének eloszlását adja meg, a c2 eloszlásfüggvény:
ahol n a szabadsági fok, a független valószínûségi változók száma. A függvény láthatóan két változótól függõen adja meg azt, mi a valószínûsége annak, hogy a változók négyzetösszege x-nél kisebb.(4.7)
A normális és Student eloszlást sikeresen alkalmazzák normális változók különbségeinek vizsgálatára. Valószínûségi változók négyzetösszegei esetén hasznosabbnak bizonyult azok hányadosainak kritikus megítélése.
Erre a feladatra (nevezetesen annak eldöntésére,.hogy egyezõnek vagy eltérõnek tekinthetõ-e két változó négyzetösszege) az Fisher féle F eloszlás alkalmas. Ez a függvény két független, c 2 eloszlású változó hányadosának eloszlásáról tájékoztat. Az F függvény az
hányados adott határok közötti elõfordulási valószínûségét adja meg, ahol n1 és n2 a számláló és nevezõ szabadsági foka. F számlálójában és nevezõjében varianciákat ismerhetünk fel. Az F eloszlás 0 és +¥ között értelmezett. Ebbõl következõen az F törtben a számlálónak kell kisebbnek lennie.
A gyakorlatban használt F táblázatokban a választott
a
tévedési valószínûségnek, továbbá
a számláló és a nevezõ szabadsági
fokának ismeretében lehet megtalálni azt a kritikus
értéket, amelynél egyezõnek feltételezett
változók esetén a kisérletileg megkapott F
érték nem lehet nagyobb.
Tartalom | http://www.chemonet.hu/hun/eloado/stat/
http://www.kfki.hu/chemonet/hun/eloado/stat/ |