A matematikai statisztika elemei



4. Statisztikai jellemzõk megbízhatósága

4.1 Konfidencia tartomány, konfidencia szint

A mintákból meghatározott becslõk magukban is érdekesek lehetnek, különösen, ha minták összehasonlításáról van szó. Természetes azonban, hogy a jellemzõk akkor értékesek igazán, ha azok megbízhatóságáról is van képünk. Ez a kívánalom egyenértékü azzal, hogy többé kevésbé ismerjük a becslõ statisztikák eloszlását, de legalábbis alkalmazhatunk néhány valószínûségszámításból ismert egyenlõtlenséget. Emlékeztetünk arra, hogy a mintákból számított becslések valószínûségi változók függvényei lévén maguk is valószínûségi változók.

A gyakorlatban a kérdések általában így vetõdnek fel:

(a) mi a valószínûsége annak, hogy a valószínûségi változó egy realizációja (= a következõ megfigyelt adat) elõírt határok közé essék (pl a  £ x £  b)?

(b) melyek azok a határok, amelyek közé a következõ megfigyelt adat elõírt valószínûséggel esik?

A két kérdés lényegében ugyanaz, egyik feladat a másik inverze. Az (a) kérdéssel egy-egy megfigyelést értékelünk, a (b) kérdéssel követelményeket fogalmazunk meg, pl. pontasságot írunk elõ.

Ha ismerjük a szóbanforgó valószínûségi változó eloszlásfüggvényét, mindkét kérdésre választ kaphatunk:

                 (4.1)
A továbbiakban az általánosság kedvéért folytonos valószínûségi változók esetére mutatjuk be a megoldások gondolatmenetét.

4.2 Nevezetes eloszlások

Természettudományos gyakorlatunkban egyik leggyakoribb eloszlásfüggvény a normális eloszlás. Ha valamely vizsgált változóra számos, önmagában kis hatású, a változó értékét egyforma eséllyel növelõ vagy csökkentõ tényezõ is hat, számíthatunk arra, hogy megfigyelt értéke normális eloszlású lesz.

4.2.1 A normális eloszlás

A (4.1) integrál ezesetben:

             (4.2)
ahol m az x változó várható értéke, s pedig annak szórása. (4.2) függvénynek nincs analitikusan megadható integrálja, értékeit numerikusan számítják ki az

standardizált, 0-közepû és 1 szórású változóra, -¥ és x határok között. (Ezt az eloszlást szokás N(0,1) röviditéssel jelölni). Miután a

        (4.3)
függvény szimmetrikus, táblázatokban csak az eloszlás (második) felét adják meg, 0 és +¥ határok között, ahol a F (x) valószínûség 0.5.tõl 1-ig nõ.

Negativ x argumentumok esetén a valószínûséget

             (4.4)

módon kell keresni. Ha arra vagyunk kiváncsiak, mi annak valószínûsége, hogy x a -b és +b határok között lép fel, a táblázat b argumentumához tartozó érték kétszeresébõl ki kell vonnunk 1-et. Ugyanis:

                 (4.5)

Érdemes megjegyezni, hogy normális eloszlás esetén
 
 
 

p(-1 £ x £1 = 2F (1) - 1 = 0.6826
p(-2 £ x £ 2) = 2F (2) - 1 = 0.9545
p(-1.96 £ x £1.96 = 2F (1.96) - 1 = 0.9500
p(-3 £ x £ 3 = 2F (3) - 1  = 0.9973

illetve nem standardizált változóra:

p((m - s )£  x  £(m+s )) = 0.6826
p((m - 2s )£  x  £(m+ 2s ))  = 0.9545
p(m - 1.96£  x  £m + 1.96s = 0.9500
p((m - 3s )£  x  £(m+ 3s ))  = 0.9973
 

Azt a tartományt amelybe a valószínûségi változó várhatóan p valószínûséggel esik, a változó p szintû megbízhatósági vagy konfidencia tartományának nevezik. A változó természetesen a = 1 - p valószínûséggel a konfidencia tartományon kívül is realizálódhat. Ezt az a értéket tévedési valószínûségnek szokás nevezni. A konfidencia tartományt gyakran a szintû tartománynak is nevezik.

A bevezetésben feltett (b) kérdés, azaz az, hogy megkívánt, rendszerint kerek konfidencia szinthez milyen ± ks konfidencia határok tartoznak, alkalmasan átrendezett táblázatokkal válaszolható meg.
 

p         a = 1 - p         k

0.99         0.01         2.5758

0.95         0.05         1.9600

0.90           0.1         1.6449

0.70           0.3         1.0364

A normális eloszlás -és a továbbiakban tárgyalt Student és c 2 eloszlások számértékeit kézikönyvekben vagy pl. a http://math.uc.edu/~brycw/148/tables.htm internetcímen lehet megtalálni.
 

4.2.2 A Student eloszlás

Ha egy normális eloszlású sokaságból vett minta sok elemû (n > 120), akkor a mintából számított s standard deviáció jól becsüli az elméleti szórást, s -t. Ha azonban nem ez a helyzet, a kevesebb elemû mintából becsült s standard deviációval szélesebb konfidencia tartományt kell megadnunk ahhoz, hogy biztonságunk megmaradjon.

A helyes összefüggéseket ezekben az esetekben a normális eloszlás helyett a Student eloszlás adja meg, amelynél a konfidencia tartományok szélességét megadó t szorzók a minta elemszámától, pontosabban a minta szabadsági fokától függenek.

A szintén szimmetrikus

                     (4.6)
Student eloszlás szintén táblázatoltan található. Leghasználatosabbak azok a táblázatok, amelyekkel az a tévedési valószínüséghez és a n szabadsági fokhoz tartozó konfidencia tartomány határai kereshetõk ki. (Minta. 4.1 táblázat)
 
 

4.1 táblázat. Student eloszlás t értékei, különbözõ mérésszámnál

 
a = 1 - p
T
 
n = 3
n=15
n = ¥
0.99
0.01
9,925
2.977
2.5758
0.95
0.05
4.303
2.145
1.96
0.90
0.10
2.92
1.761
1.6449
0.70
0.30
1.386
1.076
1.0364

 

4.2.3 A c2 eloszlás

Mivel a valószínûségi változók négyzetei (pl. a szórás négyzete, a variancia ) gyakorlatunkban igen jelentõsek, fontos szerepû az a függvény, amelyik a független, külön-külön N(0,1) eloszlású változók

összegének eloszlását adja meg, a c2 eloszlásfüggvény:

             (4.7)
ahol n a szabadsági fok, a független valószínûségi változók száma. A függvény láthatóan két változótól függõen adja meg azt, mi a valószínûsége annak, hogy a változók négyzetösszege x-nél kisebb.
 

4.2.4 Az F eloszlás

A normális és Student eloszlást sikeresen alkalmazzák normális változók különbségeinek vizsgálatára. Valószínûségi változók négyzetösszegei esetén hasznosabbnak bizonyult azok hányadosainak kritikus megítélése.

Erre a feladatra (nevezetesen annak eldöntésére,.hogy egyezõnek vagy eltérõnek tekinthetõ-e két változó négyzetösszege) az Fisher féle F eloszlás alkalmas. Ez a függvény két független, c 2 eloszlású változó hányadosának eloszlásáról tájékoztat. Az F függvény az

                  (4.8)

hányados adott határok közötti elõfordulási valószínûségét adja meg, ahol n1 és n2 a számláló és nevezõ szabadsági foka. F számlálójában és nevezõjében varianciákat ismerhetünk fel. Az F eloszlás 0 és +¥ között értelmezett. Ebbõl következõen az F törtben a számlálónak kell kisebbnek lennie.

A gyakorlatban használt F táblázatokban a választott a tévedési valószínûségnek, továbbá a számláló és a nevezõ szabadsági fokának ismeretében lehet megtalálni azt a kritikus  értéket, amelynél egyezõnek feltételezett változók esetén a kisérletileg megkapott F érték nem lehet nagyobb.
 


Tartalom http://www.chemonet.hu/hun/eloado/stat/
http://www.kfki.hu/chemonet/hun/eloado/stat/